Gå till index

Första kursen: Forskningsmetoder och Analys med R

0% färdig
0/0 Steps
  1. Analys och forskning med R och Posit (Rstudio)
  2. Grunderna i R och Rstudio
    7 Ämnen
  3. Importera, exportera, spara och ladda data
    5 Ämnen
  4. Strängar och regular expressions (regex)
    1 Ämne
  5. Bearbetning av data med dplyr
    12 Ämnen
  6. Visualisera och presentera
    14 Ämnen
  7. Explorerande och deskriptiva analyser
    6 Ämnen
  8. Prediktionsmodeller
    12 Ämnen
  9. Klassisk regressionsanalys
    8 Ämnen
  10. Machine learning (ML) och Artificiell Intelligens (AI)
    9 Ämnen
  11. Skapa prediktionsmodeller med Tidymodels
    6 Ämnen
  12. Hypotestester och epidemiologiska mått
    5 Ämnen
Avsnitt Progress
0% färdig

Exportera data frames och matriser

Låt oss skapa en data frame manuellt. Den kommer att innehålla 3 variabler:

R
# En vektor med siffrorna 1 till 10
variable1 <- 1:10

# En vektor med 10 slumpmässigt genererade värden
variable2 <- rnorm(10)

# En vektor med 10 bokstäver
variable3 <- c("A", "B", "W", "C", "D", "E", "A", "B", "C", "D")

# Kombinera alla vektorer till en data frame
my_data_frame <- data.frame(variable1, variable2, variable3)

# Se vår data frame
my_data_frame
Resultat
   variable1  variable2 variable3
1          1  0.2236806         A
2          2  0.4051425         B
3          3  0.8862467         W
4          4  0.1505596         C
5          5  0.6452608         D
6          6  0.7148596         E
7          7  0.4315247         A
8          8  1.6137024         B
9          9 -0.3816980         C
10        10  0.2302253         D

Därefter skapar vi en ny variabel (variable4) som är produkten av variabel1 och variabel2:

R
my_data_frame$variable4 <- my_data_frame$variable1 * my_data_frame$variable2

# Se vår data frame
my_data_frame
R
   variable1  variable2 variable3  variable4
1          1  0.2236806         A  0.2236806
2          2  0.4051425         B  0.8102850
3          3  0.8862467         W  2.6587400
4          4  0.1505596         C  0.6022382
5          5  0.6452608         D  3.2263041
6          6  0.7148596         E  4.2891579
7          7  0.4315247         A  3.0206726
8          8  1.6137024         B 12.9096189
9          9 -0.3816980         C -3.4352823
10        10  0.2302253         D  2.3022534

Nu skall vi spara vår data frame genom att exportera den till en fil på hårddisken. Denna fil ska kunna användas av andra applikationer. För att exportera data frames och matriser från R finns olika funktioner. Vi rekommenderar att funktionerna i paketen haven och readr används för dessa uppgifter. Börja med att aktivera dessa paket:

R
library(readr)
library(readxl)
library(haven)

Ponera att vi har en data frame eller matris med objektnamnet mina_data som vi nu ska exportera från R till hårddisken. Här nedan följer kommandon för att exportera filen till de vanligaste filformaten (CSV, TSV, SAS, SPSS, STATA). Den exporterade filen kommer vi namne exporterade_data.




BLOCKERAD KOD, BILD ELLER TEXT


Du måste logga in för att komma åt allt material.


Dessa funktioner ha många fler argument än redovisat i koden ovan. Dessutom demonstrerades inte funktionen write_delim() som används när du själv vill specificera avgränsaren (med argumentet delim). Bland de viktigare argumenten i dessa funktioner är argumentet na=, där man kan specificera vilket tecken (om något) som skall indikera missing data (NA). Detta sätts som regel till NA om du inte anger något annat. Ett annat viktigt argument är row.names=, där du kan ange TRUE eller FALSE för att specificera om du vill att dataframens radnamn skall skrivas ut som en kolumn i den exporterade filen.

Var sparas filerna?

I samtliga ovanstående exempel sparas filerna i din working directory, såvida du inte anger en fullständig sökväg dit filen skall exporteras. Här följer ett exempel där filerna exporteras till skrivbordet istället för working directory:

R
write_csv(data=mina_data, path='/Users/Adam/Desktop/exporterade_data.csv')