Gå till index

Analys med R

0% färdig
0/0 Steps
  1. Analys och forskning med R och Posit (Rstudio)
  2. Grunderna i R och Rstudio
    7 Ämnen
  3. Importera, exportera, spara och ladda data
    5 Ämnen
  4. Strängar och regular expressions (regex)
    1 Ämne
  5. Bearbetning av data med dplyr
    12 Ämnen
  6. Visualisera och presentera
    14 Ämnen
  7. Explorerande analyser
    6 Ämnen
  8. Prediktionsmodeller
    12 Ämnen
  9. Klassisk regressionsanalys
    8 Ämnen
  10. Machine learning (ML) och Artificiell Intelligens (AI)
    9 Ämnen
  11. Prediktionsmodeller: Tidymodels
  12. Hypotestester
    1 Ämne
Avsnitt 3, Ämne 4
Startad

Exportera data frames och matriser

Avsnitt Progress
0% färdig

Exportera data frames och matriser

Låt oss skapa en data frame manuellt. Den kommer att innehålla 3 variabler:

R
# En vektor med siffrorna 1 till 10
variable1 <- 1:10

# En vektor med 10 slumpmässigt genererade värden
variable2 <- rnorm(10)

# En vektor med 10 bokstäver
variable3 <- c("A", "B", "W", "C", "D", "E", "A", "B", "C", "D")

# Kombinera alla vektorer till en data frame
my_data_frame <- data.frame(variable1, variable2, variable3)

# Se vår data frame
my_data_frame
Resultat
   variable1  variable2 variable3
1          1  0.2236806         A
2          2  0.4051425         B
3          3  0.8862467         W
4          4  0.1505596         C
5          5  0.6452608         D
6          6  0.7148596         E
7          7  0.4315247         A
8          8  1.6137024         B
9          9 -0.3816980         C
10        10  0.2302253         D

Därefter skapar vi en ny variabel (variable4) som är produkten av variabel1 och variabel2:

R
my_data_frame$variable4 <- my_data_frame$variable1 * my_data_frame$variable2

# Se vår data frame
my_data_frame
R
   variable1  variable2 variable3  variable4
1          1  0.2236806         A  0.2236806
2          2  0.4051425         B  0.8102850
3          3  0.8862467         W  2.6587400
4          4  0.1505596         C  0.6022382
5          5  0.6452608         D  3.2263041
6          6  0.7148596         E  4.2891579
7          7  0.4315247         A  3.0206726
8          8  1.6137024         B 12.9096189
9          9 -0.3816980         C -3.4352823
10        10  0.2302253         D  2.3022534

Nu skall vi spara vår data frame genom att exportera den till en fil på hårddisken. Denna fil ska kunna användas av andra applikationer. För att exportera data frames och matriser från R finns olika funktioner. Vi rekommenderar att funktionerna i paketen haven och readr används för dessa uppgifter. Börja med att aktivera dessa paket:

R
library(readr)
library(readxl)
library(haven)

Ponera att vi har en data frame eller matris med objektnamnet mina_data som vi nu ska exportera från R till hårddisken. Här nedan följer kommandon för att exportera filen till de vanligaste filformaten (CSV, TSV, SAS, SPSS, STATA). Den exporterade filen kommer vi namne exporterade_data.

R
# Exportera till SAS
write_sas(data=mina_data, path='exporterade_data.sas7bdat')

# Exportera till SAS XPT
write_xpt(data=mina_data, path='exporterade_data.sas7bdat', version = 8, name = NULL)

# Exportera till STATA
write_dta(data=mina_data, path='exporterade_data.sas7bdat', version = 14)

# Exportera till SPSS
write_sav(data=mina_data, path='exporterade_data.sas7bdat', compress = FALSE)

# Exportera till en CSV-fil med kommatecken (,) som separator
write_csv(x=mina_data, file='exporterade_data.csv')

# Exportera till en CSV-fil med semikolon (;) som separator
write_csv2(x=mina_data, file='exporterade_data.csv')

# Exportera till en CSV-fil anpassad för Excel, med kommatecken (,) som separator
write_excel_csv(x=mina_data, file='exporterade_data.csv')

# Exportera till en CSV-fil anpassad för Excel, med semikolon (;) som separator
write_excel_csv2(x=mina_data, file='exporterade_data.csv')

# Exportera till en TSV-fil (tabseparerad fil)
write_tsv(x=mina_data, file='exporterade_data.csv')

Dessa funktioner ha många fler argument än redovisat i koden ovan. Dessutom demonstrerades inte funktionen write_delim() som används när du själv vill specificera avgränsaren (med argumentet delim). Bland de viktigare argumenten i dessa funktioner är argumentet na=, där man kan specificera vilket tecken (om något) som skall indikera missing data (NA). Detta sätts som regel till NA om du inte anger något annat. Ett annat viktigt argument är row.names=, där du kan ange TRUE eller FALSE för att specificera om du vill att dataframens radnamn skall skrivas ut som en kolumn i den exporterade filen.

Var sparas filerna?

I samtliga ovanstående exempel sparas filerna i din working directory, såvida du inte anger en fullständig sökväg dit filen skall exporteras. Här följer ett exempel där filerna exporteras till skrivbordet istället för working directory:

R
write_csv(data=mina_data, path='/Users/Adam/Desktop/exporterade_data.csv')