Deskriptiva analyser i R
Kodexempel i R
Testa göra deskriptiva analyser i R genom att kopiera nedanstående kod till R Studio. Grön text är kommentarer.
Inledande exempel med R's basfunktioner
# str redovisar strukturen i ett objekt str(mtcars) # head visar de första raderna i en tabell. Argumentet n anger hur många rader som skall visas head(mtcars, n=20) # tail visar de sista raderna i en tabell tail(mtcars) # För att se själva tabellen använder man View View(mtcars) # Medelvärde, standard deviation, median och interkvartilavstånd mean(mtcars$mpg) sd(mtcars$mpg) median(mtcars$mpg) IQR(mtcars$mpg) # summary är en enkel funktion som ger en sammanfattning av alla variabler summary(mtcars) # Histogram och boxplot för variabeln wt som finns i tabellen mtcars hist(mtcars$wt) boxplot(mtcars$wt)
Exempel med paketet mlbench
# Installera paketet install.packages("mlbench") # Aktivera paketet library(mlbench) # Ladda tabellen "PimaIndiansDiabetes" data("PimaIndiansDiabetes") # Skapa en kopia av tabellen. Kopian kallas "pid" pid <- PimaIndiansDiabetes head(pid) View(pid) # "names" redovisar alla variabler som finns i filen names(pid) mean(pid$glucose) sd(pid$glucose)
Exempel med paketet psych
install.packages("psych") library(psych) describe(pid) # "class" redovisar datatyp. Här undersöks variabeln diabetes, för att undersöka vilken typ av variabel den är class(pid$diabetes) # "class" kan även redovisa vilken typ av objekt det är class(pid) str(pid) # "sapply" genomför en operation på samtliga kolumner i en tabell. Här undersöks vilken klass kolumnerna i "pid" sapply(pid, class)
Skapa baseline-tabell (baslinje)
Den här tabellen ingår i de allra flesta kliniska studier. Den används för att beskriva studiepopulationen, varesig det rör sig om celler, bakterier eller människor.
# Installera och aktivera paketet install.packages("tableone") library(tableone) # Ange vilka variabler du vill ha med i baslinjen variabler <- c("age", "sex", "ascites", "hepato", "spiders", "edema", "bili", "chol", "albumin", "stage") # Ange vilka av dessa variabler som är faktorer faktorer <- c("stage", "trt") # Skapa tabellen (här används data från tabellen "pbc") baselinetab <- CreateTableOne(vars = variabler, factorVars = faktorer, data=pbc) # Se tabellen View(print(baselinetab)) # Gör om samma tabell, fast nu uppdelad på män och kvinnor med "strata" funktionen min_tabell_2 <- CreateTableOne(vars = variabler, factorVars = faktorer, strata="sex", data=pbc) # Skriv tabellen till CSV-fil, som kan öppnas i excel, och därifrån kopieras till Word eller annan ordbehandlare write.csv2(baselinetab2, file="/Users/Thomas/Desktop/Mintabell.csv")
Vi rekommenderar även paketet "moonBook" för att skapa baseline och liknande tabeller.
Exempel med paketet sjPlot
Detta paketet är mer grafiskt än föregående.
install.packages("sjPlot") library(sjPlot) # Korstabell mellan "stage" och "sex" sjp.xtab(pbc$stage, pbc$sex) # Frekvenstabell sjp.frq(pbc$age, type = "box") # Scatterplot sjp.scatter(pbc$age, pbc$albumin) sjp.scatter(pbc$age, pbc$albumin, pbc$trt, show.rug = TRUE) sjp.scatter(pbc$age, pbc$albumin, pbc$trt, fit.line.grps = TRUE)