Första kursen: Forskningsmetoder och Analys med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Exportera data frames och matriser
Exportera data frames och matriser
Låt oss skapa en data frame manuellt. Den kommer att innehålla 3 variabler:
# En vektor med siffrorna 1 till 10
variable1 <- 1:10
# En vektor med 10 slumpmässigt genererade värden
variable2 <- rnorm(10)
# En vektor med 10 bokstäver
variable3 <- c("A", "B", "W", "C", "D", "E", "A", "B", "C", "D")
# Kombinera alla vektorer till en data frame
my_data_frame <- data.frame(variable1, variable2, variable3)
# Se vår data frame
my_data_frame
variable1 variable2 variable3
1 1 0.2236806 A
2 2 0.4051425 B
3 3 0.8862467 W
4 4 0.1505596 C
5 5 0.6452608 D
6 6 0.7148596 E
7 7 0.4315247 A
8 8 1.6137024 B
9 9 -0.3816980 C
10 10 0.2302253 D
Därefter skapar vi en ny variabel (variable4
) som är produkten av variabel1
och variabel2
:
my_data_frame$variable4 <- my_data_frame$variable1 * my_data_frame$variable2
# Se vår data frame
my_data_frame
variable1 variable2 variable3 variable4
1 1 0.2236806 A 0.2236806
2 2 0.4051425 B 0.8102850
3 3 0.8862467 W 2.6587400
4 4 0.1505596 C 0.6022382
5 5 0.6452608 D 3.2263041
6 6 0.7148596 E 4.2891579
7 7 0.4315247 A 3.0206726
8 8 1.6137024 B 12.9096189
9 9 -0.3816980 C -3.4352823
10 10 0.2302253 D 2.3022534
Nu skall vi spara vår data frame genom att exportera den till en fil på hårddisken. Denna fil ska kunna användas av andra applikationer. För att exportera data frames och matriser från R finns olika funktioner. Vi rekommenderar att funktionerna i paketen haven
och readr
används för dessa uppgifter. Börja med att aktivera dessa paket:
library(readr)
library(readxl)
library(haven)
Ponera att vi har en data frame eller matris med objektnamnet mina_data
som vi nu ska exportera från R till hårddisken. Här nedan följer kommandon för att exportera filen till de vanligaste filformaten (CSV, TSV, SAS, SPSS, STATA). Den exporterade filen kommer vi namne exporterade_data
.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
Dessa funktioner ha många fler argument än redovisat i koden ovan. Dessutom demonstrerades inte funktionen write_delim() som används när du själv vill specificera avgränsaren (med argumentet delim). Bland de viktigare argumenten i dessa funktioner är argumentet na=, där man kan specificera vilket tecken (om något) som skall indikera missing data (NA). Detta sätts som regel till NA om du inte anger något annat. Ett annat viktigt argument är row.names=, där du kan ange TRUE eller FALSE för att specificera om du vill att dataframens radnamn skall skrivas ut som en kolumn i den exporterade filen.
Var sparas filerna?
I samtliga ovanstående exempel sparas filerna i din working directory, såvida du inte anger en fullständig sökväg dit filen skall exporteras. Här följer ett exempel där filerna exporteras till skrivbordet istället för working directory:
write_csv(data=mina_data, path='/Users/Adam/Desktop/exporterade_data.csv')