Analys och forskning med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Dplyr rename(): Namnge kolumer
Funktionerna rename()
och rename_with()
används för att ändra namnet på variabler. Med rename()
ändras namn på enskilda variabler och rename_with()
ändras namnen med hjälp av funktioner. Dessa funktioner påverkar endast namnet på kolumner (variabler). Ordningen på kolumnerna påverkas inte.
I detta kapitel arbetar vi med data som vi generar direkt i R, med följande kommando:
my_data <- tibble(Var1 = c(NA, 5, 9, 5, 3, 4),
Var2 = c(1, NA, 3, 6, 1, 12),
Var3 = c("Ja", "Nej", NA, "Ja", "Ja", "Ja"),
Var4 = rnorm(6), # genererar 6 slumpvärden med normalfördelning
Var5 = letters[1:6]) # första 6 bokstäverna i alfabetet
my_data
Var1 Var2 Var3 Var4 Var5
NA 1 Ja -1.13 a
5 NA Nej -0.144 b
9 3 NA -0.114 c
5 6 Ja -0.343 d
3 1 Ja -1.08 e
4 12 Ja 0.914 f
Vi döper om Var1
och Var2
till Variabel
1 respektive Variabel2
. Notera att det nya variabelnamnet specificeras först, följt av likhetstecken och det gamla variabelnamnet.
my_data |>
rename(Variabel1=Var1,
Variabel2=Var2)
Variabel1 Variabel2 Var3 Var4 Var5
NA 1 Ja -1.13 a
5 NA Nej -0.144 b
9 3 NA -0.114 c
5 6 Ja -0.343 d
3 1 Ja -1.08 e
4 12 Ja 0.914 f
Med rename_with()
kan vi tillämpa en funktion på variabelnamnen. I nästa exempel ger vi alla variabelnamn versaler med funktionen toupper()
:
my_data |>
rename_with(toupper)
VAR1 VAR2 VAR3 VAR4 VAR5
NA 1 Ja -1.13 a
5 NA Nej -0.144 b
9 3 NA -0.114 c
5 6 Ja -0.343 d
3 1 Ja -1.08 e
4 12 Ja 0.914 f
Med tolower()
gör du om namnen till gemener istället.
Du kan rikta rename_with()
mot specifika kolumner med hjälp av tidy-select. I nästa exempel konverterar vi alla variabelnamn till versaler om variabelnamnet innehåller siffran 4:
my_data |>
rename_with(toupper, contains("4"))
Var1 Var2 Var3 VAR4 Var5
NA 1 Ja -1.13 a
5 NA Nej -0.144 b
9 3 NA -0.114 c
5 6 Ja -0.343 d
3 1 Ja -1.08 e
4 12 Ja 0.914 f
De andra tidy-select funktionerna diskuterades i kapitlet dplyr select().
Ändra variabelnamn med baser R
Det finns många användbara funktioner i baser R för att ändra variabelnamn. Varje dataframe har ett attribut kallat colnames, som innehåller variabelnamnen. Du kan skriva ut colnames med följande kommando:
colnames(my_data)
"Var1" "Var2" "Var3" "Var4" "Var5"
Det innebär att variabelnamnen skrivs ut som en textvektor, vilken vi kan manipulera efter tycke och smak. Vi kan exempelvis lägga till prefixet "ny_" på varje variabelnamn, med följande kommando:
# Följande exempel är identiska
colnames(my_data) <- paste0("ny_", colnames(my_data))
my_data
ny_Var1 ny_Var2 ny_Var3 ny_Var4 ny_Var5
NA 1 Ja -0.573 a
5 NA Nej -0.471 b
9 3 NA -0.139 c
5 6 Ja 0.0464 d
3 1 Ja 1.07 e
4 12 Ja -1.85 f
Vi kan ersätta en textsträng i alla variabelnamn. Här ersätter vi "Var" med "Variabel_":
colnames(my_data) <- str_replace(names(my_data), "Var", "Variabel_")
my_data
Variabel_1 Variabel_2 Variabel_3 Variabel_4 Variabel_5
NA 1 Ja 0.598 a
5 NA Nej -0.348 b
9 3 NA 1.09 c
5 6 Ja -0.237 d
3 1 Ja 1.08 e
4 12 Ja -1.74 f