Gå till index
Första kursen: Forskningsmetoder och Analys med R
0% färdig
0/0 Steps
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Avsnitt 5,
Ämne 3
Startad
Dplyr select(): Selektera kolumner (variabler)
Avsnitt Progress
0% färdig
Funktionen select()
används för att välja (selektera) variabler (kolumner) i en dataframe. Funktionen kan selektera variabler baserat på namn, index, egenskaper eller mer avancerade funktioner. Med select()
kan namn på variabler ändras i samband med att de selekteras. Funktionen används tillsammans med en rad andra funktioner och operander för att göra effektiva selektioner. Följande tabell redovisar vilka funktioner och operander som kan användas tillsammans med select()
.
Funktion | Effekt | Exempel |
---|---|---|
, | Selektera flera variabler | select(var1, var2, var3, var4) |
: | Selekterar ett intervall med variabler | select(var1:var4) |
c() | Selektera en vektor med variabler | select(c(var1, var2, var3, var4)) Ekvivalent med att använda , |
| | Selektera endera variabel | select(var1 | var4) |
! | Ta bort variabler. Använd hellre - (se nedan). | select(!var1, !var2) |
- | Ta bort variabler | select(-var1, -var2) |
-c() | Ta bort flera variabler | select(-c(var1, var2)) |
starts_with() | Selektera variabler som börjar med ett prefix | se nedan |
ends_with() | Selektera variabler som slutar med ett suffix | se nedan |
contains() | Selektera variabler som innehåller en sträng | se nedan |
matches() | Selektera variabler som matchar ett regular expression (regex) | se nedan |
num_range() | Selektera variabler som matchar ett numeriskt intervall | se nedan |
last_col() | Selektera sista kolumnen | select(last_col()) |
everything() | Selektera alla kolumner | select(everything()) |
all_of() | Selektera variabler från en character vector. Alla variabler i vektorn skall finnas. | se nedan |
any_of() | Selektera variabler från en character vector. Alla variabler i vektorn behöver inte finnas. | se nedan |
Exempel på select()
Nedan följer flera exempel på hur select()
används. Se kommentarerna för förklaringar.
R
data(mpg)
# Behåll variablerna model, displ, cyl, class.
mpg |> select(model, displ, cyl, class)
# Behåll variablerna trans till fl (inklusive alla där emellan)
mpg |> select(trans:fl)
# Behåll alla variabler förutom trans till fl
mpg |> select(!(trans:fl)) # raderar alla variabler mellan trans och fl
# Behåll variabler som börjar med "man"
mpg |> select(starts_with("man"))
# Behåll variabler som börjar med "manu" och slutar med "l"
mpg |> select(starts_with("manu") & ends_with("l"))
# Behåll inte variabler som börjar med "man"
mpg |> select(-starts_with("man"))
# Behåll class eller trans, om de finns
mpg |> select(class | trans)
# Eliminera displ och cyl med två olika metoder
mpg |> select(-displ, -cyl)
mpg |> select(-c(displ,cyl))