Gå till index

Analys och forskning med R

0% färdig
0/0 Steps
  1. Analys och forskning med R och Posit (Rstudio)
  2. Grunderna i R och Rstudio
    7 Ämnen
  3. Importera, exportera, spara och ladda data
    5 Ämnen
  4. Strängar och regular expressions (regex)
    1 Ämne
  5. Bearbetning av data med dplyr
    12 Ämnen
  6. Visualisera och presentera
    14 Ämnen
  7. Explorerande och deskriptiva analyser
    6 Ämnen
  8. Prediktionsmodeller
    12 Ämnen
  9. Klassisk regressionsanalys
    8 Ämnen
  10. Machine learning (ML) och Artificiell Intelligens (AI)
    9 Ämnen
  11. Skapa prediktionsmodeller med Tidymodels
    6 Ämnen
  12. Hypotestester och epidemiologiska mått
    5 Ämnen
Avsnitt 5, Ämne 3

Dplyr select(): Selektera kolumner (variabler)

Avsnitt Progress
0% färdig

Funktionen select() används för att välja (selektera) variabler (kolumner) i en dataframe. Funktionen kan selektera variabler baserat på namn, index, egenskaper eller mer avancerade funktioner. Med select() kan namn på variabler ändras i samband med att de selekteras. Funktionen används tillsammans med en rad andra funktioner och operander för att göra effektiva selektioner. Följande tabell redovisar vilka funktioner och operander som kan användas tillsammans med select().

FunktionEffektExempel
,Selektera flera variablerselect(var1, var2, var3, var4)
:Selekterar ett intervall med variablerselect(var1:var4)
c()Selektera en vektor med variablerselect(c(var1, var2, var3, var4))
Ekvivalent med att använda ,
|Selektera endera variabelselect(var1 | var4)
!Ta bort variabler. Använd hellre - (se nedan).select(!var1, !var2)
-Ta bort variablerselect(-var1, -var2)
-c()Ta bort flera variablerselect(-c(var1, var2))
starts_with()Selektera variabler som börjar med ett prefixse nedan
ends_with()Selektera variabler som slutar med ett suffixse nedan
contains()Selektera variabler som innehåller en strängse nedan
matches()Selektera variabler som matchar ett regular expression (regex)se nedan
num_range()Selektera variabler som matchar ett numeriskt intervallse nedan
last_col()Selektera sista kolumnenselect(last_col())
everything()Selektera alla kolumnerselect(everything())
all_of()Selektera variabler från en character vector.
Alla variabler i vektorn skall finnas.
se nedan
any_of()Selektera variabler från en character vector.
Alla variabler i vektorn behöver inte finnas.
se nedan

Exempel på select()

Nedan följer flera exempel på hur select() används. Se kommentarerna för förklaringar.

R
data(mpg)

# Behåll variablerna model, displ, cyl, class.
mpg |> select(model, displ, cyl, class)

# Behåll variablerna trans till fl (inklusive alla där emellan)
mpg |> select(trans:fl)

# Behåll alla variabler förutom trans till fl
mpg |> select(!(trans:fl)) # raderar alla variabler mellan trans och fl

# Behåll variabler som börjar med "man"
mpg |> select(starts_with("man"))

# Behåll variabler som börjar med "manu" och slutar med "l"
mpg |> select(starts_with("manu") & ends_with("l"))

# Behåll inte variabler som börjar med "man"
mpg |>  select(-starts_with("man"))

# Behåll class eller trans, om de finns
mpg |> select(class | trans)

# elminera displ och cyl med två olika metoder
mpg |> select(-displ, -cyl)
mpg |> select(-c(displ,cyl))

Logga in för att läsa

Som medlem har du tillgång till allt nuvarande och kommande utbildningsmaterial. Du kan följa din utveckling och få intyg på avklarade moment.