Gå till index

Lilla Forskarskolan: Forskningsmetoder och Analys med R

0% färdig
0/0 Steps
  1. Analys och forskning med R och Posit (Rstudio)
  2. Grunderna i R och Rstudio
    7 Ämnen
  3. Importera, exportera, spara och ladda data
    5 Ämnen
  4. Strängar och regular expressions (regex)
    1 Ämne
  5. Bearbetning av data med dplyr
    12 Ämnen
  6. Visualisera och presentera
    14 Ämnen
  7. Explorerande och deskriptiva analyser
    6 Ämnen
  8. Prediktionsmodeller
    12 Ämnen
  9. Klassisk regressionsanalys
    8 Ämnen
  10. Machine learning (ML) och Artificiell Intelligens (AI)
    9 Ämnen
  11. Skapa prediktionsmodeller med Tidymodels
    6 Ämnen
  12. Hypotestester och epidemiologiska mått
    5 Ämnen
Avsnitt Progress
0% färdig

Funktionen row_number() är enkel att använda. Den skapar en numerisk stigande sekvens för raderna i en data frame. Funktionen används ofta tillsammans med mutate() för att skapa en numerisk sekvens.

I detta kapitel kommer vi demonstrera funktionerna med hjälp av data som vi själva genererar direkt i R med funktionen tibble():

R
my_data <- tibble(Namn = c("Per", "Per", "Per", "Eva", "Eva", "Zara", "Aziz", "Aziz","Aziz"),
                  Diagnos = c("I", "I", "C", "C", "D", "D", "D", "E", "E"))
my_data
R
 Namn  Diagnos
 Per   I      
 Per   I      
 Per   C      
 Eva   C      
 Eva   D      
 Zara  D      
 Aziz  D      
 Aziz  E      
 Aziz  E      

Nu skapar vi variabeln ID_nummer som är en numerisk sekvens längs hela dataframen:

R
my_data |> 
  mutate(ID_Nummer = row_number())
R
 Namn  Diagnos ID_Nummer
 Per   I               1
 Per   I               2
 Per   C               3
 Eva   C               4
 Eva   D               5
 Zara  D               6
 Aziz  D               7
 Aziz  E               8
 Aziz  E               9

Vi skapar ånyo en numerisk sekvens men nu grupperad på Namn:

R
 Namn  Diagnos ID_Nummer
 Per   I               1
 Per   I               2
 Per   C               3
 Eva   C               1
 Eva   D               2
 Zara  D               1
 Aziz  D               1
 Aziz  E               2
 Aziz  E               3

Notera ovan att den numeriska sekvensen är separat för varje namn. Vi kan addera ytterligare grupperingsvariabel, vilket vi gör genom att lägga till Diagnos som grupp:

R
my_data |> 
  group_by(Namn, Diagnos) |> 
  mutate(ID_Nummer = row_number())
R
 Namn  Diagnos ID_Nummer
 Per   I               1
 Per   I               2
 Per   C               1
 Eva   C               1
 Eva   D               1
 Zara  D               1
 Aziz  D               1
 Aziz  E               1
 Aziz  E               2

Notera att radnumreringen är separat för varje Diagnos inom varje Namn.