Gå till index
Första kursen: Forskningsmetoder och Analys med R
0% färdig
0/0 Steps
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Avsnitt 5,
Ämne 10
Startad
Dplyr row_number(): Numrering av rader
Avsnitt Progress
0% färdig
Funktionen row_number()
är enkel att använda. Den skapar en numerisk stigande sekvens för raderna i en data frame. Funktionen används ofta tillsammans med mutate()
för att skapa en numerisk sekvens.
I detta kapitel kommer vi demonstrera funktionerna med hjälp av data som vi själva genererar direkt i R med funktionen tibble()
:
R
my_data <- tibble(Namn = c("Per", "Per", "Per", "Eva", "Eva", "Zara", "Aziz", "Aziz","Aziz"),
Diagnos = c("I", "I", "C", "C", "D", "D", "D", "E", "E"))
my_data
R
Namn Diagnos
Per I
Per I
Per C
Eva C
Eva D
Zara D
Aziz D
Aziz E
Aziz E
Nu skapar vi variabeln ID_nummer
som är en numerisk sekvens längs hela dataframen:
R
my_data |>
mutate(ID_Nummer = row_number())
R
Namn Diagnos ID_Nummer
Per I 1
Per I 2
Per C 3
Eva C 4
Eva D 5
Zara D 6
Aziz D 7
Aziz E 8
Aziz E 9
Vi skapar ånyo en numerisk sekvens men nu grupperad på Namn
:
R
Namn Diagnos ID_Nummer
Per I 1
Per I 2
Per C 3
Eva C 1
Eva D 2
Zara D 1
Aziz D 1
Aziz E 2
Aziz E 3
Notera ovan att den numeriska sekvensen är separat för varje namn. Vi kan addera ytterligare grupperingsvariabel, vilket vi gör genom att lägga till Diagnos
som grupp:
R
my_data |>
group_by(Namn, Diagnos) |>
mutate(ID_Nummer = row_number())
R
Namn Diagnos ID_Nummer
Per I 1
Per I 2
Per C 1
Eva C 1
Eva D 1
Zara D 1
Aziz D 1
Aziz E 1
Aziz E 2
Notera att radnumreringen är separat för varje Diagnos
inom varje Namn
.