Första kursen: Forskningsmetoder och Analys med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Introduktion till ggplot2
Paketet ggplot2
är numera en del av tidyverse
. För att ladda ggplot2
kan du ladda tidyverse
. I tidyverse finns 7 viktiga paket som behövs för analys och presentation av data. Dessa paket är ggplot2
, dplyr
, forcats
, tibble
, tidyr
, stringr
och purrr
. Paketen dplyr
och ggplot2
används regelbundet tillsammans. Börja med att installera och aktivera tidyverse
:
install.packages("tidyverse")
library(tidyverse)
I både dplyr
och ggplot2
kopplas operationerna sekventiellt. I dplyr
kopplas operationer med pipe-operatorn, som betecknas med |>
(tidigare användes %>%
). Pipe används för att stegvis instruera R vad som skall göras. Nedan följer ett exempel där |>
används för att filtera en data frame (mina_data
) så att den bara innehåller kvinnor, och därefter skapas en variabel (Income_Dollar
) och slutligen sorteras observationerna efter variabeln Age
. Koden nedan är endast av illustrativt syfte (data existerar inte och koden kan inte köras).
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
I ggplot2
kopplas också operationer sekventiellt men detta görs med +
. Nedan används mina_data
för att skapa en graf där Income_Dollar
och Age
visualiseras på x-axeln och y-axeln med hjälp av punkter. Slutligen får grafen titeln "Min graf".
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
Kom ihåg att pipe (|>
) skickar vidare resultatet av en operationen till nästa operation. Det innebär att du kan kombinera dplyr
med ggplot
. Detta är användbart för att skapa grafer i samma seans som databearbetning sker. Hör följer ett kodexempel där bearbetning av data kopplas till visualiseringen:
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
Notera att vi (ovan) inte definierade data=mina_data
i ggplot()
-funktionen. Det behövs inte eftersom pipe (|>
) skickar vidare resultatet av alla föregående operationer som första argument till ggplot()
och första argumentet är data=
.
Detta kommer bli tydligare i kommande kapitel där vi skapar grafer stegvis.