Första kursen: Forskningsmetoder och Analys med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Introduktion till ggplot2
Paketet ggplot2 är numera en del av tidyverse. För att ladda ggplot2 kan du ladda tidyverse. I tidyverse finns 7 viktiga paket som behövs för analys och presentation av data. Dessa paket är ggplot2, dplyr, forcats, tibble, tidyr, stringr och purrr. Paketen dplyr och ggplot2 används regelbundet tillsammans. Börja med att installera och aktivera tidyverse:
install.packages("tidyverse")
library(tidyverse)I både dplyr och ggplot2 kopplas operationerna sekventiellt. I dplyr kopplas operationer med pipe-operatorn, som betecknas med |> (tidigare användes %>%). Pipe används för att stegvis instruera R vad som skall göras. Nedan följer ett exempel där |> används för att filtera en data frame (mina_data) så att den bara innehåller kvinnor, och därefter skapas en variabel (Income_Dollar) och slutligen sorteras observationerna efter variabeln Age. Koden nedan är endast av illustrativt syfte (data existerar inte och koden kan inte köras).
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
I ggplot2 kopplas också operationer sekventiellt men detta görs med +. Nedan används mina_data för att skapa en graf där Income_Dollar och Age visualiseras på x-axeln och y-axeln med hjälp av punkter. Slutligen får grafen titeln "Min graf".
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
Kom ihåg att pipe (|>) skickar vidare resultatet av en operationen till nästa operation. Det innebär att du kan kombinera dplyr med ggplot. Detta är användbart för att skapa grafer i samma seans som databearbetning sker. Hör följer ett kodexempel där bearbetning av data kopplas till visualiseringen:
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
Notera att vi (ovan) inte definierade data=mina_data i ggplot()-funktionen. Det behövs inte eftersom pipe (|>) skickar vidare resultatet av alla föregående operationer som första argument till ggplot() och första argumentet är data=.
Detta kommer bli tydligare i kommande kapitel där vi skapar grafer stegvis.