Första kursen: Forskningsmetoder och Analys med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Att visualisera data
Visualiseringar
Att visualisera data innebär att man skapar grafer, figurer och andra illustrationer som underlättar förståelse och tolkning av data. Att skapa visualiseringar är enkelt och roligt. Man kan börja lära sig R genom att lära sig att visualisera data. Visualisering av data intar en central roll all analys och forskning. Även om många visuella presentationer (exempelvis grafer) kan ersättas med numeriska presentationer (exempelvis tabeller) så är den visuella presentationen fundamental. Visuella presentationer är ofta slagkraftigare och tydligare än numeriska presentationer. En bra illustration kan vara avgörande för en rapport.
Följande principer bör användas för visualisering av data:
- Visualisera inte med applikationer som Excel eller SPSS; använd ett programmeringsspråk.
- R och Python är de mest potenta språken för visualiseringar.
- Skapa komplett kod från början, så att manuella justeringar av grafen inte krävs för att färdigställa den.
Visualisera med ggplot2
Kärnan i majoriteten av alla visualiseringar i R är paketet ggplot2
. Detta paket är exceptionellt kraftfullt och enkelt att lära sig. Till ggplot2 finns numera en lång rad tilläggspaket som utökar funktionalitet i ggplot2 för att skapa mer komplexa grafer, interaktiva grafer och för att underlätta framtagandet av standardgrafer.
Med ggplot2 deklareras innehållet i en graf sekventiellt. Principen för detta är som följer:
I detta kapitel kommer vi lära oss använda ggplot2. Efterkommande kapitel ombesörjer viktiga tilläggspaket.