Analys och forskning med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Osäkerhet (Uncertainty)
Forskare som inte är skolade i matematiska discipliner är som regel ovana vid betydelsen av slump och osäkerhet. Dessa två fenomen intar en särställning i all forskning och analys. Att förstå slump, osäkerhet och kausalitet (orsakssamband) är fundamentalt för den som vill förstå händelser i ett system (t ex människokroppen).
Ett deterministiskt system är ett system där processer kan förutsägas med hög precision. Systemet kan vara biologiskt, fysiskt, ekonomiskt eller kemiskt. Många processer som vi vid första anblick uppfattar som slumpmässiga är faktiskt deterministiska. Kast med tärning är ett sådant exempel. Det är möjligt att med hög precision förutsäga vilken siffra tärningen visar om man har information om tärningens rörelsriktning och hastighet i det ögonblicket den kastas. För att kunna analysera data och förstå händelser i ett system måste vi känna till vilka mekanismer som påverkar systemet.
All models are wrong. Some are useful.
John Tukey
Detta problem är uppenbart inom medicinsk forskning. Den som granskar kliniska prediktionsmodeller vet att även de mest avancerade och använda modellerna har stora brister och misslyckas med att identifera sjukdomsfall i en betydande andel av patienterna. Ett exempel där detta är tydligt är prediktion av hjärtstopp. I dagsläget finns ingen prediktionsmodell som med hög precision kan förutsäga om man kommer drabbas av ett hjärtstopp i framtiden. Förklaringen till detta är att biologiska processer är stokastiska, vilket innebär att det finns en slumpprocess som påverkar systemet. I exemplet med prediktion av hjärtstopp kan en individ drabbas av diabetes, högt blodtryck och en hjärtattack en tid efter att prediktionsmodellen använts och då gäller inte längre prediktionen som gjordes (personen har nu högre risk för hjärtstopp). Ytterligare ett exempel är blodets förmåga att koagulera, vilket kan variera från en minut till en annan beroende på inre (t ex stress) och yttre (t ex avgaser) omständigheter.
De flesta prediktionsmodeller som används beräknar modelles osäkerhet. I modellen ovan görs detta i form av error (epsilon), som kvantifierar hur stor skillnaden är mellan predikterade värden och observerade värden.
Det finns många orsaker till att prediktionsmodeller är osäkra, exempelvis:
- Biologiska system är komplexa, med inre och yttre stokastiska processer
- Osäkerhet i data (mätfel, missing data, etc).
- Modellen är suboptimal.