Första kursen: Forskningsmetoder och Analys med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Analys och forskning med R och Posit (Rstudio)
Introduktion
I denna e-bok får du lära dig hantera, analysera och presentera data med hjälp av R. Detta har blivit en aktuell uppgift för både studenter och yrkesutövare inom alla branscher, särskilt de med fokus på FoUUI (forskning, utbildning, utveckling, innovation). Hantering och analys av data har onekligen blivit en viktig del av de flesta analytiska yrken. Datavetenskap (data science) som ämnesområde har närmast exploderat de senaste åren och det har medfört att både mjukvara och teoretiskt fundament är lätttillgängligt för alla. Mjukvaran är idag kraftfull och enkel att använda. Vem som helst att lära sig analysera data.
Denna e-bok lär dig analysera och presentera data för all form av FoUUI. Författarna till denna e-bok är medicinska forskare med många års erfarenhet av att undervisa i forskningsmetodik. Detta inkluderar både experimentell och observationell forskning. Denna e-boken lär dig utforma analyser, genomföra analyserna och presentera resultaten.
R är det mest kraftfulla verktyget för den som arbetar med data science. Det finns för närvarande mer än 18000 paket (ett paket är ett bibliotek med färdiga funktioner som kan användas) tillgängliga till R. Dessa paket underlättar alla aspekter av arbetet. I denna e-bok diskuteras bland annat:
- R (språket) och RStudio
- Bearbetning av data med R
- Visualisering av data i R
- Analys av data med R
- Presentation av data med R
- Forskningsmetoder
- Hypoteser och hypotesprövning
- Observationella kontra experimentella studier
- Regressionsanalys
- Överlevnadsanalys
- AI (artificiell intelligens) och ML (machine learning)
- Strategier för att bygga prediktionsmodeller
Python vs R
Python är ett utmärkt språk för data science. Till Python finns ett stort community som utvecklar mjukvara för data science, särskilt för deep learning (en typ av machine learning). I dagsläget har Python flera fördelar gentemot R för den som arbetar med deep learning. Om ditt syfte är att arbeta enbart med deep learning så rekommenderar vi att du vänder dig till en kurs/bok om Python. För alla övriga rekommenderar vi R.
Acknowledgements
Flera kapitel i denna e-bok är starkt inspirerade av motsvarande kapitel i nedanstående böcker.
- R for data science av Hadley Wickham.
- R Workflow av Frank Harrell
- Tidy Modelling With R av Julia Sielge oh Max Kuhn
- Hands on programming with R av Garrett Grolemund
- Kapitlen kan också i hög grad följa officiell dokumentation för respektive funktion som demonstreras.
Författarna
Araz Rawshani, MD, PhD
Aidin Rawshani, MD, PhD