Första kursen: Forskningsmetoder och Analys med R
-
Analys och forskning med R och Posit (Rstudio)
-
Grunderna i R och Rstudio7 Ämnen
-
Importera, exportera, spara och ladda data5 Ämnen
-
Strängar och regular expressions (regex)1 Ämne
-
Bearbetning av data med dplyr12 Ämnen
-
Dplyr: Introduktion
-
Dplyr filter(): Filtrera rader (observationer)
-
Dplyr select(): Selektera kolumner (variabler)
-
Dplyr mutate(): Skapa kolumner (variabler)
-
Dplyr arrange(): sortera rader (observationer)
-
Dplyr rename(): Namnge kolumer
-
Dplyr slice(): Selektera rader på positioner
-
Dplyr summarise(): Summera variabler (kolumner)
-
Dplyr ifelse(), if_else(), case_when(): Villkor
-
Dplyr row_number(): Numrering av rader
-
Dplyr rowwise(): Radvis beräkning
-
Dplyr distinct(): Identifiera unika observationer och rader
-
Dplyr: Introduktion
-
Visualisera och presentera14 Ämnen
-
Att visualisera data
-
Introduktion till ggplot2
-
Grunderna i ggplot2
-
Estetisk mappning
-
Färger, färgkoder och färgpaletter
-
Facets (subgrafer)
-
Geoms (geometriska objekt)
-
Geoms med statistiska beräkningar (transformationer)
-
Koordinatsystemet
-
Scales, axlar, legends (guides)
-
Fokusering och avgränsning
-
Tema (themes)
-
Organisering och layout av figurer med multipla paneler
-
Spara grafer till hårddisk
-
Att visualisera data
-
Explorerande och deskriptiva analyser6 Ämnen
-
Prediktionsmodeller12 Ämnen
-
Learning: Supervised och Unsupervised Learning
-
Parametriska och Icke-Parametriska Modeller
-
Osäkerhet (Uncertainty)
-
Kausal inferens (Kausalitet, Causality)
-
Strategier för att Skapa Prediktionsmodeller
-
Hantering av Kontinuerliga variabler, Icke-Linjära samband och Flexibla Funktioner
-
Variabelselektion (Feature Selection)
-
Missing Data och Multipel Imputation
-
Observationer med Stark Inverkan på Modellen
-
Att Jämföra och Välja Bland Modeller
-
Mått på prediktiv förmåga (Evaluation metrics)
-
Sammanfattande Principer för Prediktionsmodellering
-
Learning: Supervised och Unsupervised Learning
-
Klassisk regressionsanalys8 Ämnen
-
Machine learning (ML) och Artificiell Intelligens (AI)9 Ämnen
-
Introduktion till artificiell intelligens och machine learning
-
Vad är AI och ML?
-
Varför AI och ML nu?
-
Introduktion till Machine Learning (Maskininlärning)
-
Terminologi inom AI och ML
-
Brister i humana prediktioner och beslut
-
Learning (Inlärning)
-
Deep Learning (Djupinlärning, Neuronnät)
-
Ensemble metoder
-
Introduktion till artificiell intelligens och machine learning
-
Skapa prediktionsmodeller med Tidymodels6 Ämnen
-
Hypotestester och epidemiologiska mått5 Ämnen
Effektiv screening av data frames
Det finns numera flera paket som tillåter snabb exploration av data. Paketet DataExplorer
är skapat för att producera färdiga rapporter, alternativt delar av rapporter. Det finns flera snarlika paket men DataExplorer
är väldokumenterat och inbegriper de viktigaste metoderna. Börja med att installera och aktivera paketet:
install.packages("DataExplorer")
library(DataExplorer)
DataExplorer
kan skapa en formaterad rapport som sparas som en PDF-fil på hårddisken. För att göra detta används funktionen create_report()
som har argumenten output_file
(namnet på filen som sparas på hårddisken), report_title
(titel på rapporten), och det frivilliga argumentet y
. Argumentet y
anges bara om deskriptionerna ska stratifieras på en variabel. I nedanstående kod stratifieras rapporten på kolumnen death
, som indikerar om patienten avled under studien.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
Därefter kommer filen (med formatet HTML) att finnas i din working directory. Om du inte vet var din working directory är så skriver du kommandot getwd()
, vilket returnerar din working directory (sannolikt är det samma mapp som ditt R-skript finns i). Början av filen ser ut som följer:
Vi fortsätter med att demonstrera hur enskilda komponenter i rapporten kan produceras för att explorera data.
Börja med en övergripande beskrivning av data:
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
rows | columns | discrete_columns | continuous_columns | all_missing_columns | total_missing_values | complete_rows |
---|---|---|---|---|---|---|
5735 | 63 | 21 | 42 | 0 | 13873 | 49 |
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.
BLOCKERAD KOD, BILD ELLER TEXT
Du måste logga in för att komma åt allt material.