Gå till index

Analys med R

0% färdig
0/0 Steps
  1. Analys och forskning med R och Posit (Rstudio)
  2. Grunderna i R och Rstudio
    7 Ämnen
  3. Importera, exportera, spara och ladda data
    5 Ämnen
  4. Strängar och regular expressions (regex)
    1 Ämne
  5. Bearbetning av data med dplyr
    12 Ämnen
  6. Visualisera och presentera
    14 Ämnen
  7. Explorerande analyser
    6 Ämnen
  8. Prediktionsmodeller
    12 Ämnen
  9. Klassisk regressionsanalys
    8 Ämnen
  10. Machine learning (ML) och Artificiell Intelligens (AI)
    9 Ämnen
  11. Prediktionsmodeller: Tidymodels
  12. Hypotestester
    1 Ämne
Avsnitt 6, Ämne 2
Startad

Introduktion till ggplot2

Avsnitt Progress
0% färdig

Paketet ggplot2 är numera en del av tidyverse. För att ladda ggplot2 kan du ladda tidyverse. I tidyverse finns 7 viktiga paket som behövs för analys och presentation av data. Dessa paket är ggplot2, dplyr, forcats, tibble, tidyr, stringr och purrr. Paketen dplyr och ggplot2 används regelbundet tillsammans. Börja med att installera och aktivera tidyverse:

R
install.packages("tidyverse")
library(tidyverse)

I både dplyr och ggplot2 kopplas operationerna sekventiellt. I dplyr kopplas operationer med pipe-operatorn, som betecknas med |> (tidigare användes %>%). Pipe används för att stegvis instruera R vad som skall göras. Nedan följer ett exempel där |> används för att filtera en data frame (mina_data) så att den bara innehåller kvinnor, och därefter skapas en variabel (Income_Dollar) och slutligen sorteras observationerna efter variabeln Age. Koden nedan är endast av illustrativt syfte (data existerar inte och koden kan inte köras).

R
mina_data |>
  filter(Sex=="Women") |>
  mutate(Income_Dollar = Income_Kronor*10) |>
  arrange(Age)

I ggplot2 kopplas också operationer sekventiellt men detta görs med +. Nedan används mina_data för att skapa en graf där Income_Dollar och Age visualiseras på x-axeln och y-axeln med hjälp av punkter. Slutligen får grafen titeln "Min graf".

R
ggplot2(data=mina_data, aes(x=Income_Dollar, y=Age)) +
  geom_point() +
  labs(titel="Min graf")

Kom ihåg att pipe (|>) skickar vidare resultatet av en operationen till nästa operation. Det innebär att du kan kombinera dplyr med ggplot. Detta är användbart för att skapa grafer i samma seans som databearbetning sker. Hör följer ett kodexempel där bearbetning av data kopplas till visualiseringen:

R
mina_data |>
  filter(Sex=="Women") |>
  mutate(Income_Dollar = Income_Kronor*10) |>
  arrange(Age) |>
  ggplot2(aes(x=Inkomst, y=Age)) +
  geom_point() +
  geom_line() +
  labs(titel="Min graf")

Notera att vi (ovan) inte definierade data=mina_data i ggplot()-funktionen. Det behövs inte eftersom pipe (|>) skickar vidare resultatet av alla föregående operationer som första argument till ggplot() och första argumentet är data=.

Detta kommer bli tydligare i kommande kapitel där vi skapar grafer stegvis.