Boken om R › Forums › R och Rstudio › Bästa paketet för statistiska modeller med R? › Reply To: Bästa paketet för statistiska modeller med R?
-
I R finns flera stora paket som inbegriper ”alla verktyg” för att skapa prediktionsmodeller och utvärdera dem. De stora ramverken är listade här nedan och de inkluderar både traditionella regressionsmodeller och mer moderna ramverk som neuronnät och ensemble metoder inom machine learning. Det mesta ska finnas.
1. Tidymodels
Tidymodels är sannolikt det mest sofistikerade verktyget för att skapa modeller med R. Det är också det ramverket som mest resurser investeras i för att utveckla.
1. CARET
CARET är skapat av Max Kuhn, som ingår i Rstudio’s team. CARET är mycket bra för att skapa modeller och gör allt ifrån pre-processing till kalibrering och validering. Utvecklaren bakom CARET har övergått till att utveckla Tidymodels istället.
2. MLR3 och MLR3proba
MLR är likaledes ett stort paket som inbegriper en lång rad prediktionsmodeller och ett relativt innovativt sätt för att skapa modellerna. Med mlr definierar du en uppgift (modelling task) som du vill studera och sen tillämpar du alla möjliga modeller på den uppgiften för att utvärdera därefter. Mlr3proba, till skillnad från CARET, innehåller dessutom överlevnadsanalys (survival analysis).
3. H2O
H2O är som ovanstående men mer inriktat på big data.