Tagged: maskininlärning, r, regression, rekommenderade-paket
-
Bästa paketet för statistiska modeller med R?
-
Jag undrar vilket eller vilka paket som är bäst för att skapa regressionsmodeller och maskininlärning (machine learning) i R? Jag söker ett paket, eller flera, som kan ombesörja så mycket som möjligt från datapreparering till utvärdering av modeller.
-
I R finns flera stora paket som inbegriper ”alla verktyg” för att skapa prediktionsmodeller och utvärdera dem. De stora ramverken är listade här nedan och de inkluderar både traditionella regressionsmodeller och mer moderna ramverk som neuronnät och ensemble metoder inom machine learning. Det mesta ska finnas.
1. CARET
CARET är skapat av Max Kuhn, som ingår i Rstudio’s team. CARET är mycket bra för att skapa modeller och gör allt ifrån pre-processing till kalibrering och validering.
2. MLR3 och MLR3proba
MLR är likaledes ett stort paket som inbegriper alla möjliga prediktionsmodeller och ett relativt innovativt sätt för att skapa modellerna. Med mlr definierar du en uppgift (modelling task) som du vill studera och sen tillämpar du alla möjliga modeller på den uppgiften för att utvärdera därefter. Mlr3proba, till skillnad från CARET, innehåller dessutom överlevnadsanalys (survival analysis).
3. H2O
H2O är som ovanstående men mer inriktat på big data.
Log in to reply.