Missing Data och Multipel Imputation

Avsnitt Progress

0% färdig

Missing data och multiple imputation

Missing data behöver beaktas i alla undersökningar. Missing data innebär att värdet på en variabel saknas. De flesta studier innehåller missing data och detta gäller både prediktorer (\(X\)) och utfallsmått (\(Y\)). Erinra att om värdet saknas för en variabel (\(X\) eller \(Y\)) i en regressionsmodell så kommer den individen (som saknar värde) inte inkluderas i modellen. Det gör att modellen tappar en observation och därmed power. Alla statistiska modeller blir bättre ju fler observationer som ingår i modellen.

Man bör förvissa sig om hur vanligt missing är (för varje variabel) och undersöka om de personer som utesluts från modellen skiljer sig från de som är kvar i modellen. Sistnämnda kan göras genom att skapa en deskriptiv tabell där karaktäristika för de som ingår respektive exkluderas från modellen jämförs. Om karaktäristika inte skiljer sig nämnvärt så kan man anta att missing är missing at random, vilket innebär att värdet saknas av en ren slump. Om så är fallet så påverkar inte missing modellens validitet. Det är också möjligt att imputera missing, vilket innebär att man fyller i alla saknade värden med rimliga värden. Imputation bör göras med metoden multipel imputation.