Valeurs manquantes dans l'analyse en composantes simultanées à plusieurs niveaux.

Auteurs
Date de publication
2013
Type de publication
Article de journal
Résumé L'analyse en composantes de données avec des valeurs manquantes est souvent réalisée avec des algorithmes d'imputation itérative. Cependant, cette approche est sujette à des problèmes d'overfitting. Comme alternative, Josse et al. (2009) ont proposé un algorithme régularisé dans le cadre de l'analyse en composantes principales (ACP). Nous utilisons ici une approche similaire pour traiter les valeurs manquantes dans l'analyse en composantes simultanées multiniveau (MLSCA), une méthode dédiée à l'exploration de données multiniveau multivariées (par exemple, des individus imbriqués dans des groupes). Nous discutons les propriétés de l'algorithme régularisé, le comportement attendu sous les mécanismes de manques (complètement) au hasard (M(C)AR) et les problèmes possibles de dysmonotonie. Nous expliquons l'importance de séparer les déviations dues aux fluctuations d'échantillonnage et celles dues aux données manquantes. Sur la base d'une étude comparative de simulation extensive, nous montrons que la méthode régularisée est généralement performante et surpasse clairement un algorithme de type EM. (C) 2013 Elsevier B.V. Tous droits réservés.
Éditeur
Elsevier BV
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr