Analyse en composantes principales avec valeurs manquantes : une étude comparative des méthodes.

Auteurs
Date de publication
2014
Type de publication
Article de journal
Résumé L'analyse en composantes principales (ACP) est une technique standard pour résumer les principales structures d'un tableau de données contenant les mesures de plusieurs variables quantitatives pour un certain nombre d'individus. Ici, nous étudions le cas où certaines des valeurs des données sont manquantes et proposons une revue des méthodes qui accommodent l'ACP aux données manquantes. En écologie végétale, ce défi statistique est lié à l'effort actuel de compilation des bases de données mondiales de traits fonctionnels des plantes, qui produit des matrices avec un grand nombre de valeurs manquantes. Nous présentons plusieurs techniques pour considérer ou estimer (imputer) les valeurs manquantes dans l'ACP et nous les comparons à l'aide de considérations théoriques. Nous avons réalisé une étude de simulation pour évaluer les mérites relatifs des différentes approches dans diverses situations (structure de corrélation, nombre de variables et d'individus, et pourcentage de valeurs manquantes) et les avons également appliquées sur un ensemble de données réelles. Enfin, nous discutons des avantages et des inconvénients de ces approches, des pièges potentiels et des défis à relever à l'avenir.
Éditeur
Springer Science and Business Media LLC
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr