Une méthode de composante principale pour imputer les valeurs manquantes pour les données mixtes.

Auteurs
Date de publication
2014
Type de publication
Article de journal
Résumé Nous proposons une nouvelle méthode pour imputer les valeurs manquantes dans les ensembles de données mixtes. Elle est basée sur une méthode de composantes principales, l'analyse factorielle pour données mixtes, qui équilibre l'influence de toutes les variables continues et catégorielles dans la construction des dimensions de la variabilité. Comme l'imputation utilise les axes et les composantes principales, la prédiction des valeurs manquantes est basée sur la similarité entre les individus et sur les relations entre les variables. La qualité de l'imputation est évaluée par une étude de simulation et des ensembles de données réelles. La méthode est comparée à une méthode récente (Stekhoven et Bühlmann, 2011) basée sur les forêts aléatoires et montre de meilleures performances, notamment pour l'imputation de variables catégorielles et lorsqu'il existe des relations hautement linéaires entre les variables continues.
Éditeur
Springer Science and Business Media LLC
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr