Réduction bayésienne de la dimensionnalité avec ACP utilisant la vraisemblance semi-intégrée pénalisée.

Auteurs
Date de publication
2016
Type de publication
Autre
Résumé Nous abordons le problème de l'estimation du nombre de composantes principales dans l'analyse en composantes principales (ACP). Malgré l'importance du problème et la multitude de solutions proposées dans la littérature, il est surprenant qu'il n'existe pas de cadre asymptotique cohérent qui justifierait différentes approches en fonction de la taille réelle de l'ensemble de données. Dans cet article, nous abordons cette question en présentant une approche bayésienne approximative basée sur l'approximation de Laplace et en introduisant une méthode générale pour construire les critères de sélection de modèle, appelée Vraisemblance SEmi-intégrée PEnalisée (PESEL). Notre cadre général englobe une variété d'approches existantes basées sur des modèles probabilistes, comme par exemple le critère d'information bayésien pour l'ACP probabiliste (ACPP), et permet la construction de nouveaux critères, en fonction de la taille de l'ensemble de données à disposition. Plus précisément, nous définissons PESEL lorsque le nombre de variables dépasse largement le nombre d'observations. Nous présentons également les résultats d'études de simulation approfondies et d'analyses de données réelles, qui illustrent les bonnes propriétés des critères que nous proposons par rapport aux méthodes de l'état de l'art et aux propositions très récentes. En particulier, ces simulations montrent que les critères basés sur PESEL peuvent être assez robustes contre les déviations des hypothèses du modèle probabiliste. Les critères sélectionnés basés sur PESEL pour l'estimation du nombre de composantes principales sont implémentés dans le package R varclust, qui est disponible sur github (https://github.com/psobczyk/varclust).
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr