Sélection de mélanges GLM : un nouveau critère pour le regroupement.

Auteurs
Date de publication
2014
Type de publication
Autre
Résumé Le clustering basé sur des modèles à partir de mélanges finis de modèles linéaires généralisés est une question difficile qui a fait l'objet de nombreux développements récents. En pratique, l'étape de sélection du modèle est généralement effectuée en utilisant les critères pénalisés AIC ou BIC. Cependant, les simulations montrent qu'ils ont tendance à surestimer la dimension réelle du modèle. Ces éléments nous ont conduit à considérer un nouveau critère proche de l'ICL, introduit pour la première fois dans Baudry (2009). Sa définition nécessite d'introduire un contraste incorporant un terme entropique : en utilisant des inégalités de concentration, nous dérivons des propriétés clés sur la convergence du M-estimateur associé. La cohérence du critère de classification correspondant suit ensuite en fonction de certaines exigences classiques sur le terme de pénalité. Enfin, une étude de simulation permet de corroborer nos résultats théoriques, et montre l'efficacité de la méthode dans une perspective de clustering.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr