Une procédure d'apprentissage supervisé par grappes basée sur l'agrégation des distances.

Auteurs
Date de publication
2019
Type de publication
Autre
Résumé De nos jours, de nombreuses procédures d'apprentissage automatique sont disponibles sur étagère et peuvent être utilisées facilement pour calibrer des modèles prédictifs sur des données supervisées. Cependant, lorsque les données d'entrée sont constituées de plus d'un groupe inconnu et que différents modèles prédictifs sous-jacents existent, l'ajustement d'un modèle est une tâche plus difficile. Nous proposons, dans cet article, une procédure en trois étapes pour résoudre automatiquement ce problème. La procédure KFC agrège différents modèles de manière adaptative sur les données. La première étape de la procédure vise à attraper la structure de clustering des données d'entrée, qui peuvent être caractérisées par plusieurs distributions statistiques. Elle fournit plusieurs partitions, compte tenu des hypothèses sur les distributions. Pour chaque partition, la deuxième étape ajuste un modèle prédictif spécifique basé sur les données de chaque cluster. Le modèle global est calculé par une agrégation consensuelle des modèles correspondant aux différentes partitions. Une comparaison des performances sur différentes données simulées et réelles évalue l'excellente performance de notre méthode dans une grande variété de problèmes de prédiction.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr