Algorithme d'arbre de classification pour les variables groupées.

Auteurs
  • DUPUY J. f.
  • POTERIE A.
  • DUPUY Jean francois
  • MONBET V.
  • ROUVIERE L.
Date de publication
2019
Type de publication
Article de journal
Résumé Nous considérons le problème de la prédiction d'une variable catégorielle basée sur des groupes d'entrées. Certaines méthodes ont déjà été proposées pour élaborer des règles de classification basées sur des groupes de variables (par exemple, le lasso de groupe pour la régression logistique). Cependant, à notre connaissance, aucune approche basée sur les arbres n'a été proposée pour aborder ce problème. Nous proposons ici l'algorithme TPLDA (Tree Penalized Linear Discriminant Analysis), une nouvelle approche arborescente qui construit une règle de classification basée sur des groupes de variables. Il consiste à diviser un nœud en sélectionnant de manière répétée un groupe, puis en appliquant une analyse discriminante linéaire régularisée basée sur ce groupe. Ce processus est répété jusqu'à ce qu'un critère d'arrêt soit satisfait. Une stratégie d'élagage est proposée pour sélectionner un arbre optimal. Par rapport aux méthodes existantes d'arbres de classification multivariés, la méthode proposée est moins exigeante en termes de calcul et les arbres obtenus sont plus faciles à interpréter. En outre, TPLDA fournit automatiquement une mesure d'importance pour chaque groupe de variables. Ce score permet de classer les groupes de variables en fonction de leur capacité à prédire la réponse et peut également être utilisé pour effectuer une sélection de variables de groupe. Les bonnes performances de l'algorithme proposé et son intérêt en termes de précision de prédiction, d'interprétation et de sélection de variables de groupe sont mis en évidence et comparés à d'autres méthodes de référence à travers des simulations et des applications sur des jeux de données réels.
Éditeur
Springer Science and Business Media LLC
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr