Classement des forêts.

Auteurs
Date de publication
2013
Type de publication
Article de journal
Résumé Le présent article examine comment les principes d'agrégation et de randomisation des caractéristiques qui sous-tendent l'algorithme RANDOM FOREST (Breiman, 2001) peuvent être adaptés au classement bipartite. L'approche adoptée ici est basée sur le scoring non paramétrique et l'optimisation de la courbe ROC au sens du critère AUC. Dans cette problématique, l'agrégation est utilisée pour augmenter les performances des règles de scoring produites par des arbres de classement, comme ceux développés dans Clémençon et Vayatis (2009c). Le présent travail décrit les principes de construction de règles de scoring médianes basées sur des concepts issus de l'agrégation de rangs. Des résultats de cohérence sont dérivés pour ces règles de notation agrégées et un algorithme appelé RANKING FOREST est présenté. En outre, diverses stratégies de randomisation des caractéristiques sont explorées à travers une série d'expériences numériques sur des ensembles de données artificielles.
Éditeur
Microtome Publishing
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr