AMF : Aggregated Mondrian Forests for Online Learning (Forêts de Mondrian agrégées pour l'apprentissage en ligne).

Auteurs
Date de publication
2020
Type de publication
Autre
Résumé Les forêts aléatoires (RF) sont l'un des algorithmes de choix dans de nombreuses applications d'apprentissage supervisé, qu'il s'agisse de classification ou de régression. L'attrait de ces méthodes d'assemblage d'arbres provient de la combinaison de plusieurs caractéristiques : une précision remarquable dans une variété de tâches, un petit nombre de paramètres à régler, la robustesse par rapport à l'échelonnement des caractéristiques, un coût de calcul raisonnable pour la formation et la prédiction, et leur adéquation à des paramètres de haute dimension. Les variantes de RF les plus couramment utilisées sont cependant des algorithmes "hors ligne", qui nécessitent la disponibilité de l'ensemble des données en une seule fois. Dans cet article, nous présentons AMF, un algorithme de forêt aléatoire en ligne basé sur les forêts de Mondrian. En utilisant une variante de l'algorithme de pondération de l'arbre contextuel, nous montrons qu'il est possible d'effectuer efficacement une agrégation exacte sur toutes les tailles des arbres. En particulier, cela permet d'obtenir un véritable algorithme en ligne sans paramètre qui est compétitif avec la taille optimale de l'arbre de Mondrian, et donc adaptatif à la régularité inconnue de la fonction de régression. Les expériences numériques montrent que l'AMF est compétitif par rapport à plusieurs lignes de base fortes sur un grand nombre de jeux de données pour la classification multi-classes.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr