Sélection des caractéristiques avec l'ascension optimale des coordonnées (OCA).

Auteurs
Date de publication
2019
Type de publication
Autre
Résumé Dans l'apprentissage automatique, la sélection des caractéristiques (FS) est une partie importante d'un algorithme efficace. Elle alimente l'algorithme et constitue le bloc de départ de notre prédiction. Dans cet article, nous présentons une nouvelle méthode, appelée Optimal Coordinate Ascent (OCA), qui nous permet de sélectionner des caractéristiques parmi les caractéristiques de bloc et individuelles. L'OCA s'appuie sur l'ascension des coordonnées pour trouver une solution optimale pour le score (nombre d'échantillons correctement classés) des méthodes d'amplification par gradient. L'OCA prend en compte la notion de dépendances entre les variables formant les blocs dans notre optimisation. L'optimisation par l'ascension des coordonnées résout le problème NP hard d'origine où le nombre de combinaisons explose rapidement, rendant la recherche sur grille infaisable. Elle réduit considérablement le nombre d'itérations, transformant ce problème NP hard en un problème de recherche polynomiale. L'OCA apporte des différences et des améliorations substantielles par rapport à la méthode précédente de sélection des caractéristiques par ascension de coordonnées : nous regroupons les variables en blocs et en variables individuelles au lieu de procéder à une sélection binaire. Notre estimation initiale est basée sur les k meilleures variables du groupe, ce qui rend notre point initial plus robuste. Nous avons également introduit de nouveaux critères d'arrêt qui rendent notre optimisation plus rapide. Nous comparons ces deux méthodes sur notre ensemble de données. Nous avons constaté que notre méthode est plus performante que la méthode initiale. Nous comparons également notre méthode à la méthode Recursive Feature Elimination (RFE) et nous constatons que l'OCA conduit à l'ensemble de caractéristiques minimum avec le score le plus élevé. Il s'agit d'un sous-produit intéressant de notre méthode, car elle fournit empiriquement l'ensemble de données le plus compact avec des performances optimales.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr