Un algorithme simple de bandit dynamique pour le réglage des hyperparamètres.

Auteurs
Date de publication
2019
Type de publication
Article de conférence
Résumé Le réglage des hyperparamètres est une partie importante des systèmes modernes d'apprentissage automatique. Le réglage lui-même peut être considéré comme un problème d'allocation séquentielle des ressources. À ce titre, des méthodes de bandits à bras multiples ont déjà été appliquées. Dans cet article, nous considérons l'optimisation des hyperparamètres comme une instance de l'identification du meilleur bras dans des bandits à nombre infini de bras. Nous proposons D-TTTS, un nouvel algorithme adaptatif inspiré de l'échantillonnage de Thompson, qui équilibre dynamiquement entre le raffinement de l'estimation de la qualité des configurations d'hyper-paramètres précédemment explorées et l'ajout de nouvelles configurations d'hyper-paramètres au pool de candidats. L'algorithme est facile à mettre en œuvre et présente des performances compétitives par rapport aux algorithmes de pointe pour le réglage des hyperparamètres.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr