Un algorithme simple de bandit dynamique pour le réglage des hyperparamètres.
Auteurs
Date de publication
- SHANG Xuedong
- KAUFMANN Emilie
- VALKO Michal
2019
Type de publication
Article de conférence
Résumé
Le réglage des hyperparamètres est une partie importante des systèmes modernes d'apprentissage automatique. Le réglage lui-même peut être considéré comme un problème d'allocation séquentielle des ressources. À ce titre, des méthodes de bandits à bras multiples ont déjà été appliquées. Dans cet article, nous considérons l'optimisation des hyperparamètres comme une instance de l'identification du meilleur bras dans des bandits à nombre infini de bras. Nous proposons D-TTTS, un nouvel algorithme adaptatif inspiré de l'échantillonnage de Thompson, qui équilibre dynamiquement entre le raffinement de l'estimation de la qualité des configurations d'hyper-paramètres précédemment explorées et l'ajout de nouvelles configurations d'hyper-paramètres au pool de candidats. L'algorithme est facile à mettre en œuvre et présente des performances compétitives par rapport aux algorithmes de pointe pour le réglage des hyperparamètres.
Thématiques de la publication
-
Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr