Identification optimale du meilleur bras avec une confiance fixe.

Auteurs
Date de publication
2016
Type de publication
Article de conférence
Résumé Nous donnons une caractérisation complète de la complexité de l'identification du meilleur bras dans les problèmes de bandits à un paramètre. Nous prouvons une nouvelle limite inférieure serrée sur la complexité de l'échantillon. Nous proposons la stratégie `Track-and-Stop', dont nous prouvons qu'elle est asymptotiquement optimale. Elle consiste en une nouvelle règle d'échantillonnage (qui suit les proportions optimales de tirages de bras mises en évidence par la borne inférieure) et en une règle d'arrêt nommée d'après Chernoff, pour laquelle nous donnons une nouvelle analyse.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr