Mixture Martingales Revisited with Applications to Sequential Tests and Confidence Intervals.

Auteurs
Date de publication
2018
Type de publication
Autre
Résumé Cet article présente de nouvelles inégalités de déviation qui sont valables uniformément en temps sous échantillonnage adaptatif dans un modèle de bandit à plusieurs bras. Les déviations sont mesurées en utilisant la divergence de Kullback-Leibler dans une famille exponentielle unidimensionnelle donnée, et peuvent prendre en compte plusieurs bras à la fois. Elles sont obtenues en construisant pour chaque bras une martingale de mélange basée sur une antériorité hiérarchique, et en multipliant ces martingales. Nos inégalités de déviation nous permettent d'analyser des règles d'arrêt basées sur des rapports de vraisemblance généralisés pour une grande classe de problèmes d'identification séquentielle, et de construire des intervalles de confiance serrés pour certaines fonctions des moyennes des bras.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr