Identification de top-m pour les bandits linéaires.

Auteurs
Date de publication
2021
Type de publication
book
Résumé Motivés par une application à la réadaptation des médicaments, nous proposons les premiers algorithmes pour traiter l'identification des m ≥ 1 bras avec les plus grandes moyennes dans un modèle de bandit linéaire, dans le cadre de la confiance fixe. Ces algorithmes appartiennent à la famille générique des Gap-Index Focused Algorithms (GIFA) que nous introduisons pour l'identification du Top-m dans les bandits linéaires. Nous proposons une analyse unifiée de ces algorithmes, qui montre comment l'utilisation de caractéristiques peut réduire la complexité de l'échantillon. Nous validons en outre ces algorithmes de manière empirique sur des données simulées et sur une tâche simple de reprogrammation de médicaments.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr