The Value of Markov Chain Games with Incomplete Information on both Sides.

Auteurs
Date de publication
2015
Type de publication
Article de journal
Résumé Nous considérons des jeux répétés à somme nulle avec information incomplète des deux côtés, où les états observés en privé par chaque joueur suivent des chaînes de Markov indépendantes. Ce modèle généralise le modèle, introduit par Aumann et Maschler dans les années soixante et résolu par Mertens et Zamir dans les années soixante-dix, où les états privés des joueurs étaient fixés. Il inclut également le modèle introduit par Renault \cite{R2006}, de jeux répétés en chaîne de Markov avec manque d'information d'un côté, où un seul joueur observe en privé la séquence d'états. Nous prouvons ici que la valeur limite existe, et nous obtenons une caractérisation via le système de Mertens-Zamir, où la "fonction de valeur non révélatrice" introduite dans le système est maintenant définie comme la valeur limite d'un jeu dynamique auxiliaire "non révélateur". Ce jeu non révélateur est défini en restreignant les joueurs à ne révéler aucune information sur le comportement limite de leur propre chaîne de Markov, comme dans Renault 2006. Il y a deux difficultés techniques clés dans la preuve : 1) prouver la régularité, au sens de l'équicontinuité, des fonctions de valeur non révélatrices à $T$ étages, et 2) construire des stratégies par blocs afin de relier les valeurs des jeux non révélateurs aux valeurs originales.
Éditeur
Institute for Operations Research and the Management Sciences (INFORMS)
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr