Sur les jeux dynamiques : jeux stochastiques, recherche-dissimulation et transmission d'information.

Auteurs

GARREC Tristan
RENAULT Jerome

Date de publication

2019

Type de publication

Thèse

Résumé Dans cette thèse, nous étudions divers modèles de jeux dynamiques. Ceux-ci modélisent des processus de décisions prises par des agents rationnels en interactions stratégiques et dont la situation évolue au cours du temps. Le premier chapitre est consacré aux jeux stochastiques. Dans ces derniers, le jeu courant dépend d’un état de la nature, qui évolue d’une étape à la suivante de manière aléatoire en fonction de l’état courant ainsi que des actions des joueurs, qui observent ces éléments. On étudie des propriétés de communication entre les états, lorsque l’espace d’états est sous la forme d’un produit X ×Y, et que les joueurs contrôlent la dynamique sur leur composante de l’espace d’états. On montre l’existence de stratégies optimales dans tout jeu répété un nombre suffisant d’étapes, c’est-à-dire l’existence de la valeur uniforme, sous hypothèse de communication forte d’un côté. On montre en revanche la non converge de la valeur du jeu escompté, qui implique la non existence de la valeur asymptotique, sous hypothèse de communication faible des deux côtés. Les deux chapitres suivants sont consacrés à des modèles de jeux de recherche-dissimulation. Un chercheur et un dissimulateur agissent sur un espace de recherche. L’objectif du chercheur est typiquement de retrouver le dissimulateur le plus rapidement possible, ou alors de maximiser la probabilité de le trouver en un temps imparti. L’enjeu est alors de calculer la valeur et les stratégies optimales des joueurs en fonction de la géométrie de l’espace de recherche. Dans un jeu de patrouille, un attaquant choisit un temps et un lieu à attaquer, tandis qu’un patrouilleur marche continûment. Lorsque l’attaque survient, le patrouilleur a un certain délai pour repérer l’attaquant. Dans un jeu de recherche-dissimulation stochastique, les joueurs se trouvent sur un graphe. La nouveauté du modèle est qu’en raison de divers évènements, à chaque étape, certaines arêtes peuvent ne pas être disponibles, de sorte que le graphe évolue de façon aléatoire dans le temps. Enfin, le dernier chapitre est consacré à un modèle de jeux répétés à information incomplète dit de contrôle dynamique de l’information. Un conseiller a une connaissance privée de l’état de la nature, qui évolue aléatoirement avec le temps. Chaque jour le conseiller choisit la quantité d’information qu’il dévoile à un investisseur au travers de messages. À son tour, l’investisseur choisit d’investir ou non afin de maximiser son paiement quotidien espéré. En cas d’investissement, le conseiller reçoit une commission fixe de la part de l’investisseur. Son objectif est alors de maximiser la fréquence escomptée de jours où a lieu l’investissement. On s’intéresse à une stratégie de dévoilement d’information particulière du conseiller dite stratégie gloutonne. C’est une stratégie stationnaire ayant la propriété de minimiser la quantité d’information dévoilée sous contrainte de maximiser le paiement courant du conseiller.

Voir la publication

Thématiques de la publication

Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr