Algorithmes de réseaux neuronaux profonds pour les problèmes de contrôle stochastique sur un horizon fini, partie I : analyse de convergence.

Auteurs
  • HURE Come
  • PHAM Huyen
  • BACHOUCH Achref
  • LANGRENE Nicolas
Date de publication
2018
Type de publication
Autre
Résumé Cet article développe des algorithmes pour les problèmes de contrôle stochastique de haute dimension basés sur l'apprentissage profond et la programmation dynamique (DP). Contrairement à l'approche classique de la programmation dynamique approximative, nous approximons d'abord la politique optimale au moyen de réseaux de neurones dans l'esprit de l'apprentissage par renforcement profond, puis la fonction de valeur par régression de Monte Carlo. Ceci est réalisé dans la récursion DP par performance ou itération hybride, et par des méthodes de régression maintenant ou plus tard/quantification à partir de probabilités numériques. Nous fournissons une justification théorique de ces algorithmes. La cohérence et le taux de convergence des estimations des fonctions de contrôle et de valeur sont analysés et exprimés en termes d'erreur d'approximation universelle des réseaux neuronaux. Des résultats numériques sur diverses applications sont présentés dans un article complémentaire [2] et illustrent la performance de nos algorithmes.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr