BAUDRY Maximilien

< Retour à ILB Patrimoine
Affiliations
  • 2019 - 2020
    Laboratoire de sciences actuarielle et financière
  • 2019 - 2020
    Université Claude Bernard Lyon 1
  • 2019 - 2020
    Ecole doctorale en informatique et mathematiques de lyon
  • 2019 - 2020
    Université de Lyon - Communauté d'universités et d'établissements
  • 2020
  • Quelques problèmes d'apprentissage statistique avec des données incomplètes.

    Maximilien BAUDRY
    2020
    La plupart des méthodes statistiques ne sont pas conçues pour travailler directement avec des données incomplètes. L'étude de l'incomplétude des données n'est pas nouvelle et des méthodes solides ont été établies pour la traiter avant une analyse statistique. D'autre part, la littérature sur l'apprentissage profond travaille principalement avec des données non structurées telles que des images, du texte ou des données audio brutes, mais très peu de travaux ont été réalisés sur des données tabulaires. Par conséquent, la littérature moderne sur l'apprentissage automatique traitant de l'incomplétude des données sur des données tabulaires est rare. Cette thèse se concentre sur l'utilisation de modèles d'apprentissage automatique appliqués à des données tabulaires incomplètes, dans un contexte d'assurance. Nous proposons à travers nos contributions quelques façons de modéliser des phénomènes complexes en présence de schémas d'incomplétude, et montrons que nos approches surpassent les modèles de l'état de l'art La plupart des méthodes statistiques ne sont pas nativement conçues pour fonctionner sur des données incomplètes.
  • Quelques problèmes d’apprentissage statistique en présence de données incomplètes.

    Maximilien BAUDRY, Christian yann ROBERT, Julie JOSSE, Christian yann ROBERT, Gerard BIAU, Anne laure FOUGERES, Thierry ARTIERES, Olivier LOPEZ
    2020
    La plupart des méthodes statistiques ne sont pas nativement conçues pour fonctionner sur des données incomplètes. L’étude des données incomplètes n’est pas nouvelle et de nombreux résultats ont été établis pour pallier l’incomplétude en amont de l’étude statistique. D’autre part, les méthodes de deep learning sont en général appliquées à des données non structurées de type image, texte ou audio, mais peu de travaux s’intéressent au développement de ce type d’approche sur des données tabulaires, et encore moins sur des données incomplètes. Cette thèse se concentre sur l’utilisation d’algorithmes de machine learning appliqués à des données tabulaires, en présence d’incomplétude et dans un cadre assurantiel. Au travers des contributions regroupées dans ce document, nous proposons différentes façons de modéliser des phénomènes complexes en présence de schémas d’incomplétude. Nous montrons que les approches proposées donnent des résultats de meilleure qualité que l’état de l’art.
Les affiliations sont détectées à partir des signatures des publications identifiées dans scanR. Un auteur peut donc apparaître affilié à plusieurs structures ou tutelles en fonction de ces signatures. Les dates affichées correspondent seulement aux dates des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr