Quelques problèmes d'apprentissage statistique avec des données incomplètes.

Auteurs Date de publication
2020
Type de publication
Thèse
Résumé La plupart des méthodes statistiques ne sont pas conçues pour travailler directement avec des données incomplètes. L'étude de l'incomplétude des données n'est pas nouvelle et des méthodes solides ont été établies pour la traiter avant une analyse statistique. D'autre part, la littérature sur l'apprentissage profond travaille principalement avec des données non structurées telles que des images, du texte ou des données audio brutes, mais très peu de travaux ont été réalisés sur des données tabulaires. Par conséquent, la littérature moderne sur l'apprentissage automatique traitant de l'incomplétude des données sur des données tabulaires est rare. Cette thèse se concentre sur l'utilisation de modèles d'apprentissage automatique appliqués à des données tabulaires incomplètes, dans un contexte d'assurance. Nous proposons à travers nos contributions quelques façons de modéliser des phénomènes complexes en présence de schémas d'incomplétude, et montrons que nos approches surpassent les modèles de l'état de l'art La plupart des méthodes statistiques ne sont pas nativement conçues pour fonctionner sur des données incomplètes.
Thématiques de la publication
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr