R-miss-tastic : une plateforme unifiée pour les méthodes et les flux de travail relatifs aux valeurs manquantes.

Auteurs
  • MAYER Imke
  • JOSSE Julie
  • TIERNEY Nicholas
  • VIALANEIX Nathalie
Date de publication
2019
Type de publication
Autre
Résumé Les valeurs manquantes sont inévitables lorsqu'on travaille avec des données. Leur occurrence est exacerbée par l'augmentation du nombre de données disponibles provenant de différentes sources. Cependant, la plupart des modèles statistiques et des méthodes de visualisation nécessitent des données complètes, et un traitement incorrect des données manquantes entraîne une perte d'information ou des analyses biaisées. Depuis les travaux précurseurs de Rubin (1976), il existe une littérature florissante sur les valeurs manquantes, avec des objectifs et des motivations hétérogènes. Cela a donné lieu au développement de diverses méthodes, formalisations et outils (y compris un grand nombre de packages R). Cependant, pour les praticiens, il est difficile de décider quelle méthode est la plus adaptée à leur problème, en partie parce que le traitement des données manquantes n'est toujours pas un sujet systématiquement abordé dans les programmes d'études de statistique ou de science des données. Pour aider à relever ce défi, nous avons lancé une plateforme unifiée : "R-miss-tastic", qui vise à fournir une vue d'ensemble des problèmes de valeurs manquantes standard, des méthodes, de la façon de les traiter dans les analyses, et des implémentations pertinentes des méthodologies. L'objectif est non seulement de collecter, mais aussi d'organiser de manière exhaustive le matériel, de créer des flux de travail d'analyse standard et d'unifier la communauté. Ces aperçus sont destinés aux débutants, aux étudiants, aux analystes plus avancés et aux chercheurs.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr