Imputation multiple pour les modèles de risque démographique avec des variables prédicteurs censurées à gauche.

Auteurs
Date de publication
2014
Type de publication
Autre
Résumé Un problème courant lors de l'utilisation de données de panel est que l'histoire d'un individu est incomplètement connue lors de la première vague. Nous montrons que l'imputation multiple, la méthode couramment utilisée pour les données manquantes en raison de la non-réponse, peut également être utilisée pour imputer ces données qui sont "manquantes par conception". Notre application concerne la durée de l'emploi à plein temps d'une femme en tant que prédicteur de son risque de première naissance. Nous imputons de façon multiple la situation d'emploi deux ans plus tôt aux cas "incomplets" pour lesquels la situation d'emploi n'est observée que dans l'année la plus récente. Nous regroupons ensuite ces cas "complets" avec les cas "complets" pour obtenir des estimations de régression pour l'échantillon complet. Par rapport au fait de ne pas être employée à plein temps, le fait d'avoir été employée à plein temps pendant deux ans ou plus est un prédicteur positif et statistiquement significatif de la procréation, alors que le fait d'avoir commencé à travailler à plein temps ne l'est pas. Les variances des paramètres de la durée de l'emploi à plein temps sont environ un tiers plus faibles dans l'échantillon à imputation multiple que dans l'échantillon de données complètes, et ce n'est que dans l'échantillon à imputation multiple que le coefficient de la durée de l'emploi atteint une signification statistique.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr