Imputation multiple pour les modèles de risque démographique avec des variables prédicteurs censurées à gauche : Application à la durée d'emploi et à la fécondité dans l'EU-SILC.

Auteurs
Date de publication
2016
Type de publication
Article de journal
Résumé OBJECTIF Un problème courant lors de l'utilisation de données de panel est que l'histoire des individus est incomplètement connue lors de la première vague. Nous démontrons l'utilisation de l'imputation multiple comme méthode pour traiter cette information partielle, et ainsi augmenter la puissance statistique sans compromettre la spécification du modèle. MÉTHODES En utilisant les données du panel EU-SILC pour étudier l'emploi à temps plein comme prédicteur du risque de première naissance des femmes en couple en Pologne, nous avons d'abord imputé de façon multiple le statut d'emploi deux ans auparavant aux cas pour lesquels le statut d'emploi n'est observé que dans l'année la plus récente. Nous avons ensuite dérivé des estimations de régression à partir de l'échantillon complet, imputé de façon multiple, et nous avons comparé les estimations du coefficient et de l'erreur standard à celles de l'estimation des cas complets avec le statut d'emploi observé un et deux ans plus tôt. RÉSULTATS Par rapport au fait de ne pas être employé à plein temps, le fait d'avoir été employé à plein temps pendant deux ans ou plus était un prédicteur positif et statistiquement significatif de la procréation dans l'échantillon d'imputation multiple, mais n'était pas significatif lorsqu'on utilisait l'estimation du cas complet. La variance du coefficient "deux ans ou plus" était inférieure d'un tiers dans l'échantillon à imputation multiple par rapport à l'échantillon à cas complet. CONTRIBUTION En utilisant l'IM pour les observations censurées à gauche, les chercheurs utilisant des données de panel peuvent spécifier un modèle qui inclut les caractéristiques de l'historique des états ou des événements sans écarter les observations pour lesquelles ces informations ne sont que partiellement disponibles. En utilisant les méthodes conventionnelles, soit le modèle d'analyse doit être simplifié pour ignorer des informations potentiellement importantes sur l'histoire de l'état ou de l'événement (risquant ainsi une estimation biaisée), soit les cas avec des informations partielles doivent être éliminés de l'échantillon analytique (résultant en une estimation inefficace).
Éditeur
Max Planck Institute for Demographic Research
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr