Sélection de modèles adaptatifs bayésiens SLOPE-High-dimensional avec des valeurs manquantes.

Auteurs
  • JIANG Wei
  • BOGDAN Malgorzata
  • JOSSE Julie
  • MIASOJEDOW Blazej
  • ROCKOVA Veronika
Date de publication
2020
Type de publication
Autre
Résumé Nous considérons le problème de la sélection de variables dans des contextes à haute dimension avec des observations manquantes parmi les covariables. Pour aborder ce problème relativement peu étudié, nous proposons une nouvelle procédure synergique -- adaptive Bayesian SLOPE -- qui combine efficacement la méthode SLOPE (régularisation l1 triée) avec la méthode Spike-and-Slab LASSO. Nous positionnons notre approche dans un cadre bayésien qui permet la sélection simultanée des variables et l'estimation des paramètres, malgré les valeurs manquantes. Comme avec la méthode Spike-and-Slab LASSO, les coefficients sont considérés comme provenant d'un modèle hiérarchique composé de deux groupes : (1) le spike pour les inactifs et (2) le slab pour les actifs. Cependant, au lieu d'assigner des priorités de pics indépendantes pour chaque covariable, nous déployons ici une priorité de pics conjointe "SLOPE" qui prend en compte l'ordre des magnitudes des coefficients afin de contrôler les fausses découvertes. Grâce à de nombreuses simulations, nous démontrons des performances satisfaisantes en termes de puissance, de FDR et de biais d'estimation dans un large éventail de scénarios. Enfin, nous analysons un jeu de données réel composé de patients des hôpitaux de Paris ayant subi un traumatisme sévère, où nous montrons d'excellentes performances dans la prédiction des niveaux de plaquettes. Notre méthodologie a été implémentée en C++ et intégrée dans un package R ABSLOPE pour une utilisation publique.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr