Modèles de classification non supervisée avec données manquantes non au hasard.
Auteurs
Date de publication
- LAPORTE Fabien
- BIERNACKI Christophe
- CELEUX Gilles
- JOSSE Julie
2019
Type de publication
Article de conférence
Résumé
La difficulté de prise en compte des données manquantes est souvent con-tournée en supposant que leur occurrence est due au hasard. Dans cette communication, nous envisageons que l'absence de certaines données n'est pas due au hasard dans le contexte de la classification non supervisée et nous proposons des modèles logistiques pour traduire le fait que cette occurrence peutêtre associéeà la classification cherchée. Nous privilégions différents modèles que nous estimons par le maximum de vraisemblance et nous analysons leurs caractéristiques au travers de leur application sur des données hospitalières.
Thématiques de la publication
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr