MOUGEOT Mathilde

< Retour à ILB Patrimoine
Thématiques des productions
Affiliations
  • 2019 - 2021
    Ecole normale supérieure de Paris-Saclay
  • 2012 - 2019
    Laboratoire de probabilités et modèles aléatoires
  • 2015 - 2019
    Centre de mathématiques et de leurs applications
  • 2019 - 2020
    Centre Borelli
  • 2019 - 2020
    Centre national de la recherche scientifique
  • 2018 - 2019
    Laboratoire de Probabilités, Statistique et Modélisation
  • 2015 - 2017
    Université Paris Diderot
  • 2015 - 2016
    Laboratoire polymères et matériaux avancés
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2013
  • Adaptation de domaine multi-source non supervisée pour la régression.

    Guillaume RICHARD, Antoine de MATHELIN, Georges HEBRAIL, Mathilde MOUGEOT, Nicolas VAYATIS
    Lecture Notes in Computer Science | 2021
    Pas de résumé disponible.
  • Apprentissage actif basé sur la discrépance pour l'adaptation au domaine.

    Antoine DE MATHELIN, Mathilde MOUGEOT, Nicolas VAYATIS
    2021
    L'objectif de cet article est de concevoir des stratégies d'apprentissage actif qui conduisent à une adaptation au domaine sous l'hypothèse d'un changement de domaine dans le cas d'une fonction d'étiquetage Lipschitz. En s'appuyant sur les travaux antérieurs de Mansour et al. (2009), nous adaptons le concept de distance de divergence entre les distributions source et cible pour restreindre la maximisation sur la classe d'hypothèses à une classe localisée de fonctions qui effectuent un étiquetage précis sur le domaine source. Nous dérivons des limites d'erreur de généralisation pour de telles stratégies d'apprentissage actif en termes de moyenne de Rademacher et de divergence localisée pour des fonctions de perte générales qui satisfont une condition de régularité. Des algorithmes pratiques sont déduits des limites théoriques, l'un est basé sur l'optimisation gloutonne et l'autre est un algorithme K-medoids. Nous fournissons également des versions améliorées des algorithmes pour traiter le cas des grands ensembles de données. Ces algorithmes sont compétitifs par rapport aux autres techniques d'apprentissage actif de pointe dans le contexte de l'adaptation au domaine, comme le montrent nos expériences numériques, en particulier sur de grands ensembles de données d'environ cent mille images.
  • Utilisation de méthodes d'apprentissage automatique pour améliorer la vitesse du vent de surface à partir des sorties d'un modèle numérique de prévision météorologique.

    Naveen GOUTHAM, Bastien ALONZO, Aurore DUPRE, Riwal PLOUGONVEN, Rebeca DOCTORS, Lishan LIAO, Mathilde MOUGEOT, Aurelie FISCHER, Philippe DROBINSKI
    Boundary-Layer Meteorology | 2021
    Pas de résumé disponible.
  • KFC : Une procédure d'apprentissage supervisé par grappes basée sur l'agrégation des distances.

    Sothea HAS, Aurelie FISCHER, Mathilde MOUGEOT
    Journal of Statistical Computation and Simulation | 2021
    Pas de résumé disponible.
  • Adaptation de domaine multi-source non supervisée pour la régression.

    Guillaume RICHARD, Antoine DE MATHELIN, Georges HEBRAIL, Mathilde MOUGEOT, Nicolas VAYATIS
    2020
    Nous considérons le problème de l'adaptation non supervisée du domaine à partir de sources multiples dans un contexte de régression. Nous proposons dans ce travail une méthode originale pour tirer profit de différentes sources en utilisant une combinaison pondérée des sources. Dans ce but, nous définissons une nouvelle mesure de similarité entre les probabilités pour l'adaptation de domaine que nous appelons hypothesis-discrepancy. Nous prouvons ensuite une nouvelle limite pour l'adaptation de domaine non supervisée combinant plusieurs sources. Nous dérivons de cette limite un nouvel algorithme d'adaptation de domaine contradictoire qui ajuste les poids donnés à chaque source, en s'assurant que les sources liées à la cible reçoivent des poids plus élevés. Enfin, nous évaluons notre méthode sur différents ensembles de données publiques et la comparons à d'autres bases d'adaptation de domaine pour démontrer l'amélioration pour les tâches de régression.
  • Pondération adversariale pour l'adaptation au domaine dans la régression.

    Antoine DE MATHELIN, Guillaume RICHARD, Mathilde MOUGEOT, Nicolas VAYATIS
    2020
    Nous présentons une nouvelle approche basée sur les instances pour traiter les tâches de régression dans le contexte de l'adaptation supervisée au domaine. L'approche développée dans cet article repose sur l'hypothèse que la tâche sur le domaine cible peut être apprise efficacement en repondérant de manière adéquate les instances sources pendant la phase de formation. Nous introduisons une nouvelle formulation de l'objectif d'optimisation pour l'adaptation de domaine qui repose sur une distance de divergence caractérisant la différence entre les domaines selon une tâche spécifique et une classe d'hypothèses. Pour résoudre ce problème, nous développons un algorithme de réseau contradictoire qui apprend à la fois le schéma de pondération de la source et la tâche en une seule descente de gradient vers l'avant. Nous fournissons des preuves numériques de la pertinence de la méthode sur des ensembles de données publiques pour l'adaptation des domaines grâce à des expériences reproductibles accessibles via une interface de démonstration en ligne.
  • Classification d'événements à partir de capteurs sols - Application au suivi de personnes fragiles.

    Ludovic MINVIELLE, Nicolas VAYATIS, Mathilde MOUGEOT, Bernadette DORIZZI, Amaury HABRARD, Francois CHARPILLET, Miguel COLOM, Amaury HABRARD, Francois CHARPILLET
    2020
    Cette thèse porte sur la détection d'événements dans des signaux issus de capteurs sols pour le suivi des personnes âgées. Au vu des questions pratiques, il semble en effet que les capteurs de pression situés au sol soient de bons candidats pour les activités de suivi, notamment la détection de chute. Les signaux à traiter étant complexes, il convient d’utiliser des modèles sophistiqués. Ainsi, afin de concevoir un détecteur de chutes, nous proposons une approche basée sur les forêts aléatoires, tout en répondant aux contraintes matérielles à l’aide d’une procédure de sélection des variables. Les performances sont améliorées à l’aide d’une méthode d’augmentation des données ainsi qu’à l'agrégation temporelle des réponses du modèle. Nous abordons ensuite la question de la confrontation de notre modèle au monde réel, avec des méthodes d'apprentissage par transfert qui agissent sur le modèle de base des forêts aléatoires, c'est-à-dire les arbres de décision. Ces méthodes sont des adaptations de travaux antérieurs aux nôtres et sont conçues pour aborder le problème de déséquilibre des classes, la chute étant un événement rare. Nous les testons sur plusieurs ensembles de données, montrant ainsi des résultats encourageants pour la suite, et une implémentation Python est mise à disposition. Enfin, motivés par la question du suivi des personnes âgées tout en traitant un signal unidimensionnel pour une grande zone, nous proposons de distinguer les personnes âgées des individus plus jeunes grâce à un modèle de réseau de neurones convolutifs et un apprentissage de dictionnaire. Les signaux à traiter étant principalement constitués de marches, la première brique du modèle est entraînée pour se focaliser sur les pas dans les signaux, et la seconde partie du modèle est entraînée séparément sur la tâche finale. Cette nouvelle approche de la classification de la marche permet de reconnaître avec efficacité les signaux issus de personnes âgées.
  • Modélisation hybride pour la prédiction de la durée de vie.

    Fikri HAFID, Maxime GUEGUIN, Vincent LAURENT, Mathilde MOUGEOT, Nicolas VAYATIS, Christine YANG, Jean michel GHIDAGLIA
    Lecture Notes in Mechanical Engineering | 2020
    Pas de résumé disponible.
  • Prévision de la consommation d'énergie des tâches basée sur les données de soumission RJMS dans les systèmes HPC.

    Theo SAILLANT, Jean christophe WEILL, Mathilde MOUGEOT
    High Performance Computing | 2020
    Pas de résumé disponible.
  • Apprentissage budgétaire basé sur les arbres équivalents et l'algorithme génétique : application à l'incorporation d'algorithmes de détection de chutes.

    Sergio PEIGNIER, Mounir ATIQ, Mathilde MOUGEOT
    2020
    L'apprentissage budgétaire est un domaine de recherche d'un intérêt croissant qui vise à inclure les contraintes de ressources du monde réel dans la conception des modèles d'apprentissage automatique, principalement pour réduire le temps de prédiction de l'environnement réel. Une façon courante de le faire est de modifier un modèle d'apprentissage automatique pré-entraîné, afin de s'adapter aux contraintes de temps de prédiction tout en conservant au mieux la qualité de prédiction du modèle. Cependant, dans ce cas, la performance de ce type de méthodes dépend de la structure du modèle pré-entraîné. Pour surmonter cette dépendance, nous proposons d'aborder le problème de l'optimisation budgétisée, en utilisant des modèles équivalents avec des structures différentes et donc des coûts de calcul différents. La contribution de ce travail est de proposer un algorithme génétique pour diminuer le temps de prédiction des classifieurs de forêt aléatoire, en utilisant des arbres de décision équivalents. La première étape de notre méthode consiste à construire, à partir d'une forêt aléatoire pré-entraînée, une population initiale de forêts aléatoires, qui partagent la même fonction de décision mais ont des structures différentes. Ensuite, une opération de réduction du génome, est appliquée de manière itérative sur les individus via des mutations basées sur l'élagage. Nos expériences montrent un impact important de l'utilisation d'arbres de décision équivalents sur les solutions de forêts aléatoires atteignables avec un temps de prédiction budgété. Les résultats obtenus sur des données synthétiques constituées de clusters de forme gaussienne et sur un jeu de données industriel réel de détection de chute, plaident pour l'utilisation de modèles de forêt aléatoire équivalents dans l'apprentissage budgétaire.
  • Tirer parti des perturbations numériques pour un monde équitable et sans danger pour le climat : L'agenda Dˆ2S : [Commentaire].

    Amy LUERS, Jennifer GARARD, Asun lera ST. CLAIR, Owen GAFFNEY, Tom HASSENBOEHLER, Lyse LANGLOIS, Mathilde MOUGEOT, Sasha LUCCIONI
    IEEE Technology and Society Magazine | 2020
    Pas de résumé disponible.
  • Quantized Variational Inference.Quantization Optimale pour l'inférence variationnelle.

    Amir DIB, Mathilde MOUGEOT
    2020
    Nous présentons l'inférence variationnelle quantifiée, un nouvel algorithme pour la minimisation de la limite inférieure de preuve. Nous montrons comment la Tesselation de Voronoï Optimale produit des gradients sans variance pour l'optimisation de l'Evidence Lower Bound (ELBO) au prix de l'introduction d'un biais asymptotiquement décroissant. Par la suite, nous proposons une méthode de type extrapolation de Richardson pour améliorer la limite asymptotique. Nous montrons que l'utilisation du cadre de l'inférence variationnelle quantifiée conduit à une convergence rapide pour la fonction de score et l'estimateur du gradient reparamétré à un coût de calcul comparable. Enfin, nous proposons plusieurs expériences pour évaluer les performances de notre méthode et ses limites.
  • La durabilité à l'ère numérique [Introduction au numéro spécial].

    Amy LUERS, Lyse LANGLOIS, Mathilde MOUGEOT, Sana KHARAGHANI, Alexandra LUCCIONI
    IEEE Technology and Society Magazine | 2020
    Pas de résumé disponible.
  • Analyse de données volumineuses dans le domaine du transport.

    Lena CAREL, Pierre ALQUIER, Mathilde MOUGEOT, Pierre ALQUIER, Mathilde MOUGEOT, Latifa OUKHELLOU, Yohann de CASTRO, Latifa OUKHELLOU
    2019
    L'objectif de cette thèse est de proposer de nouvelles méthodologies à appliquer aux données du transport public. En effet, nous sommes entourés de plus en plus de capteurs et d'ordinateurs générant d'énormes quantités de données. Dans le domaine des transports publics, les cartes sans contact génèrent des données à chaque fois que nous les utilisons, que ce soit pour les chargements ou nos trajets. Dans cette thèse, nous utilisons ces données dans deux buts distincts. Premièrement, nous voulions être capable de détecter des groupes de passagers ayant des habitudes temporelles similaires. Pour ce faire, nous avons commencé par utilisé la factorisation de matrices non-négatives comme un outil de pré-traitement pour la classification. Puis nous avons introduit l'algorithme NMF-EM permettant une réduction de la dimension et une classification de manière simultanée pour un modèle de mélange de distributions multinomiales. Dans un second temps, nous avons appliqué des méthodes de régression à ces données afin d'être capable de fournir une fourchette de ces validations probables. De même, nous avons appliqué cette méthodologie à la détection d'anomalies sur le réseau.
  • Agrégation à l'aide d'un compromis entre les entrées et les sorties.

    Aurelie FISCHER, Mathilde MOUGEOT
    Journal of Statistical Planning and Inference | 2019
    Dans cet article, nous introduisons une nouvelle stratégie d'apprentissage basée sur une idée séminale de Mojirsheibani (1999, 2000, 2002a, 2002b), qui a proposé une méthode intelligente pour combiner plusieurs classificateurs, en s'appuyant sur une notion de consensus. Dans de nombreuses méthodes d'agrégation, la prédiction pour une nouvelle observation x est calculée en construisant une combinaison linéaire ou convexe sur une collection d'estimateurs de base r1(x), . , rm(x) préalablement calibrés en utilisant un ensemble de données d'entraînement. Mojirsheibani propose de calculer la prédiction associée à une nouvelle observation en combinant des sorties sélectionnées des exemples d'apprentissage. La sortie d'un exemple d'apprentissage est sélectionnée si un certain consensus est observé : les prédictions calculées pour l'exemple d'apprentissage avec les différentes machines doivent être " similaires " à la prédiction de la nouvelle observation. Cette approche a été récemment étendue au contexte de la régression dans Biau et al. (2016). Dans le schéma original, la condition d'accord est en fait requise pour tous les estimateurs individuels, ce qui semble inadéquat s'il y a un mauvais estimateur initial. En pratique, quelques désaccords sont autorisés . pour établir les résultats théoriques, la proportion d'estimateurs satisfaisant la condition doit tendre vers 1. Dans cet article, nous proposons une procédure alternative, mélangeant les idées de consensus précédentes sur les prédictions avec la distance euclidienne calculée entre les entrées. Ceci peut être considéré comme une approche alternative permettant de réduire l'effet d'un éventuel mauvais estimateur dans la liste initiale, en utilisant une contrainte sur les entrées. Nous prouvons la cohérence de notre stratégie en classification et en régression. Nous fournissons également quelques expériences numériques sur des données simulées et réelles pour illustrer les avantages de cette nouvelle méthode d'agrégation. Dans l'ensemble, notre étude pratique montre que notre méthode peut être beaucoup plus performante que la technique de combinaison originale et, en particulier, présenter une variance bien moindre. Nous montrons également sur des exemples simulés que cette procédure de mélange des entrées et des sorties est toujours robuste aux entrées de haute dimension.
  • Apprentissage par transfert sur un arbre de décision avec déséquilibre des classes.

    Ludovic MINVIELLE, Mounir ATIQ, Sergio PEIGNIER, Mathilde MOUGEOT
    31st IEEE International Conference on Tools with Artificial Intelligence | 2019
    Pas de résumé disponible.
  • Apprentissage par transfert sur un arbre de décision avec déséquilibre des classes.

    Ludovic MINVIELLE, Mounir ATIQ, Sergio PEIGNIER, Mathilde MOUGEOT
    2019 IEEE 31st International Conference on Tools with Artificial Intelligence (ICTAI) | 2019
    Pas de résumé disponible.
  • Une procédure d'apprentissage supervisé par grappes basée sur l'agrégation des distances.

    Sothea HAS, Aurelie FISHER, Mathilde MOUGEOT
    2019
    De nos jours, de nombreuses procédures d'apprentissage automatique sont disponibles sur étagère et peuvent être utilisées facilement pour calibrer des modèles prédictifs sur des données supervisées. Cependant, lorsque les données d'entrée sont constituées de plus d'un groupe inconnu et que différents modèles prédictifs sous-jacents existent, l'ajustement d'un modèle est une tâche plus difficile. Nous proposons, dans cet article, une procédure en trois étapes pour résoudre automatiquement ce problème. La procédure KFC agrège différents modèles de manière adaptative sur les données. La première étape de la procédure vise à attraper la structure de clustering des données d'entrée, qui peuvent être caractérisées par plusieurs distributions statistiques. Elle fournit plusieurs partitions, compte tenu des hypothèses sur les distributions. Pour chaque partition, la deuxième étape ajuste un modèle prédictif spécifique basé sur les données de chaque cluster. Le modèle global est calculé par une agrégation consensuelle des modèles correspondant aux différentes partitions. Une comparaison des performances sur différentes données simulées et réelles évalue l'excellente performance de notre méthode dans une grande variété de problèmes de prédiction.
  • Représentations pour la détection d’anomalies : Application aux données vibratoires des moteurs d’avions.

    Mina ABDEL SAYED, Gilles FAY, Mathilde MOUGEOT, Nicolas VAYATIS, Mohamed EL BADAOUI, Jerome LACAILLE, Younes BENNANI, Nadine MARTIN
    2018
    Les mesures de vibrations sont l’une des données les plus pertinentes pour détecter des anomalies sur les moteurs. Les vibrations sont acquises sur banc d’essai en phase d’accélération et de décélération pour assurer la fiabilité du moteur à la sortie de la chaine de production. Ces données temporelles sont converties en spectrogrammes pour permettre aux experts d’effectuer une analyse visuelle de ces données et de détecter les différentes signatures atypiques. Les sources vibratoires correspondent à des raies sur les spectrogrammes. Dans cette thèse, nous avons mis en place un outil d’aide à la décision automatique pour analyser les spectrogrammes et détecter tout type de signatures atypiques, ces signatures ne proviennent pas nécessairement d’un endommagement du moteur. En premier lieu, nous avons construit une base de données numérique de spectrogrammes annotés. Il est important de noter que les signatures inusuelles sont variables en forme, intensité et position et se trouvent dans un faible nombre de données. Par conséquent, pour détecter ces signatures, nous caractérisons les comportements normaux des spectrogrammes, de manière analogue aux méthodes de détection de nouveautés, en représentant les patchs des spectrogrammes sur des dictionnaires comme les curvelets et la Non-negative matrix factorization (NMF), ainsi qu’en estimant la distribution de chaque point du spectrogramme à partir de données normales dépendamment ou non de leur voisinage. La détection des points atypiques est réalisée par comparaison des données tests au modèle de normalité estimé sur des données d’apprentissage normales. La détection des points atypiques permet la détection des signatures inusuelles composées par ces points.
  • Apprentissage de structures dans les valeurs extrêmes en grande dimension.

    Mael CHIAPINO, Francois ROUEFF, Anne SABOURIN, Florence d ALCHE BUC, Maud THOMAS, Jessica TRESSOU, Mathilde MOUGEOT, Patrice BERTAIL
    2018
    Nous présentons et étudions des méthodes d’apprentissage non-supervisé de phénomènes extrêmes multivariés en grande dimension. Dans le cas où chacune des distributions marginales d’un vecteur aléatoire est à queue lourde, l’étude de son comportement dans les régions extrêmes (i.e. loin de l’origine) ne peut plus se faire via les méthodes usuelles qui supposent une moyenne et une variance finies. La théorie des valeurs extrêmes offre alors un cadre adapté à cette étude, en donnant notamment une base théorique à la réduction de dimension à travers la mesure angulaire. La thèse s’articule autour de deux grandes étapes : - Réduire la dimension du problème en trouvant un résumé de la structure de dépendance dans les régions extrêmes. Cette étape vise en particulier à trouver les sous-groupes de composantes étant susceptible de dépasser un seuil élevé de façon simultané. - Modéliser la mesure angulaire par une densité de mélange qui suit une structure de dépendance déterminée à l’avance. Ces deux étapes permettent notamment de développer des méthodes de classification non-supervisée à travers la construction d’une matrice de similarité pour les points extrêmes.
  • Des sorties de la prévision météorologique numérique à la vitesse locale précise du vent de surface : modélisation et prévisions statistiques.

    Bastien ALONZO, Riwal PLOUGONVEN, Mathilde MOUGEOT, Aurelie FISCHER, Aurore DUPRE, Philippe DROBINSKI
    Renewable Energy: Forecasting and Risk Management | 2018
    Pas de résumé disponible.
  • Agrégation à l'aide d'un compromis entre les entrées et les sorties.

    Aurelie FISCHER, Mathilde MOUGEOT
    2018
    Dans cet article, nous introduisons une nouvelle stratégie d'apprentissage basée sur une idée séminale de Mojirsheibani (1999, 2000, 2002a, 2002b), qui a proposé une méthode intelligente pour combiner plusieurs classificateurs, en s'appuyant sur une notion de consensus. Dans de nombreuses méthodes d'agrégation, la prédiction pour une nouvelle observation x est calculée en construisant une combinaison linéaire ou convexe sur une collection d'estimateurs de base r1(x), . , rm(x) préalablement calibrés en utilisant un ensemble de données d'entraînement. Mojirsheibani propose de calculer la prédiction associée à une nouvelle observation en combinant des sorties sélectionnées des exemples d'apprentissage. La sortie d'un exemple d'apprentissage est sélectionnée si un certain consensus est observé : les prédictions calculées pour l'exemple d'apprentissage avec les différentes machines doivent être " similaires " à la prédiction de la nouvelle observation. Cette approche a été récemment étendue au contexte de la régression dans Biau et al. (2016). Dans le schéma original, la condition d'accord est en fait requise pour tous les estimateurs individuels, ce qui semble inadéquat s'il y a un mauvais estimateur initial. En pratique, quelques désaccords sont autorisés . pour établir les résultats théoriques, la proportion d'estimateurs satisfaisant la condition doit tendre vers 1. Dans cet article, nous proposons une procédure alternative, mélangeant les idées de consensus précédentes sur les prédictions avec la distance euclidienne calculée entre les entrées. Ceci peut être considéré comme une approche alternative permettant de réduire l'effet d'un éventuel mauvais estimateur dans la liste initiale, en utilisant une contrainte sur les entrées. Nous prouvons la cohérence de notre stratégie en classification et en régression. Nous fournissons également quelques expériences numériques sur des données simulées et réelles pour illustrer les avantages de cette nouvelle méthode d'agrégation. Dans l'ensemble, notre étude pratique montre que notre méthode peut être beaucoup plus performante que la technique de combinaison originale et, en particulier, présenter une variance bien moindre. Nous montrons également sur des exemples simulés que cette procédure de mélange des entrées et des sorties est toujours robuste aux entrées de haute dimension.
  • Régions climatiques homogènes à l'aide d'algorithmes d'apprentissage.

    Mathilde MOUGEOT, Dominique PICARD, Vincent LEFIEUX, Miranda MARCHAND
    Renewable Energy: Forecasting and Risk Management | 2018
    Pas de résumé disponible.
  • Détection des chutes à l'aide d'un capteur de sol intelligent et d'un apprentissage supervisé.

    Ludovic MINVIELLE, Mounir ATIQ, Renan SERRA, Mathilde MOUGEOT, Nicolas VAYATIS
    2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC) | 2017
    Pas de résumé disponible.
  • Apprentissage statistique pour l'énergie éolienne : Une étude de modélisation et de stabilité vers la prévision.

    Aurelie FISCHER, Lucie MONTUELLE, Mathilde MOUGEOT, Dominique PICARD
    Wind Energy | 2017
    Nous nous concentrons sur la modélisation de l'énergie éolienne à l'aide de techniques d'apprentissage automatique. Nous montrons sur des données réelles fournies par la société d'énergie éolienne Maïa Eolis, que les modèles paramétriques, même en suivant de près l'équation physique reliant la production éolienne à la vitesse du vent, sont surpassés par des algorithmes d'apprentissage intelligents. En particulier, l'algorithme CART-Bagging donne des résultats très stables et prometteurs. De plus, comme une étape vers la prévision, nous quantifions l'impact de l'utilisation de mesures de vent détériorées sur les performances. Nous montrons également sur cette application que la méthodologie par défaut de sélection d'un sous-ensemble de prédicteurs fournie dans le package standard de forêt aléatoire peut être affinée, en particulier lorsqu'il existe parmi les prédicteurs une variable qui a un impact majeur.
  • Assistance pour le maintien à domicile des personnes âgées avec des solutions de capteurs.

    Mathilde MOUGEOT, Julie OGER, Stephane BESSEAU
    Journées d'Etude sur la TéléSANté, 6ème edition | 2017
    L'adaptation de la société au vieillissement avec une croissance importante de la population de plus de 65 ans et avec leur désir de vieillir à domicile est une véritable révolution de la société, et doit être anticipée. Le développement récent des nouvelles technologies a permis l'émergence de nouveaux objets connectés. Notre travail conjoint avec la société PREDICAL et le laboratoire LPMA consiste à faire parler les données collectées par les IOT puis à aborder cette problématique de santé par un prisme mathématique. Pendant 18 mois, les maisons de 12 personnes âgées vivant seules, ont été équipées de capteurs de mouvement, d'accéléromètre, de température et de luminescence. Nous avons développé des algorithmes d'apprentissage automatique pour analyser les données d'événements collectées afin de fournir des indicateurs quotidiens pour suivre l'activité, le lien social, l'alimentation et la qualité du sommeil. Des méthodes statistiques ont été appliquées pour suivre ces indicateurs au fil des jours et pour déclencher une alarme si de fortes déviations par rapport aux comportements antérieurs ont été diagnostiquées. L'analyse des données fonctionnelles a également été introduite pour modéliser l'activité quotidienne et quantifier une modification potentielle de l'autonomie. Nous avons observé que pour tous les indicateurs étudiés, de fortes régularités émergent des données d'événements. Cette première conclusion montre qu'il est possible d'apprendre les habitudes de chaque personne âgée et de quantifier toute déviation de comportement. Il apparaît également que chaque senior a un profil d'activité unique. De plus, au cours de l'étude, nos algorithmes ont également été capables de quantifier la reprise d'activité d'une personne âgée après un retour d'hospitalisation. Cette information semble être extrêmement utile en complément du diagnostic médical. En conclusion, nos résultats obtenus dans ces environnements réels confirment le fort potentiel d'une telle approche capable de créer des indicateurs cohérents mesurant et suivant le degré d'autonomie d'une personne âgée. Ces indicateurs fournissent, en temps réel, des informations similaires à la grille AGIR utilisée pour quantifier le degré d'autonomie des personnes âgées par l'Institution française de santé. Dans nos prochains travaux, nous prévoyons d'analyser d'autres types de capteurs et d'élargir les études longitudinales à 50 personnes âgées.
  • Comparaison de dictionnaires pour la détection d'anomalies sur les spectrogrammes de moteurs d'avion.

    Mina ABDEL SAYED, Daniel DUCLOS, Gilles FAY, Jerome LACAILLE, Mathilde MOUGEOT
    Lecture Notes in Computer Science | 2016
    Pas de résumé disponible.
  • Décomposition basée sur NMF pour la détection d'anomalies appliquée à l'analyse des vibrations.

    Mina ABDEL SAYED, Daniel DUCLOS, Gilles FAY, Jerome LACAILLE, Mathilde MOUGEOT
    International Journal of Condition Monitoring | 2016
    Dans cet article, l'analyse des vibrations des moteurs d'avions civils dans un banc d'essai pour effectuer la détection des anomalies est considérée. Les mesures de vibrations à large bande passante contiennent des informations mécaniques essentielles concernant l'état du moteur et la localisation des dommages, le cas échéant. Dans ce cas, les données de vibration sont représentées par des spectrogrammes dans le domaine fréquentiel, qui sont des données à haute dimension comprenant à la fois du bruit instrumental et des informations non discriminantes. Des algorithmes automatiques de détection de dommages spécifiques sont utilisés afin de fournir un état de santé, mais ils sont difficiles à entraîner. Les experts de Snecma effectuent systématiquement une analyse visuelle pour confirmer l'état de santé du moteur. Pour développer une extraction automatique d'informations pertinentes dans ce contexte hautement dimensionnel, les auteurs proposent une nouvelle représentation des spectrogrammes basée sur une réduction de dimension sous les contraintes de positivité, connue sous le nom de factorisation matricielle non négative (NMF). Cette méthode est conforme à la physique. En retour, la détection est basée sur les distances dans l'espace réduit. L'algorithme est entraîné et testé avec des données réelles de vibrations de moteur, parmi lesquelles un moteur présente une signature représentative d'un roulement endommagé. La méthode donne des résultats encourageants.
  • Prévision des courbes de charge intra-journalières à l'aide de la régression fonctionnelle éparse.

    Mathilde MOUGEOT, Dominique PICARD, Vincent LEFIEUX, Laurence MAILLARD TEYSSIER
    Lecture Notes in Statistics | 2015
    Dans cet article, nous proposons une méthode de prédiction, la boîte de prédiction, basée sur un processus d'apprentissage clairsemé élaboré sur des informations de très haute dimension, qui sera capable d'inclure de nouvelles variables influentes - potentiellement de haute dimension - et de s'adapter à différents contextes de prédiction. Nous élaborons et testons cette méthode dans le cadre de la prédiction de la courbe de charge intra-journalière nationale française, sur une période de 7 ans, à partir d'une large base de données comprenant les consommations électriques quotidiennes françaises ainsi que de nombreuses données météorologiques, des relevés calendaires et des dictionnaires fonctionnels. La boîte de prédiction incorpore un grand nombre d'informations contextuelles provenant du passé, les organise de manière gérable par la construction d'une encyclopédie intelligente de scénarios, fournit des experts élaborant des stratégies de prédiction en comparant le jour en cours à des scénarios référents extraits de l'encyclopédie, puis harmonise les différents experts. Plus précisément, la boîte de prédiction est construite en utilisant des procédures d'apprentissage successives : élaboration d'une base de données de scénarios historiques organisée sur une haute dimension et apprentissage fonctionnel des courbes de charge intra-journalières, construction de prévisionnistes experts utilisant une tâche de recherche d'information parmi les scénarios, agrégation finale des experts. Les résultats sur les courbes de charge intra-journalières de la France montrent clairement les avantages de l'utilisation d'un modèle fonctionnel épars pour prévoir la consommation d'électricité. Ils semblent également correspondre assez bien à la connaissance métier des prévisionnistes de consommation et apportent même de nouvelles lumières sur le domaine.
  • Sloshing dans l'industrie du transport maritime de GNL : modélisation du risque par une analyse multivariée à queue lourde.

    Antoine DEMATTEO, Stephan CLEMENCON, Nicolas VAYATIS, Mathilde MOUGEOT
    2013
    Dans l'industrie du transport maritime de gaz naturel liquéfié (GNL), le phénomène de sloshing peut conduire à l'apparition de pressions très élevées dans les réservoirs du navire. La question de la modélisation ou de l'estimation de la probabilité de l'apparition simultanée de ces pressions extrêmes est désormais cruciale du point de vue de l'évaluation des risques. Dans cet article, la modélisation de la queue lourde, largement utilisée comme une approche conservatrice de l'évaluation des risques et correspondant à une analyse des risques de la pire éventualité, est appliquée à l'étude du sloshing. Des distributions multivariées à queue lourde sont considérées, avec des pressions de sloshing étudiées au moyen de répliques de réservoirs à petite échelle équipés de capteurs d >1. Lorsque l'on tente d'ajuster de tels modèles statistiques non paramétriques, on est naturellement confronté à des problèmes de calcul inhérents au phénomène de dimensionnalité. L'objectif principal de cet article est de surmonter cet obstacle en introduisant une nouvelle méthodologie. Pour les distributions à queue lourde de dimension d, la structure de la dépendance extrémale est entièrement caractérisée par la mesure angulaire, une mesure positive sur l'intersection d'une sphère avec l'orthant positif dans Rd. Lorsque d augmente, la dépendance extrémale mutuelle entre les variables devient difficile à évaluer. En se basant sur une approche de regroupement spectral, nous montrons ici comment une approximation de faible dimension de la mesure angulaire peut être trouvée. La méthode non paramétrique proposée pour le sloshing modèle a été appliquée avec succès aux données de pression. La représentation parcimonieuse ainsi obtenue s'avère très pratique pour la simulation de distributions multivariées à queue lourde, permettant la mise en œuvre de schémas de simulation de Monte-Carlo dans l'estimation de la probabilité de défaillance. Outre la confirmation de ses performances sur des données artificielles, la méthodologie a été mise en œuvre sur un ensemble de données réelles collectées spécifiquement pour l'évaluation des risques de sloshing dans l'industrie du transport maritime de GNL.
  • Stratégies de regroupement et seuillage pour les modèles linéaires à haute dimension : rejointement.

    Mathilde MOUGEOT, Dominique PICARD, Karine TRIBOULEY
    Journal of Statistical Planning and Inference | 2013
    Pas de résumé disponible.
  • Approximation grossière et ajustement des courbes de charge intrajournalières dans un cadre à haute dimension.

    Mathilde MOUGEOT, Dominique PICARD, Karine TRIBOULEY, Vincent LEFIEUX, Laurence MAILLARD TEYSSIER
    Advances in Adaptive Data Analysis | 2013
    Pas de résumé disponible.
  • Stratégies de regroupement et seuillage pour les modèles linéaires à haute dimension.

    Mathilde MOUGEOT, Dominique PICARD, Karine TRIBOULEY
    Journal of Statistical Planning and Inference | 2013
    Le problème de l'estimation dans un modèle de haute régression avec sparsité structurée est étudié. Un algorithme utilisant une procédure de seuillage par blocs en deux étapes appelée GR-LOL est fourni. Les taux de convergence sont produits : ils dépendent d'indices simples de type cohérence de la matrice de Gram - facilement vérifiables sur les données - ainsi que des hypothèses de sparsité des paramètres du modèle mesurés par une combinaison de l1 normes intra-blocs avec lq,q < 1 normes inter-blocs. La simplicité de l'indicateur de cohérence suggère des moyens d'optimiser les taux de convergence lorsque la structure du groupe n'est pas naturellement donnée par le problème et est inconnue. Dans un tel cas, une procédure auto-dirigée est fournie pour déterminer les groupes de régresseurs (nombre et contenu). Une étude pratique intensive compare nos méthodes de groupage avec l'algorithme standard LOL. Nous prouvons que le groupage détériore rarement les résultats mais peut les améliorer très significativement. GR-LOL est également comparé aux procédures de groupage LOL et présente un comportement très encourageant. Les résultats sont assez impressionnants, surtout lorsque l'algorithme GR-LOL est combiné avec un pré-traitement de regroupement.
Les affiliations sont détectées à partir des signatures des publications identifiées dans scanR. Un auteur peut donc apparaître affilié à plusieurs structures ou tutelles en fonction de ces signatures. Les dates affichées correspondent seulement aux dates des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr