Noter les anomalies : une formulation par M-estimation.

Auteurs
Date de publication
2013
Type de publication
Article de conférence
Résumé L'objectif de cet article est de formuler le problème de la notation d'observations multivariées en fonction de leur degré d'anormalité/de nouveauté comme une tâche d'apprentissage non supervisé. Alors que dans la situation 1-d, ce problème peut être traité au moyen de techniques d'estimation de queue, les observations étant considérées comme d'autant plus "anormales" qu'elles sont situées loin dans la ou les queues de la distribution de probabilité sous-jacente. Dans une grande variété d'applications, il est souhaitable de disposer d'une fonction de "notation" à valeur scalaire permettant de comparer le degré d'anormalité d'observations multivariées. Nous formulons ici la question de la notation des anomalies comme un problème de M-estimation. Un critère de performance (fonctionnel) est proposé, dont les éléments optimaux sont, comme prévu, des transformées non décroissantes de la densité. La question de l'estimation empirique de ce critère est abordée et des résultats statistiques préliminaires relatifs à la précision des techniques basées sur les partitions pour optimiser les estimations empiriques de la mesure de performance empirique sont établis.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr