Inégalités de concentration pour les processus de classement à deux échantillons avec application au classement bipartite.

Auteurs
Date de publication
2021
Type de publication
Autre
Résumé La courbe ROC est l'étalon-or pour mesurer la performance d'une statistique de test/classement quant à sa capacité à discriminer entre deux populations statistiques dans une grande variété d'applications, allant de la détection d'anomalies dans le traitement du signal à la recherche d'informations, en passant par le diagnostic médical. La plupart des mesures de performance pratiques utilisées dans les applications de notation/classement, telles que l'AUC, l'AUC locale, la poussée p-normale, le DCG et autres, peuvent être considérées comme des résumés de la courbe ROC. Dans cet article, le fait que la plupart de ces critères empiriques peuvent être exprimés sous forme de statistiques de rang linéaire à deux échantillons est mis en évidence et des inégalités de concentration pour des collections de telles variables aléatoires, appelées ici processus de rang à deux échantillons, sont prouvées, lorsqu'elles sont indexées par des classes de fonctions de notation VC. Sur la base de ces limites nonasymptotiques, la capacité de généralisation des maximisateurs empiriques d'une large classe de critères de performance de classement est ensuite étudiée d'un point de vue théorique. Elle est également étayée par des preuves empiriques au moyen d'expériences numériques convaincantes.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr