Apprentissage non supervisé de la métrique du sol à l'aide des vecteurs propres de Wasserstein.

Auteurs
Date de publication
2021
Type de publication
Autre
Résumé Le transport optimal (OT) définit des distances de "Wasserstein" géométriquement significatives, utilisées dans des applications d'apprentissage automatique pour comparer des distributions de probabilité. Cependant, un goulot d'étranglement clé est la conception d'un coût " au sol " qui doit être adapté à la tâche étudiée. Dans la plupart des cas, l'apprentissage métrique supervisé n'est pas accessible, et l'on recourt généralement à une approche ad hoc. L'apprentissage métrique non supervisé est donc un problème fondamental pour permettre des applications du Transport Optimal basées sur les données. Dans cet article, nous proposons pour la première fois une réponse canonique en calculant le coût au sol comme un vecteur propre positif de la fonction reliant un coût aux distances OT par paire entre les entrées. Cette fonction est homogène et monotone, ce qui fait de l'apprentissage métrique non supervisé un problème non linéaire de Perron-Frobenius. Nous fournissons des critères pour assurer l'existence et l'unicité de ce vecteur propre. En outre, nous présentons une méthode de calcul évolutive utilisant la régularisation entropique, qui, dans la grande limite de régularisation, opère une réduction de la dimensionnalité de l'analyse en composantes principales. Nous présentons cette méthode sur des exemples et des ensembles de données synthétiques. Enfin, nous l'appliquons dans le contexte de la biologie à l'analyse d'un ensemble de données de séquençage d'ARN monocellulaire à haut débit (scRNAseq), afin d'améliorer le regroupement des cellules et de déduire les relations entre les gènes de manière non supervisée.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr