Estimation plus rapide de la distance de Wasserstein avec la divergence de Sinkhorn.

Auteurs
Date de publication
2020
Type de publication
Autre
Résumé La distance de Wasserstein au carré est une quantité naturelle pour comparer des distributions de probabilité dans un cadre non paramétrique. Cette quantité est généralement estimée avec l'estimateur plug-in, défini via un problème de transport optimal discret. Ce problème peut être résolu avec une précision de $\epsilon$ en ajoutant une régularisation entropique d'ordre $\epsilon$ et en utilisant par exemple l'algorithme de Sinkhorn. Dans ce travail, nous proposons plutôt de l'estimer avec la divergence de Sinkhorn, qui est également construite sur une régularisation entropique mais inclut des termes de débiasing. Nous montrons que, pour des densités lisses, cet estimateur a une complexité d'échantillonnage comparable mais permet des niveaux de régularisation plus élevés, de l'ordre de $\epsilon^{1/2}$, ce qui conduit à des limites de complexité de calcul améliorées et à une forte accélération en pratique. Notre analyse théorique couvre le cas des densités échantillonnées aléatoirement et des discrétisations déterministes sur des grilles uniformes. Nous proposons et analysons également un estimateur basé sur l'extrapolation de Richardson de la divergence de Sinkhorn qui bénéficie de garanties améliorées en matière de statistique et d'efficacité de calcul, sous une condition de régularité de l'erreur d'approximation, qui est en particulier satisfaite pour les densités gaussiennes. Nous démontrons finalement l'efficacité des estimateurs proposés par des expériences numériques.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr