Estimation de la covariance affine invariante pour les distributions à queue lourde.

Auteurs
Date de publication
2019
Type de publication
Article de conférence
Résumé Dans ce travail, nous fournissons un estimateur pour la matrice de covariance d'une distribution multivariée à queue lourde. Nous prouvons que l'estimateur proposé $\widehat{\mathbf{S}}$ admet une limite \textit{affine-invariante} de la forme \[ (1-\varepsilon) \mathbf{S} \preccurlyeq \widehat{\mathbf{S}} \preccurlyeq (1+\varepsilon) \mathbf{S} \] avec une probabilité élevée, où $\mathbf{S}$ est la matrice de covariance inconnue, et $\preccurlyeq$ est l'ordre semi-défini positif sur les matrices symétriques. Le résultat ne requiert que l'existence de moments d'ordre 4, et autorise $\varepsilon = O(\sqrt{\kappa^4 d\log(d/\delta)/n})$ où $\kappa^4$ est une mesure de l'aplatissement de la distribution, $d$ est la dimensionnalité de l'espace, $n$ est la taille de l'échantillon, et $1-\delta$ est le niveau de confiance souhaité. De manière plus générale, on peut autoriser une régularisation avec le niveau $\lambda$, $d$ étant alors remplacé par le nombre de degrés de liberté. En désignant par $\text{cond}(\mathbf{S})$ le nombre de conditions de $\mathbf{S}$, le coût de calcul du nouvel estimateur est de $O(d^2 n + d^3\log(\text{cond}(\mathbf{S})))$, ce qui est comparable au coût de l'estimateur de covariance d'échantillon dans le régime statistiquement intéressant $n \ge d$. Nous considérons des applications de notre estimateur à l'estimation des valeurs propres avec une erreur relative, et à la régression ridge avec un plan aléatoire à queue lourde.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr