Interaction à faible rang avec un modèle à effets additifs épars pour les grandes séries de données.

Auteurs
  • ROBIN Genevieve
  • WAI Hoi to
  • JOSSE Julie
  • KLOPP Olga
  • MOULINES Eric
Date de publication
2018
Type de publication
Article de conférence
Résumé De nombreuses applications de l'apprentissage automatique impliquent l'analyse de grands cadres de données - des matrices rassemblant des mesures hétérogènes (binaires, numériques, comptages, etc.) sur des échantillons - avec des valeurs manquantes. Les modèles à faible rang, tels qu'étudiés par Udell et al. [30], sont populaires dans ce cadre pour des tâches telles que la visualisation, le regroupement et l'imputation des valeurs manquantes. Cependant, les méthodes disponibles avec des garanties statistiques et une optimisation efficace ne permettent pas de modéliser explicitement les effets additifs principaux tels que les effets de ligne et de colonne, ou les effets de covariation. Dans cet article, nous introduisons un modèle LORIS (low-rank interaction and sparse additive effects) qui combine la régression matricielle sur un dictionnaire et un plan à faible rang, pour estimer simultanément les effets principaux et les interactions. Nous fournissons des garanties statistiques sous la forme de limites supérieures sur l'erreur d'estimation des deux composantes. Ensuite, nous introduisons une méthode de descente de gradient à coordonnées mixtes (MCGD) qui converge de manière sub-linéaire vers une solution optimale et qui est efficace en termes de calcul pour des ensembles de données à grande échelle. Nous montrons sur des données simulées et des données d'enquête que la méthode présente un net avantage par rapport aux pratiques actuelles, qui consistent à traiter séparément les effets additifs dans une étape de prétraitement.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr