Analyse multirésolution de classements incomplets avec applications à la prédiction.

Auteurs
Date de publication
2014
Type de publication
Article de conférence
Résumé Les données représentant les préférences des utilisateurs sont un exemple typique des Big Datasets que les technologies modernes, telles que les portails de commerce électronique, permettent désormais de collecter, de manière explicite ou implicite. Ces données sont très complexes, dans la mesure où le nombre d'articles n pour lesquels les utilisateurs peuvent éventuellement exprimer leurs préférences est explosif et où la collection d'articles ou de produits qu'un utilisateur donné examine effectivement et est capable de comparer est très variable et d'une cardinalité extrêmement faible par rapport à n. C'est l'objectif principal de cet article que de promouvoir une nouvelle représentation des données de préférence, considérées comme des classements incomplets. Contrairement aux approches alternatives, la nature même des données de préférence est préservée par l'"analyse multi-échelle" que nous proposons, identifiant ici l'"échelle" à l'ensemble des éléments sur lesquels les préférences sont exprimées, et dont la construction repose sur des résultats récents en topologie algébrique. La représentation des données de préférence qu'elle fournit présente des similitudes avec l'analyse multirésolution en ondelettes sur un espace euclidien et peut être calculée à un coût raisonnable compte tenu de la complexité des données originales. Au-delà des avantages informatiques et théoriques, il est démontré que la transformée "similaire aux ondelettes" comprime les données de préférence en un nombre relativement faible de coefficients de base et facilite ainsi les tâches statistiques telles que l'estimation ou la prédiction de la distribution. Ceci est illustré ici par des travaux empiriques très encourageants basés sur des ensembles de données réelles de référence populaires.
Éditeur
IEEE
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr