Un schéma de pondération des termes basé sur l'entropie et son application dans les moteurs de recherche de commerce électronique.

Auteurs
Date de publication
2015
Type de publication
Article de conférence
Résumé Les schémas de pondération des termes sont couramment utilisés dans le domaine de la recherche d'information pour extraire les termes les plus pertinents des documents. La principale contribution de cet article consiste à définir un nouveau schéma de pondération des termes basé sur l'entropie. Nous pensons que ce schéma est particulièrement bien adapté à la comparaison de requêtes provenant de sites de commerce électronique. Ces requêtes ont leurs propres spécificités. Elles ont tendance à être courtes et une grande partie d'entre elles sont des requêtes uniques, c'est-à-dire qu'elles n'ont pas d'historique. Nous affirmons que les schémas de pondération largement utilisés, tels que tf-idf, ne sont pas bien adaptés à ce type de requêtes. Cette affirmation est étayée par des expériences numériques où l'approche proposée, basée sur l'entropie, est incorporée dans un cadre de filtrage collaboratif. Dans ce cadre, bien adapté aux moteurs de recherche de commerce électronique, nous avons constaté, sur des données réelles d'achat de commerce électronique, que le schéma de pondération proposé surpasse le schéma de pondération tf-idf.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr