Modèles d'arbres de Markov cachés pour l'induction de classes sémantiques.

Auteurs
Date de publication
2013
Type de publication
Article de conférence
Résumé Dans cet article, nous proposons une nouvelle méthode d'induction de classes sémantiques. Tout d'abord, nous introduisons un modèle génératif de phrases, basé sur des arbres de dépendance et qui prend en compte l'homonymie. Notre modèle peut ainsi être considéré comme une généralisation du clustering de Brown. Deuxièmement, nous décrivons un algorithme efficace pour effectuer l'inférence et l'apprentissage dans ce modèle. Troisièmement, nous appliquons la méthode proposée sur deux grands ensembles de données (10^8$ tokens, 10^5$ types de mots), et nous démontrons que les classes induites par notre algorithme améliorent les performances par rapport au clustering de Brown sur la tâche de marquage supersens semi-supervisé et de reconnaissance d'entités nommées.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr