Apprentissage d'une hiérarchie de modèles à paires spécialisés pour la résolution de la coréférence

Emmanuel Lassalle 1 Pascal Denis 2
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
2 MAGNET - Machine Learning in Information Networks
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe
Résumé : Nous proposons une nouvelle méthode pour améliorer significativement la performance des modèles à paires de mentions pour la résolution de la coréférence. Étant donné un ensemble d'indicateurs, notre méthode apprend à séparer au mieux des types de paires de mentions en classes d'équivalence, chacune de celles-ci donnant lieu à un modèle de classification spécifique. La procédure algorithmique proposée trouve le meilleur espace de traits (créé à partir de combinaisons de traits élémentaires et d'indicateurs) pour discriminer les paires de mentions coréférentielles. Bien que notre approche explore un très vaste ensemble d'espaces de trait, elle reste efficace en exploitant la structure des hiérarchies construites à partir des indicateurs. Nos expériences sur les données anglaises de la CoNLL-2012 Shared Task indiquent que notre méthode donne des gains de performance par rapport au modèle initial utilisant seulement les traits élémentaires, et ce, quelque soit la méthode de formation des chaînes ou la métrique d'évaluation choisie. Notre meilleur système obtient une moyenne de 67.2 en F1-mesure MUC, B3 et CEAF ce qui, malgré sa simplicité, le situe parmi les meilleurs systèmes testés sur ces données.
Type de document :
Communication dans un congrès
TALN 2013 - 20ème conférence du Traitement Automatique du Langage Naturel 2013, Jun 2013, Les Sables-d'Olonne, France. 2013
Liste complète des métadonnées

Littérature citée [18 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00825617
Contributeur : Emmanuel Lassalle <>
Soumis le : dimanche 9 juin 2013 - 18:53:33
Dernière modification le : mardi 11 octobre 2016 - 13:50:09
Document(s) archivé(s) le : mardi 10 septembre 2013 - 02:20:09

Fichier

main.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00825617, version 1

Citation

Emmanuel Lassalle, Pascal Denis. Apprentissage d'une hiérarchie de modèles à paires spécialisés pour la résolution de la coréférence. TALN 2013 - 20ème conférence du Traitement Automatique du Langage Naturel 2013, Jun 2013, Les Sables-d'Olonne, France. 2013. 〈hal-00825617〉

Partager

Métriques

Consultations de la notice

442

Téléchargements de fichiers

344