Apprentissage d'une hiérarchie de modèles à paires spécialisés pour la résolution de la coréférence

Emmanuel Lassalle 1 Pascal Denis 2
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
2 MAGNET - Machine Learning in Information Networks
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe
Résumé : Nous proposons une nouvelle méthode pour améliorer significativement la performance des modèles à paires de mentions pour la résolution de la coréférence. Étant donné un ensemble d'indicateurs, notre méthode apprend à séparer au mieux des types de paires de mentions en classes d'équivalence, chacune de celles-ci donnant lieu à un modèle de classification spécifique. La procédure algorithmique proposée trouve le meilleur espace de traits (créé à partir de combinaisons de traits élémentaires et d'indicateurs) pour discriminer les paires de mentions coréférentielles. Bien que notre approche explore un très vaste ensemble d'espaces de trait, elle reste efficace en exploitant la structure des hiérarchies construites à partir des indicateurs. Nos expériences sur les données anglaises de la CoNLL-2012 Shared Task indiquent que notre méthode donne des gains de performance par rapport au modèle initial utilisant seulement les traits élémentaires, et ce, quelque soit la méthode de formation des chaînes ou la métrique d'évaluation choisie. Notre meilleur système obtient une moyenne de 67.2 en F1-mesure MUC, B3 et CEAF ce qui, malgré sa simplicité, le situe parmi les meilleurs systèmes testés sur ces données.
Document type :
Conference papers
Complete list of metadatas

Cited literature [18 references]  Display  Hide  Download

https://hal.inria.fr/hal-00825617
Contributor : Emmanuel Lassalle <>
Submitted on : Sunday, June 9, 2013 - 6:53:33 PM
Last modification on : Thursday, February 21, 2019 - 10:52:55 AM
Long-term archiving on : Tuesday, September 10, 2013 - 2:20:09 AM

File

main.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00825617, version 1

Citation

Emmanuel Lassalle, Pascal Denis. Apprentissage d'une hiérarchie de modèles à paires spécialisés pour la résolution de la coréférence. TALN 2013 - 20ème conférence du Traitement Automatique du Langage Naturel 2013, Jun 2013, Les Sables-d'Olonne, France. ⟨hal-00825617⟩

Share

Metrics

Record views

525

Files downloads

631