Entre corpus et théorie : l'annotation (co)référentielle

Susanne Salmon-Alt 1
1 LANGUE ET DIALOGUE - Human-machine dialogue with a significant language component
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : La conception de systèmes automatiques dédiés à la résolution d'anaphores et, plus largement, à l'interprétation d'expressions référentielles reste un problème difficile : pour l'instant, la grande diversité des schémas d'annotation (co)référentielle ainsi que le peu de ressources françaises annotées peuvent être considérés comme symptomatiques. Les principales difficultés d'annotation sont le marquage des liens autres que purement coréférentiels (non identité des référents : " trois triangles " - " le premier ") et la non prise en compte d'informations autres que purement discursives (" le premier " référant à un objet accessible dans l'environnement visuel). Nous proposons alors un schéma d'annotation modulaire qui permet de rendre compte de façon unitaire des liens coréférentiels de différents types ainsi que des liens référentiels. Le schéma a été mis en oeuvre par des méta-schémas XML et appliqué à l'annotation d'un corpus de dialogues finalisés.
Type de document :
Article dans une revue
Traitement Automatique des Langues, ATALA, 2001, 42 (2), pp.459-485
Liste complète des métadonnées

https://hal.inria.fr/inria-00100603
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 14:48:04
Dernière modification le : jeudi 11 janvier 2018 - 06:19:48

Identifiants

  • HAL Id : inria-00100603, version 1

Collections

Citation

Susanne Salmon-Alt. Entre corpus et théorie : l'annotation (co)référentielle. Traitement Automatique des Langues, ATALA, 2001, 42 (2), pp.459-485. 〈inria-00100603〉

Partager

Métriques

Consultations de la notice

101