La saillance référentielle pour la détection des thèmes

Laurence Longo 1 Amalia Todirascu 1
1 LiLPa
EA 1339 - UMB - Linguistique, Langues et Parole (LILPA)
Résumé : Nous présentons un système de détection automatique de thèmes pour le français qui utilise deux marqueurs de cohésion : les marqueurs lexicaux de surface et les marqueurs référentiels, tels que les chaînes de référence. Notre étude se focalise plus spécifiquement sur l'identification automatique des chaînes de référence qui permet de déterminer le référent le plus saillant dans une portion textuelle. Dans la lignée de méthodes symboliques de calcul de la référence, nous proposons une nouvelle méthode de calcul basée sur la saillance des expressions référentielles. Pour chaque candidat, la saillance est fixe et la méthode de calcul prend en compte trois éléments : une hiérarchie d'expressions référentielles basée sur la théorie de l'accessibilité, des paramètres liés au genre textuel et la fonction syntaxique de chaque expression. De plus, les candidats antécédent-anaphore vérifient une série de contraintes lexicales, morpho-syntaxiques et sémantiques. L'identification des thèmes d'un document s'effectue alors en regroupant les chaînes de référence dont la tête lexicale est similaire.
Type de document :
Chapitre d'ouvrage
Boisseau Maryvonne and Hamm Albert. Saillance (2) : La saillance en langue et en discours, Presses Universitaires de Franche-Comté, 2015
Liste complète des métadonnées

https://hal.inria.fr/hal-00870259
Contributeur : Amalia Todirascu <>
Soumis le : dimanche 6 octobre 2013 - 17:23:15
Dernière modification le : jeudi 14 décembre 2017 - 09:56:58

Identifiants

  • HAL Id : hal-00870259, version 1

Collections

Citation

Laurence Longo, Amalia Todirascu. La saillance référentielle pour la détection des thèmes. Boisseau Maryvonne and Hamm Albert. Saillance (2) : La saillance en langue et en discours, Presses Universitaires de Franche-Comté, 2015. 〈hal-00870259〉

Partager

Métriques

Consultations de la notice

181