Une évaluation de l'impact des types de textes sur la tâche de segmentation thématique

Résumé : Cette étude a pour but de contribuer à la définition des objectifs de la segmentation thématique (ST), en incitant à prendre en considération le paramètre du type de textes dans cette tâche. Notre hypothèse est que, si la ST est certes pertinente pour traiter certains textes dont l'organisation est bien thématique, elle n'est pas adaptée à la prise en compte d'autres modes d'organisation (temporelle, rhétorique), et ne peut pas être appliquée sans précaution à des textes tout-venants. En comparant les performances d'un système de ST sur deux corpus, à organisation thématique "forte" et "faible", nous montrons que cette tâche est effectivement sensible à la nature des textes.
Type de document :
Communication dans un congrès
Association pour le Traitement Automatique des Langues (ATALA). Traitement Automatique des Langues Naturelles - TALN 2010, Jul 2010, Montréal, Canada. 2010, 〈http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_60.pdf〉
Liste complète des métadonnées

https://hal.inria.fr/inria-00511605
Contributeur : Philippe Muller <>
Soumis le : mercredi 25 août 2010 - 15:01:09
Dernière modification le : jeudi 11 janvier 2018 - 06:21:34

Identifiants

  • HAL Id : inria-00511605, version 1

Collections

Citation

Clémentine Adam, Philippe Muller, Cécile Fabre. Une évaluation de l'impact des types de textes sur la tâche de segmentation thématique. Association pour le Traitement Automatique des Langues (ATALA). Traitement Automatique des Langues Naturelles - TALN 2010, Jul 2010, Montréal, Canada. 2010, 〈http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_60.pdf〉. 〈inria-00511605〉

Partager

Métriques

Consultations de la notice

369