Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique

Anca-Roxana Simon 1 Guillaume Gravier 1, * Pascale Sébillot 1
* Auteur correspondant
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : L'identification d'une structure thématique dans des données textuelles quelconques est une tâche difficile. La plupart des techniques existantes reposent soit sur la maximisation d'une mesure de cohésion lexicale au sein d'un segment, soit sur la détection de ruptures lexicales. Nous proposons une nouvelle technique combinant ces deux critères de manière à obtenir le meilleur compromis entre cohésion et rupture. Nous définissons un nouveau modèle probabiliste, fondé sur l'approche proposée par Utiyama et Isahara (2001), en préservant les propriétés d'indépendance au domaine et de faible a priori de cette dernière. Des évaluations sont menées sur des textes écrits et sur des transcriptions automatiques de la parole à la télévision, transcriptions qui ne respectent pas les normes des textes écrits, ce qui accroît la difficulté. Les résultats expérimentaux obtenus démontrent la pertinence de la combinaison des critères de cohésion et de rupture.
Type de document :
Communication dans un congrès
TALN - Conférence sur le traitement automatique des langues naturelles, Jun 2013, Les Sables d'Olonne, France. 2013, 〈http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-long-015.pdf〉
Liste complète des métadonnées

https://hal.inria.fr/hal-00844112
Contributeur : Patrick Gros <>
Soumis le : vendredi 12 juillet 2013 - 18:16:53
Dernière modification le : jeudi 11 janvier 2018 - 06:20:10

Identifiants

  • HAL Id : hal-00844112, version 1

Citation

Anca-Roxana Simon, Guillaume Gravier, Pascale Sébillot. Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique. TALN - Conférence sur le traitement automatique des langues naturelles, Jun 2013, Les Sables d'Olonne, France. 2013, 〈http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-long-015.pdf〉. 〈hal-00844112〉

Partager

Métriques

Consultations de la notice

1028