Exploitation d'une ressource lexicale pour la construction d'un étiqueteur morpho-syntaxique état-de-l'art du français

Pascal Denis 1 Benoît Sagot 1
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
Résumé : Cet article présente MEltfr, un étiqueteur morpho-syntaxique automatique du français. Il repose sur un modèle probabiliste séquentiel qui bénéficie d'informations issues d'un lexique exogène, à savoir le Lefff . Evalué sur le FTB, MEltfr atteint un taux de précision de 97.75% (91.36% sur les mots inconnus) sur un jeu de 29 étiquettes. Ceci correspond à une diminution du taux d'erreur de 18% (36.1% sur les mots inconnus) par rapport au même modèle sans couplage avec le Lefff . Nous étudions plus en détail la contribution de cette ressource, au travers de deux séries d'expériences. Celles-ci font apparaître en particulier que la contribution des traits issus du Lefff est de permettre une meilleure couverture, ainsi qu'une modélisation plus fine du contexte droit des mots.
Type de document :
Communication dans un congrès
Traitement automatique des langues naturelles, Jul 2010, Montréal, Canada. 2010
Liste complète des métadonnées

https://hal.inria.fr/inria-00514364
Contributeur : Pascal Denis <>
Soumis le : jeudi 2 septembre 2010 - 08:57:46
Dernière modification le : samedi 9 juin 2018 - 10:30:06

Identifiants

  • HAL Id : inria-00514364, version 1

Collections

Citation

Pascal Denis, Benoît Sagot. Exploitation d'une ressource lexicale pour la construction d'un étiqueteur morpho-syntaxique état-de-l'art du français. Traitement automatique des langues naturelles, Jul 2010, Montréal, Canada. 2010. 〈inria-00514364〉

Partager

Métriques

Consultations de la notice

239