Étiquetage multilingue en parties du discours avec MElt

Benoît Sagot 1
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
Résumé : Nous présentons des travaux récents réalisés autour de MElt, système discriminant d'étiquetage en parties du discours. MElt met l'accent sur l'exploitation optimale d'informations lexicales externes pour améliorer les performances des étiqueteurs par rapport aux modèles entraînés seulement sur des corpus annotés. Nous avons entraîné MElt sur plus d'une quarantaine de jeux de données couvrant plus d'une trentaine de langues. Comparé au système état-de-l'art MarMoT, MElt obtient en moyenne des résultats légèrement moins bons en l'absence de lexique externe, mais meilleurs lorsque de telles ressources sont disponibles, produisant ainsi des étiqueteurs état-de-l'art pour plusieurs langues.
Type de document :
Communication dans un congrès
23ème Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2016, Paris, France. 2016, 〈https://jep-taln2016.limsi.fr〉
Liste complète des métadonnées

Littérature citée [13 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01352243
Contributeur : Benoît Sagot <>
Soumis le : samedi 6 août 2016 - 15:46:48
Dernière modification le : samedi 9 juin 2018 - 10:30:06
Document(s) archivé(s) le : mardi 8 novembre 2016 - 18:19:00

Fichier

taln16melt.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01352243, version 1

Collections

Citation

Benoît Sagot. Étiquetage multilingue en parties du discours avec MElt. 23ème Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2016, Paris, France. 2016, 〈https://jep-taln2016.limsi.fr〉. 〈hal-01352243〉

Partager

Métriques

Consultations de la notice

282

Téléchargements de fichiers

146