Étiquetage morpho-syntaxique pour des mots nouveaux

Résumé : Les outils d'étiquetage automatique sont plus ou moins robustes en ce qui concerne l'étiquetage de mots inconnus, non rencontrés dans le corpus d'apprentissage. Il est important de connaître de manière précise la performance de ces outils lorsqu'on cible plus particulièrement l'étiquetage de néologismes formels. En effet, la catégorie grammaticale constitue un critère important à la fois pour leur identification et leur documentation. Nous présentons une évaluation et une comparaison de 7 étiqueteurs morphosyntaxiques du français, à partir d'un corpus issu du Wiktionnaire. Les résultats montrent que l'utilisation de traits de forme ou morphologiques est favorable à l'étiquetage correct des mots nouveaux.
Type de document :
Poster
Brigitte Bigi. 21ème conférence sur le Traitement Automatique des Langues Naturelles, Jul 2014, Marseille, France. 21ème Traitement Automatique des Langues Naturelles, pp.431, 2014
Liste complète des métadonnées

https://hal.inria.fr/hal-00998866
Contributeur : Ingrid Falk <>
Soumis le : vendredi 18 juillet 2014 - 22:45:52
Dernière modification le : mercredi 29 juin 2016 - 09:38:10
Document(s) archivé(s) le : jeudi 20 novembre 2014 - 16:08:21

Fichiers

Identifiants

  • HAL Id : hal-00998866, version 1

Collections

Citation

Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry. Étiquetage morpho-syntaxique pour des mots nouveaux. Brigitte Bigi. 21ème conférence sur le Traitement Automatique des Langues Naturelles, Jul 2014, Marseille, France. 21ème Traitement Automatique des Langues Naturelles, pp.431, 2014. 〈hal-00998866〉

Partager

Métriques

Consultations de la notice

479

Téléchargements de fichiers

830