Étiquetage morpho-syntaxique pour des mots nouveaux - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Poster Année : 2014

Étiquetage morpho-syntaxique pour des mots nouveaux

Résumé

Part-of-speech (POS) taggers are more or less robust with respect to the labeling of unknown words not found in the training corpus. It is important to know precisely how these tools perfom when we target part-of-speech tagging for formal neologisms. Indeed, grammatical category is an important criterion for both their identification and documentation. We present an evaluation and comparison of 7 POS taggers for French, based on a corpus built from Wiktionary. The results show that the use of form-related or morphological features supports the accurate tagging of new words.
Les outils d'étiquetage automatique sont plus ou moins robustes en ce qui concerne l'étiquetage de mots inconnus, non rencontrés dans le corpus d'apprentissage. Il est important de connaître de manière précise la performance de ces outils lorsqu'on cible plus particulièrement l'étiquetage de néologismes formels. En effet, la catégorie grammaticale constitue un critère important à la fois pour leur identification et leur documentation. Nous présentons une évaluation et une comparaison de 7 étiqueteurs morphosyntaxiques du français, à partir d'un corpus issu du Wiktionnaire. Les résultats montrent que l'utilisation de traits de forme ou morphologiques est favorable à l'étiquetage correct des mots nouveaux.
Fichier principal
Vignette du fichier
logo-tag1.pdf (118.67 Ko) Télécharger le fichier
logo-tag.pdf (288.12 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre

Dates et versions

hal-00998866 , version 1 (18-07-2014)

Identifiants

  • HAL Id : hal-00998866 , version 1

Citer

Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry. Étiquetage morpho-syntaxique pour des mots nouveaux. Brigitte Bigi. 21ème conférence sur le Traitement Automatique des Langues Naturelles, Jul 2014, Marseille, France. 21ème Traitement Automatique des Langues Naturelles, pp.431, 2014. ⟨hal-00998866⟩

Collections

SITE-ALSACE
312 Consultations
1452 Téléchargements

Partager

Gmail Facebook X LinkedIn More