Étiquetage morpho-syntaxique pour des mots nouveaux - Archive ouverte HAL Access content directly
Poster Communications Year : 2014

Étiquetage morpho-syntaxique pour des mots nouveaux

(1) , (1) , (1) , (1)
1

Abstract

Part-of-speech (POS) taggers are more or less robust with respect to the labeling of unknown words not found in the training corpus. It is important to know precisely how these tools perfom when we target part-of-speech tagging for formal neologisms. Indeed, grammatical category is an important criterion for both their identification and documentation. We present an evaluation and comparison of 7 POS taggers for French, based on a corpus built from Wiktionary. The results show that the use of form-related or morphological features supports the accurate tagging of new words.
Les outils d'étiquetage automatique sont plus ou moins robustes en ce qui concerne l'étiquetage de mots inconnus, non rencontrés dans le corpus d'apprentissage. Il est important de connaître de manière précise la performance de ces outils lorsqu'on cible plus particulièrement l'étiquetage de néologismes formels. En effet, la catégorie grammaticale constitue un critère important à la fois pour leur identification et leur documentation. Nous présentons une évaluation et une comparaison de 7 étiqueteurs morphosyntaxiques du français, à partir d'un corpus issu du Wiktionnaire. Les résultats montrent que l'utilisation de traits de forme ou morphologiques est favorable à l'étiquetage correct des mots nouveaux.
Fichier principal
Vignette du fichier
logo-tag1.pdf (118.67 Ko) Télécharger le fichier
Vignette du fichier
logo-tag.pdf (288.12 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Format : Other

Dates and versions

hal-00998866 , version 1 (18-07-2014)

Identifiers

  • HAL Id : hal-00998866 , version 1

Cite

Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry. Étiquetage morpho-syntaxique pour des mots nouveaux. Brigitte Bigi. 21ème conférence sur le Traitement Automatique des Langues Naturelles, Jul 2014, Marseille, France. 21ème Traitement Automatique des Langues Naturelles, pp.431, 2014. ⟨hal-00998866⟩

Collections

SITE-ALSACE
251 View
1367 Download

Share

Gmail Facebook Twitter LinkedIn More