Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens

Thi Minh Huyen Nguyen 1 Laurent Romary 1 Xuan Luong Vu
1 LANGUE ET DIALOGUE - Human-machine dialogue with a significant language component
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Dans cet article, nous discutons de la construction des jeux d'étiquettes pour l'analyse morpho-syntaxique du vietnamien, en prenant en compte les spécificités linguistiques de cette langue. Cette construction est inspirée du modèle MULTEXT(*) dans le but de s'orienter vers les applications multilingues ainsi que la réutilisabilité des jeux d'étiquettes. Nous allons finalement décrire une expérimentation sur l'étiquetage lexical des textes vietnamiens en utilisant QTAG (Mason et Tufis, 1998), un étiqueteur probabiliste indépendant des langues. || This paper discusses part of speech (POS) tagset construction for Vietnamese by considering linguistic specificities of this language. We take into account the schema as defined in the MULTEXT(*) model, so as to account for possible multilingual applicati
Document type :
Conference papers
Complete list of metadatas

Cited literature [7 references]  Display  Hide  Download

https://hal.inria.fr/inria-00107642
Contributor : Laurent Romary <>
Submitted on : Tuesday, January 13, 2009 - 11:17:07 AM
Last modification on : Friday, March 22, 2019 - 2:22:07 PM
Long-term archiving on : Thursday, September 20, 2012 - 12:05:36 PM

Identifiers

  • HAL Id : inria-00107642, version 1

Collections

Citation

Thi Minh Huyen Nguyen, Laurent Romary, Xuan Luong Vu. Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens. Traitement Automatique des Langues Naturelles - TALN'2003, ATALA (Association pour le Traitement Automatique des LAngues), Jun 2003, Batz-sur-mer, France. ⟨inria-00107642⟩

Share

Metrics

Record views

344

Files downloads

653