Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2003

Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens

Résumé

Dans cet article, nous discutons de la construction des jeux d'étiquettes pour l'analyse morpho-syntaxique du vietnamien, en prenant en compte les spécificités linguistiques de cette langue. Cette construction est inspirée du modèle MULTEXT(*) dans le but de s'orienter vers les applications multilingues ainsi que la réutilisabilité des jeux d'étiquettes. Nous allons finalement décrire une expérimentation sur l'étiquetage lexical des textes vietnamiens en utilisant QTAG (Mason et Tufis, 1998), un étiqueteur probabiliste indépendant des langues. || This paper discusses part of speech (POS) tagset construction for Vietnamese by considering linguistic specificities of this language. We take into account the schema as defined in the MULTEXT(*) model, so as to account for possible multilingual applicati
Fichier principal
Vignette du fichier
A03-R-068.pdf (277.99 Ko) Télécharger le fichier
Loading...

Dates et versions

inria-00107642 , version 1 (13-01-2009)

Identifiants

  • HAL Id : inria-00107642 , version 1

Citer

Thi Minh Huyen Nguyen, Laurent Romary, Xuan Luong Vu. Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens. Traitement Automatique des Langues Naturelles - TALN'2003, ATALA (Association pour le Traitement Automatique des LAngues), Jun 2003, Batz-sur-mer, France. ⟨inria-00107642⟩
272 Consultations
790 Téléchargements

Partager

Gmail Facebook X LinkedIn More