Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens

Thi Minh Huyen Nguyen 1 Laurent Romary 1 Xuan Luong Vu
1 LANGUE ET DIALOGUE - Human-machine dialogue with a significant language component
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Dans cet article, nous discutons de la construction des jeux d'étiquettes pour l'analyse morpho-syntaxique du vietnamien, en prenant en compte les spécificités linguistiques de cette langue. Cette construction est inspirée du modèle MULTEXT(*) dans le but de s'orienter vers les applications multilingues ainsi que la réutilisabilité des jeux d'étiquettes. Nous allons finalement décrire une expérimentation sur l'étiquetage lexical des textes vietnamiens en utilisant QTAG (Mason et Tufis, 1998), un étiqueteur probabiliste indépendant des langues. || This paper discusses part of speech (POS) tagset construction for Vietnamese by considering linguistic specificities of this language. We take into account the schema as defined in the MULTEXT(*) model, so as to account for possible multilingual applicati
Type de document :
Communication dans un congrès
Traitement Automatique des Langues Naturelles - TALN'2003, Jun 2003, Batz-sur-mer, France, 2003
Liste complète des métadonnées

Littérature citée [7 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00107642
Contributeur : Laurent Romary <>
Soumis le : mardi 13 janvier 2009 - 11:17:07
Dernière modification le : jeudi 11 janvier 2018 - 06:19:48
Document(s) archivé(s) le : jeudi 20 septembre 2012 - 12:05:36

Identifiants

  • HAL Id : inria-00107642, version 1

Collections

Citation

Thi Minh Huyen Nguyen, Laurent Romary, Xuan Luong Vu. Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens. Traitement Automatique des Langues Naturelles - TALN'2003, Jun 2003, Batz-sur-mer, France, 2003. 〈inria-00107642〉

Partager

Métriques

Consultations de la notice

325

Téléchargements de fichiers

570