Experiments with a French-Romanian Word Alignment System.

Mirabela Navlea 1 Amalia Todirascu 2
1 LiLPa
LILPA - Linguistique, Langues et Parole
Résumé : L'article présente plusieurs expériences réalisées pour l'entrainement d'un système hybride d'alignement lexical. Le système combine méthodes statistiques et ressources linguistiques (base de règles héuristiques, dictionnaires électroniques). Les expériences évaluent la contribution de chaque ressource linguistique à l'amélioration du système. Nous avons utilisé comme système de base GIZA++ et nous ajoutons les cognats, les collocations et des règles héuristiques pour corriger les erreurs d'alignement. Pour notre expériences nous avons utilisé des corpus d'entrainement et d'evaluation du domaine juridique (DGT-TM). L'utilisation des ressources linguistiques améliore la qualité des résultats.
Type de document :
Chapitre d'ouvrage
Dan Tufiș, Vasile Rus, Corina Forăscu. Towards Multilingual Europe 2020: A Romanian Perspective, Editura Academiei Române, pp 225-240, 2013, ISBN 978-973-27-2282-4
Liste complète des métadonnées

https://hal.inria.fr/hal-00870251
Contributeur : Amalia Todirascu <>
Soumis le : dimanche 6 octobre 2013 - 17:04:29
Dernière modification le : mercredi 14 mars 2018 - 16:50:08

Identifiants

  • HAL Id : hal-00870251, version 1

Collections

Citation

Mirabela Navlea, Amalia Todirascu. Experiments with a French-Romanian Word Alignment System.. Dan Tufiș, Vasile Rus, Corina Forăscu. Towards Multilingual Europe 2020: A Romanian Perspective, Editura Academiei Române, pp 225-240, 2013, ISBN 978-973-27-2282-4. 〈hal-00870251〉

Partager

Métriques

Consultations de la notice

102