Multilingual Projection for Parsing Truly Low-Resource Languageš

Abstract : We propose a novel approach to cross-lingual part-of-speech tagging and dependency parsing for truly low-resource languages. Our annotation projection-based approach yields tagging and parsing models for over 100 languages. All that is needed are freely available parallel texts, and taggers and parsers for resource-rich languages. The empirical evaluation across 30 test languages shows that our method consistently provides top-level accuracies , close to established upper bounds, and outperforms several competitive baselines.
Type de document :
Article dans une revue
Transactions of the Association for Computational Linguistics, 2016
Liste complète des métadonnées

https://hal.inria.fr/hal-01426754
Contributeur : Héctor Martínez Alonso <>
Soumis le : mercredi 4 janvier 2017 - 19:34:10
Dernière modification le : jeudi 26 avril 2018 - 10:28:01
Document(s) archivé(s) le : mercredi 5 avril 2017 - 15:30:16

Fichier

Q16-1022.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01426754, version 1

Collections

Citation

Zeljko Agic, Anders Johannsen, Barbara Plank, Héctor Martínez Alonso, Natalie Schluter, et al.. Multilingual Projection for Parsing Truly Low-Resource Languageš. Transactions of the Association for Computational Linguistics, 2016. 〈hal-01426754〉

Partager

Métriques

Consultations de la notice

160

Téléchargements de fichiers

103