Universal Dependencies for the AnCora treebanks

Abstract : Abstract: The present article describes the conversion of the Catalan and Spanish AnCora treebanks to the Universal Dependencies formalism. We describe the conversion process and assess the quality of the resulting treebank in terms of parsing accuracy by means of monolingual, cross-lingual and cross-domain parsing evaluation. The converted treebanks show an internal consistency comparable to the one shown by the original CoNLL09 distribution of AnCora, and indicate some differences in terms of multiword expression inventory with regards to the already existing UD Spanish treebank. The two new converted treebanks will be released in version 1.3 of Universal Dependencies.
Type de document :
Article dans une revue
Procesamiento del Lenguaje Natural, Sociedad Espanola para el Procesamiento del Lenguaje Natural, 2016, 〈http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/issue/view/220〉
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01426751
Contributeur : Héctor Martínez Alonso <>
Soumis le : mercredi 4 janvier 2017 - 19:21:45
Dernière modification le : jeudi 26 avril 2018 - 10:28:01
Document(s) archivé(s) le : mercredi 5 avril 2017 - 15:25:46

Fichier

5341-4677-1-PB.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01426751, version 1

Collections

Citation

Hector Martinez Alonso, Daniel Zeman. Universal Dependencies for the AnCora treebanks . Procesamiento del Lenguaje Natural, Sociedad Espanola para el Procesamiento del Lenguaje Natural, 2016, 〈http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/issue/view/220〉. 〈hal-01426751〉

Partager

Métriques

Consultations de la notice

140

Téléchargements de fichiers

63