Cheating a Parser to Death: Data-driven Cross-Treebank Annotation Transfer

Abstract : We present an efficient and accurate method for transferring annotations between two different treebanks of the same language. This method led to the creation of a new instance of the French Treebank (Abeillé et al., 2003), which follows the Universal Dependency annotation scheme and which was proposed to the participants of the CoNLL 2017 Universal Dependency parsing shared task (Zeman et al., 2017). Strong results from an evaluation on our gold standard (94.75% of LAS, 99.40% UAS on the test set) demonstrate the quality of this new annotated data set and validate our approach.
Type de document :
Communication dans un congrès
Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 2018, Miyazaki, Japan. 2018
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01798801
Contributeur : Benoît Sagot <>
Soumis le : mercredi 23 mai 2018 - 23:13:29
Dernière modification le : jeudi 21 février 2019 - 12:52:02
Document(s) archivé(s) le : vendredi 24 août 2018 - 23:33:26

Fichier

1101.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01798801, version 1

Citation

Djamé Seddah, Éric Villemonte de La Clergerie, Benoît Sagot, Hector Martinez Alonso, Marie Candito. Cheating a Parser to Death: Data-driven Cross-Treebank Annotation Transfer. Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 2018, Miyazaki, Japan. 2018. 〈hal-01798801〉

Partager

Métriques

Consultations de la notice

150

Téléchargements de fichiers

94