Conversion et améliorations de corpus du français annotés en Universal Dependencies - Archive ouverte HAL Access content directly
Journal Articles Revue TAL Year : 2019

Conversion et améliorations de corpus du français annotés en Universal Dependencies

Abstract

This paper describes an effort to improve the consistency of two French corpora annotated with the Universal Dependencies (UD) scheme. The Universal Dependencies project aims at building a syntactic dependency scheme which allows similar analyses for several different languages. We improved the annotations of the two French corpora to render them closer to the UD scheme, and evaluated the changes done to the corpora in terms of closeness to the UD scheme as well as of internal corpus consistency.
Cet article décrit l'effort d'amélioration de deux corpus du français annotés en dépendances syntaxiques, qui s'inscrit dans le cadre du projet Universal Dependencies (UD) qui vise à élaborer un schéma d'annotation syntaxique permettant d'analyser de façon similaire plusieurs langues différentes. Nous avons cherché à rendre plus conformes au schéma UD ces deux corpus du français, et nous avons évalué l'impact des modifications apportées aux corpus sur la conformité avec le schéma UD et la cohérence interne de leur annotation.
Fichier principal
Vignette du fichier
UD_French.pdf (712.23 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-02267418 , version 1 (19-08-2019)

Identifiers

  • HAL Id : hal-02267418 , version 1

Cite

Bruno Guillaume, Marie-Catherine de Marneffe, Guy Perrier. Conversion et améliorations de corpus du français annotés en Universal Dependencies. Revue TAL, 2019, 60 (2), pp.71-95. ⟨hal-02267418⟩
226 View
516 Download

Share

Gmail Facebook Twitter LinkedIn More