Skip to Main content Skip to Navigation
Book sections

Leçons de l'annotation linguistique en dépendances de corpus écrits du français

Bruno Guillaume 1 Guy Perrier 1
1 SEMAGRAMME - Semantic Analysis of Natural Language
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Nous proposons ici quelques éléments de réflexion sur l'annotation linguistique de corpus, notamment en syntaxe et en sémantique. En s'appuyant sur notre expérience dans des projets d'annotation de corpus français, nous listons quelques-unes des difficultés pratiques qui sont récurrentes dans les différents projets. Nous présentons enfin des outils, basés sur la réécriture de graphes, qui permettent d'automatiser en partie les conversions entre différents formats de représentation linguistiques et qui peuvent être mis en oeuvre pour le développement de corpus ou pour leur exploitation.
Document type :
Book sections
Complete list of metadatas

Cited literature [14 references]  Display  Hide  Download

https://hal.inria.fr/hal-02267428
Contributor : Bruno Guillaume <>
Submitted on : Monday, August 19, 2019 - 11:47:50 AM
Last modification on : Thursday, December 19, 2019 - 11:52:12 AM
Document(s) archivé(s) le : Thursday, January 9, 2020 - 3:34:35 PM

File

main.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02267428, version 1

Collections

Citation

Bruno Guillaume, Guy Perrier. Leçons de l'annotation linguistique en dépendances de corpus écrits du français. Les corpus en sciences humaines et sociales, Presses Universitaires de Nancy, A paraître. ⟨hal-02267428⟩

Share

Metrics

Record views

66

Files downloads

447