Annotation des informations temporelles dans des textes en français. - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Annotation des informations temporelles dans des textes en français.

Résumé

Le traitement des informations temporelles est crucial pour la compréhension de textes en langue naturelle. Le langage de spécification TimeML a été conçu afin de permettre le repérage et la normalisation des expressions temporelles et des événements dans des textes écrits en anglais. L'objectif des divers projets TimeML a été de formuler un schéma d'annotation pouvant s'appliquer à du texte libre, comme ce que l'on trouve sur le Web, par exemple. Des efforts ont été faits pour l'application de TimeML à d'autres langues que l'anglais, notamment le chinois, le coréen, l'italien, l'espagnol et l'allemand. Pour le français, il y a eu des efforts allant dans ce sens, mais ils sont encore un peu éparpillés. Dans cet article, nous détaillons nos travaux actuels qui visent à élaborer des ressources complètes pour l'annotation de textes en français selon TimeML - notamment un guide d'annotation, un corpus de référence (Gold Standard) et des modules d'annotation automatique.

Domaines

Linguistique
Fichier principal
Vignette du fichier
AB-RECITAL-2008.pdf (115.77 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00522335 , version 1 (30-09-2010)

Identifiants

  • HAL Id : inria-00522335 , version 1

Citer

André Bittar. Annotation des informations temporelles dans des textes en français.. RECITAL 2008, Jun 2008, Avignon, France. ⟨inria-00522335⟩
147 Consultations
380 Téléchargements

Partager

Gmail Facebook X LinkedIn More