Extraction d'entités dans des collections évolutives - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

Extraction d'entités dans des collections évolutives

Résumé

The goal of our work is to use a set of reports and extract named entities, in our case the names of partners. Starting with an initial list of entities, we use a first set of documents to identify syntactic patterns that are then validated in a supervised learning phase on a set of annotated documents to perform a performance test. The complete collection is then explored. This approach comes from the one that is used in data extraction for semi-structured documents (wrappers) and do not need any linguistic ressources neither a large set for training. As our collection of documents evoluate, we hope that the performance of the extraction becomes better year after year.
Fichier principal
Vignette du fichier
etam.pdf (42.96 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

inria-00116910 , version 1 (28-11-2006)
inria-00116910 , version 2 (19-06-2007)
inria-00116910 , version 3 (13-07-2007)
inria-00116910 , version 4 (20-07-2007)

Identifiants

  • HAL Id : inria-00116910 , version 2
  • ARXIV : 0706.2797

Citer

Thierry Despeyroux, Eduardo Fraschini, Anne-Marie Vercoustre. Extraction d'entités dans des collections évolutives. 7ièmes Journées francophones Extraction et Gestion des Connaissances EGC 2007, Jan 2007, Namur, Belgique. ⟨inria-00116910v2⟩
109 Consultations
73 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More