Analyse automatique de documents botaniques: le projet Biotim

Résumé : À l'heure actuelle, seule une infime partie des connaissances sur la biodiversité sont numérisées. L'écrasante majorité se trouve toujours sous forme de documents papier uniquement, et la saisie manuelle de cette information n'est guère envisageable. Pourtant, la forme hautement structurée de ces documents se prête aisément à l'extraction informatisée. Le projet Biotim essaye justement de s'attaquer à ce problème, en réunissant différentes équipes spécialisées dans l'analyse automatique du texte et de l'image. Cet article présente le travail mené au sein de l'équipe Atoll, concernant l'analyse du langage, et plus particulièrement l'extraction terminologique, en exposant l'originalité du sujet et l'état d'avancement actuel des travaux.
Document type :
Conference papers
Complete list of metadatas

Cited literature [5 references]  Display  Hide  Download

https://hal.inria.fr/inria-00000119
Contributor : Eric Villemonte de la Clergerie <>
Submitted on : Monday, June 20, 2005 - 1:10:16 PM
Last modification on : Thursday, February 7, 2019 - 3:45:39 PM
Long-term archiving on : Thursday, April 1, 2010 - 9:43:46 PM

Identifiers

  • HAL Id : inria-00000119, version 1

Collections

Citation

Rousse Guillaume, Éric Villemonte de la Clergerie. Analyse automatique de documents botaniques: le projet Biotim. proc. of TIA'05 : Journées "Terminologie & Intelligence Artificielle, Apr 2005, Rouen, France, France. ⟨inria-00000119⟩

Share

Metrics

Record views

101

Files downloads

131