Skip to Main content Skip to Navigation
Conference papers

Modèle d'indexation de données peu symboliques dans des documents structurés : L'exemple du graphique dans un corpus de documents techniques

Résumé : Cet article s'intéresse à l'indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d'exploiter le contenu des données symboliques avoisinantes afin d'en extraire les fragments adéquats pour compléter l'indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d'une application dans un contexte professionnel : indexer les graphiques des documents techniques en exploitant le texte qui les accompagne. Cette indexation est articulée autour d'un modèle de représentation des graphiques tenant compte de la finalité de leur utilisation et du professionnalisme de leurs usagers, et d'un modèle d'extraction des termes d'indexation à partir du texte du document technique.
Document type :
Conference papers
Complete list of metadatas

Cited literature [12 references]  Display  Hide  Download

https://hal.inria.fr/hal-00954064
Contributor : Marie-Christine Fauvet <>
Submitted on : Monday, March 3, 2014 - 11:39:45 AM
Last modification on : Friday, July 17, 2020 - 11:10:27 AM
Long-term archiving on: : Saturday, May 31, 2014 - 10:54:22 AM

File

ArticleInforsid03.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00954064, version 1

Collections

Citation

Leila Kefi, Catherine Berrut, Eric Gaussier. Modèle d'indexation de données peu symboliques dans des documents structurés : L'exemple du graphique dans un corpus de documents techniques. XXI congrés Inforsid, 2003, Nancy, pp.69--86. ⟨hal-00954064⟩

Share

Metrics

Record views

272

Files downloads

133