Modèle d'indexation de données peu symboliques dans des documents structurés : L'exemple du graphique dans un corpus de documents techniques

Leila Kefi 1 Catherine Berrut 1 Eric Gaussier 2
1 MRIM - Modélisation et Recherche d’Information Multimédia [Grenoble]
LIG - Laboratoire d'Informatique de Grenoble, Inria - Institut National de Recherche en Informatique et en Automatique
Résumé : Cet article s'intéresse à l'indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d'exploiter le contenu des données symboliques avoisinantes afin d'en extraire les fragments adéquats pour compléter l'indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d'une application dans un contexte professionnel : indexer les graphiques des documents techniques en exploitant le texte qui les accompagne. Cette indexation est articulée autour d'un modèle de représentation des graphiques tenant compte de la finalité de leur utilisation et du professionnalisme de leurs usagers, et d'un modèle d'extraction des termes d'indexation à partir du texte du document technique.
Type de document :
Communication dans un congrès
XXI congrés Inforsid, 2003, Nancy, pp.69--86, 2003
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00954064
Contributeur : Marie-Christine Fauvet <>
Soumis le : lundi 3 mars 2014 - 11:39:45
Dernière modification le : mardi 24 avril 2018 - 13:29:37
Document(s) archivé(s) le : samedi 31 mai 2014 - 10:54:22

Fichier

ArticleInforsid03.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00954064, version 1

Collections

Citation

Leila Kefi, Catherine Berrut, Eric Gaussier. Modèle d'indexation de données peu symboliques dans des documents structurés : L'exemple du graphique dans un corpus de documents techniques. XXI congrés Inforsid, 2003, Nancy, pp.69--86, 2003. 〈hal-00954064〉

Partager

Métriques

Consultations de la notice

198

Téléchargements de fichiers

92