Le Web : une source d'information pour l'intégration de multi-termes dans un processus de Recherche d'Information

Abstract : Web is a rich and diversified source of information. In this article, we propose to benefit from this richness to collect and analyze documents, with the aim of a relational indexation based on noun phrases. Proposed data processing chain includes a spider collecting data to build textual corpora, and a linguistic module analyzing text to extract information. Comparison of obtained corpus with corpus from Amaryllis conference shows the linguistic diversity of collected corpora, and particularly the richness of extracted noun phrases.
Type de document :
Communication dans un congrès
Journées Francophones d'Accès Intelligent aux Documents Multimédias sur l'Internet (MediaNet 2002), Jun 2002, Sousse, Tunisia. pp. 257-268, 2002
Liste complète des métadonnées

https://hal.inria.fr/inria-00326404
Contributeur : Dominique Vaufreydaz <>
Soumis le : jeudi 2 octobre 2008 - 21:40:51
Dernière modification le : jeudi 11 janvier 2018 - 06:14:32
Document(s) archivé(s) le : vendredi 4 juin 2010 - 12:09:13

Fichier

Haddad02a.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00326404, version 1

Collections

IMAG | UGA

Citation

Mohamed Hatem Haddad, Mathias Géry, Dominique Vaufreydaz. Le Web : une source d'information pour l'intégration de multi-termes dans un processus de Recherche d'Information. Journées Francophones d'Accès Intelligent aux Documents Multimédias sur l'Internet (MediaNet 2002), Jun 2002, Sousse, Tunisia. pp. 257-268, 2002. 〈inria-00326404〉

Partager

Métriques

Consultations de la notice

169

Téléchargements de fichiers

161