Technical aspects of Thesaurus Construction in TIPS

Jean-Pierre Chevallet 1
1 MRIM - Modélisation et Recherche d’Information Multimédia [Grenoble]
LIG - Laboratoire d'Informatique de Grenoble, Inria - Institut National de Recherche en Informatique et en Automatique
Abstract : This paper describes the work done in the TIPS project about the construction of a thesaurus. This construction is a merge from a compilation of data from several web sources. These data comes from manual work, some data are real thesaurus, other are indexing recommendations. The merge is done with automatically extracted terms from large text corpora. The automatic extraction is based on both syntax and statistics. We present in this paper the way thesaurus are built and the results on Scientific corpus in the context of the TIPS project. This short paper emphasis on some technical aspects.
Type de document :
Rapport
[Research Report] 2002
Liste complète des métadonnées

https://hal.inria.fr/hal-00954142
Contributeur : Marie-Christine Fauvet <>
Soumis le : vendredi 28 février 2014 - 16:14:23
Dernière modification le : mardi 24 avril 2018 - 13:29:36
Document(s) archivé(s) le : vendredi 30 mai 2014 - 15:43:28

Fichier

tips_thesaurus_technical.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00954142, version 1

Collections

Citation

Jean-Pierre Chevallet. Technical aspects of Thesaurus Construction in TIPS. [Research Report] 2002. 〈hal-00954142〉

Partager

Métriques

Consultations de la notice

151

Téléchargements de fichiers

52