Acquisition et structuration des connaissances en corpus : éléments méthodologiques

Résumé : Ce document présente une expérimentation réalisée dans le domaine de l'agriculture. Les travaux ont été menés dans le cadre du projet ILC sur l'analyse de l'information. L'objectif de cette expérimentation est de montrer comment l'exploitation de modules automatiques de traitement de la langue basés sur la terminologie peuvent être combinés avec des modules de classification pour faire émerger de corpus volumineux de textes, des classes de termes. Ces classes sont interprétables et instancient des modèles abstraits de connaissance du domaine de spécialité que nous avons retrouvés manuellement. Nous avons traité un corpus de 1386 résumés de notices bibliographiques en anglais. La chaîne linguistique opère également sur le français.
Type de document :
Rapport
[Rapport de recherche] RR-3198, INRIA. 1997
Liste complète des métadonnées

https://hal.inria.fr/inria-00073491
Contributeur : Rapport de Recherche Inria <>
Soumis le : mercredi 24 mai 2006 - 13:02:14
Dernière modification le : samedi 17 septembre 2016 - 01:06:53
Document(s) archivé(s) le : dimanche 4 avril 2010 - 21:58:53

Fichiers

Identifiants

  • HAL Id : inria-00073491, version 1

Collections

Citation

Chantal Muller, Xavier Polanco, Jean Royauté, Yannick Toussaint. Acquisition et structuration des connaissances en corpus : éléments méthodologiques. [Rapport de recherche] RR-3198, INRIA. 1997. 〈inria-00073491〉

Partager

Métriques

Consultations de la notice

422

Téléchargements de fichiers

364