Acquisition et structuration des connaissances en corpus : éléments méthodologiques - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 1997

Acquisition et structuration des connaissances en corpus : éléments méthodologiques

Chantal Muller
  • Fonction : Auteur
  • PersonId : 833597
Xavier Polanco
  • Fonction : Auteur
Jean Royauté
  • Fonction : Auteur
  • PersonId : 756242
  • IdRef : 083152881
Yannick Toussaint
  • Fonction : Auteur

Résumé

Ce document présente une expérimentation réalisée dans le domaine de l'agriculture. Les travaux ont été menés dans le cadre du projet ILC sur l'analyse de l'information. L'objectif de cette expérimentation est de montrer comment l'exploitation de modules automatiques de traitement de la langue basés sur la terminologie peuvent être combinés avec des modules de classification pour faire émerger de corpus volumineux de textes, des classes de termes. Ces classes sont interprétables et instancient des modèles abstraits de connaissance du domaine de spécialité que nous avons retrouvés manuellement. Nous avons traité un corpus de 1386 résumés de notices bibliographiques en anglais. La chaîne linguistique opère également sur le français.
Fichier principal
Vignette du fichier
RR-3198.pdf (541.38 Ko) Télécharger le fichier

Dates et versions

inria-00073491 , version 1 (24-05-2006)

Identifiants

  • HAL Id : inria-00073491 , version 1

Citer

Chantal Muller, Xavier Polanco, Jean Royauté, Yannick Toussaint. Acquisition et structuration des connaissances en corpus : éléments méthodologiques. [Rapport de recherche] RR-3198, INRIA. 1997. ⟨inria-00073491⟩
217 Consultations
288 Téléchargements

Partager

Gmail Facebook X LinkedIn More