Extraction de connaissances à partir de textes structurés

Yannick Toussaint 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cet article propose un schéma général d'extraction de connaissances à partir de textes et situe la fouille de textes comme une étape particulière d'un processus complexe. Notre position est que tout processus de fouille de textes doit nécessairement exploiter un modèle de connaissances et qu'il est essentiel d'extraire des textes des informations structurées auxquelles peut être associée une sémantique. De ce fait, nous nous intéressons tout particulièrement à la structure des textes, structure devant être prise dans un sens très général qui va d'une structuration physique (hiérarchique) à une structuration cognitive ou sémantique. Nous montrons comment ces différentes dimensions du document et du texte peuvent ou pourraient être prises en compte pour que le processus dans son ensemble soit incrémental, c'est-à-dire qu'il soit initialisé avec un ensemble de connaissances réduit qui augmente au fur et à mesure des boucles de traitement. || This paper proposes a global schema for Knowledge Discovery in Texts and presents Text Mining as a specific step of the overall process. We argue that any text mining process should rely on a knowledge model, and that it is crucial for the information ex
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2004, 8 (3), pp.11-34
Liste complète des métadonnées

https://hal.inria.fr/inria-00100202
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 10:15:28
Dernière modification le : jeudi 11 janvier 2018 - 06:19:52

Identifiants

  • HAL Id : inria-00100202, version 1

Collections

Citation

Yannick Toussaint. Extraction de connaissances à partir de textes structurés. Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2004, 8 (3), pp.11-34. 〈inria-00100202〉

Partager

Métriques

Consultations de la notice

195