IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information

Emmanuel Nauer 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Dans cet article, nous présentons un système hypertexte, nommé IntoWeb, qui fournit aux chercheurs ou spécialistes de l'information scientifique les moyens d'exploiter les données structurées sur leur domaine et des données - textuelles - du web pour des besoins de recherche d'information, d'analyse de leur domaine ou de veille. IntoWeb est un système générique d'exploitation de données qui implémente un processus complet et itératif d'extraction de connaissances à partir de données. Le système permet de manipuler différents types d'objets (documents structurés, documents textuels, vecteurs, classifications, etc.). Des opérateurs (génération d'un vecteur à partir d'un document textuel, classification de documents structurés, etc.) permettent d'exploiter chacun des différents types d'objets à des fins d'analyses ou de recherche d'information. L'application d'un opérateur sur un ensemble d'objets produit de nouveaux objets, à leur tour exploitable dans le système. La résolution complète d'un problème d'extraction de connaissances ou de recherche d'information prend la forme d'une succession d'opérations appliquées à des objets. Le choix des objets à exploiter et des opérations à appliquer à ces objets est à la charge de l'utilisateur et dépend du problème à résoudre ; l'enchaînement des opérations est grandement facilité par IntoWeb grâce à la mise en place d'une interface web simple à utiliser.
Type de document :
Communication dans un congrès
Cinquième colloque VSST (Veille Stratégique Scientifique & Technologique), 2007, Marrakech, Maroc. 2007
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00186705
Contributeur : Emmanuel Nauer <>
Soumis le : lundi 12 novembre 2007 - 08:54:11
Dernière modification le : jeudi 11 janvier 2018 - 06:19:54
Document(s) archivé(s) le : lundi 12 avril 2010 - 01:53:52

Fichier

NauerVsst2007.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00186705, version 1

Collections

Citation

Emmanuel Nauer. IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information. Cinquième colloque VSST (Veille Stratégique Scientifique & Technologique), 2007, Marrakech, Maroc. 2007. 〈inria-00186705〉

Partager

Métriques

Consultations de la notice

183

Téléchargements de fichiers

301