IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information

Emmanuel Nauer

Résumé

Dans cet article, nous présentons un système hypertexte, nommé IntoWeb, qui fournit aux chercheurs ou spécialistes de l'information scientifique les moyens d'exploiter les données structurées sur leur domaine et des données - textuelles - du web pour des besoins de recherche d'information, d'analyse de leur domaine ou de veille. IntoWeb est un système générique d'exploitation de données qui implémente un processus complet et itératif d'extraction de connaissances à partir de données. Le système permet de manipuler différents types d'objets (documents structurés, documents textuels, vecteurs, classifications, etc.). Des opérateurs (génération d'un vecteur à partir d'un document textuel, classification de documents structurés, etc.) permettent d'exploiter chacun des différents types d'objets à des fins d'analyses ou de recherche d'information. L'application d'un opérateur sur un ensemble d'objets produit de nouveaux objets, à leur tour exploitable dans le système. La résolution complète d'un problème d'extraction de connaissances ou de recherche d'information prend la forme d'une succession d'opérations appliquées à des objets. Le choix des objets à exploiter et des opérations à appliquer à ces objets est à la charge de l'utilisateur et dépend du problème à résoudre ; l'enchaînement des opérations est grandement facilité par IntoWeb grâce à la mise en place d'une interface web simple à utiliser.
Fichier principal
Vignette du fichier
NauerVsst2007.pdf (1.26 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00186705 , version 1 (12-11-2007)

Identifiants

  • HAL Id : inria-00186705 , version 1

Citer

Emmanuel Nauer. IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information. Cinquième colloque VSST (Veille Stratégique Scientifique & Technologique), 2007, Marrakech, Maroc. ⟨inria-00186705⟩
70 Consultations
124 Téléchargements

Partager

Gmail Facebook X LinkedIn More