IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information

Emmanuel Nauer 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Dans cet article, nous présentons un système hypertexte, nommé IntoWeb, qui fournit aux chercheurs ou spécialistes de l'information scientifique les moyens d'exploiter les données structurées sur leur domaine et des données - textuelles - du web pour des besoins de recherche d'information, d'analyse de leur domaine ou de veille. IntoWeb est un système générique d'exploitation de données qui implémente un processus complet et itératif d'extraction de connaissances à partir de données. Le système permet de manipuler différents types d'objets (documents structurés, documents textuels, vecteurs, classifications, etc.). Des opérateurs (génération d'un vecteur à partir d'un document textuel, classification de documents structurés, etc.) permettent d'exploiter chacun des différents types d'objets à des fins d'analyses ou de recherche d'information. L'application d'un opérateur sur un ensemble d'objets produit de nouveaux objets, à leur tour exploitable dans le système. La résolution complète d'un problème d'extraction de connaissances ou de recherche d'information prend la forme d'une succession d'opérations appliquées à des objets. Le choix des objets à exploiter et des opérations à appliquer à ces objets est à la charge de l'utilisateur et dépend du problème à résoudre ; l'enchaînement des opérations est grandement facilité par IntoWeb grâce à la mise en place d'une interface web simple à utiliser.
Document type :
Conference papers
Complete list of metadatas

Cited literature [11 references]  Display  Hide  Download

https://hal.inria.fr/inria-00186705
Contributor : Emmanuel Nauer <>
Submitted on : Monday, November 12, 2007 - 8:54:11 AM
Last modification on : Friday, May 24, 2019 - 10:58:04 AM
Long-term archiving on : Monday, April 12, 2010 - 1:53:52 AM

File

NauerVsst2007.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00186705, version 1

Collections

Citation

Emmanuel Nauer. IntoWeb : une plate forme hypertexte d'extraction de connaissances et de recherche d'information. Cinquième colloque VSST (Veille Stratégique Scientifique & Technologique), 2007, Marrakech, Maroc. ⟨inria-00186705⟩

Share

Metrics

Record views

203

Files downloads

316