Skip to Main content Skip to Navigation
Conference papers

Fouille de données sous contraintes et bases de données inductives

Résumé : Le cadre des bases de données inductives propose de considérer l'extraction de connaissances comme un processus d'interrogation au sens des bases de données. Les requêtes portent alors sur les données (au sens classique, e.g., pour sélectionner un contexte de fouille), sur des abstractions ou généralisations des données, sur des modèles (e.g., pour sélectionner des règles descriptives intéressantes) ou sur les deux composantes (e.g., pour identifier des objets qui satisfont certaines règles). Cette vision a été introduite par Imielinski and Mannila en 1996. De réels progrès ont été réalisés avec d'une part des travaux sur les langages de requêtes pour la fouille de données et d'autre part les nombreuses recherches sur la fouille de données sous contraintes. En considérant plusieurs processus d'extraction de connaissances typiques (e.g., la recherche d'ensembles fréquents, de règles d'associations a priori intéressantes, de fragments moléculaires caractéristiques ou encore celle de motifs séquentiels), nous présenterons la grille d'analyse proposée par le consortium Européen cInQ (projet IST-FET 2000-26469, Mai 2001-Mai 2004). Elle est basée sur les notions de langage d'hypothèses (e.g., les ensembles ou les séquences), de fonctions d'évaluation (e.g., la fréquence ou la cloture), de contraintes primitives (e.g., imposer des fréquences minimales ou maximales, imposer une structure), de requêtes inductives qui combinent diverses contraintes primitives (e.g., des conjonctions de contraintes primitives ou le cadre général des combinaisons booléennes). L'évaluation des requêtes inductives implique le développement de solveurs efficaces et si possible complets pour calculer toutes les hypothèses qui satisfont les contraintes exprimées. Le contexte de la fouille de données (très grands espaces de recherche mais aussi très grands volumes de données) pose des problèmes spécifiques qui sont de mieux en mieux maîtrisés dans le cas de l'extraction sous contraintes de motifs locaux. L'application aux modèles ou motifs globaux (comme des calculs de partitions ou de classifieurs) pose encore de nombreux problèmes ouverts. Nous introduirons les directions de travail actuelles.
Complete list of metadatas

https://hal.inria.fr/inria-00000090
Contributor : Christine Solnon <>
Submitted on : Thursday, May 26, 2005 - 2:41:20 PM
Last modification on : Thursday, November 21, 2019 - 2:31:40 AM
Document(s) archivé(s) le : Thursday, April 1, 2010 - 8:15:07 PM

Identifiers

  • HAL Id : inria-00000090, version 1

Citation

Jean-François Boulicaut. Fouille de données sous contraintes et bases de données inductives. Premières Journées Francophones de Programmation par Contraintes, CRIL - CNRS FRE 2499, Jun 2005, Lens, pp.1--2. ⟨inria-00000090⟩

Share

Metrics

Record views

295

Files downloads

182