Pattern Mining in Numerical Data: Extracting Closed Patterns and their Generators - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2010

Pattern Mining in Numerical Data: Extracting Closed Patterns and their Generators

Résumé

In this paper we study the extraction of closed patterns associated to their generators in numerical data. Many works have addressed the problem of extracting itemsets for generating association rules. Considering numerical data, an appropriate discretization is most of the time necessary, in order to split attribute ranges into intervals maximizing some interest functions, e.g. support, confidence, or other statistical measures. We investigate here an alternative point of view using pattern structures in Formal Concept Analysis. Pattern structures can be efficiently used to extract closed patterns without any prior discretization. Two original and efficient algorithms for characterizing frequent closed patterns and their generators in numerical data are proposed and experimented. Finally, we conclude showing the usefulness of such patterns in classification problems and privacy preserving data-mining.
Dans cet article, nous étudions l'extraction de motifs fermés et leurs générateurs à partir de données numériques. De nombreux travaux s'intéressent à l'extraction de motifs pour la génération de règles d'association dans le cadre de la découverte de connaissances. Concernant les données numériques, une étape de discrétisation est généralement nécessaire, afin de découper les domaines des attributs en un certain nombre d'intervalles, maximisant certaines fonctions d'intérêt, comme le support ou la confiance. Nous proposons ici une méthode alternative se basant sur la notion de structures de patrons définies dans le cadre de l'analyse formelle de concepts (FCA). Les structures de patrons peuvent être efficacement utilisées pour extraire des motifs fermés à partir de données numériques sans discrétisation préalable des données. Nous proposons alors deux algorithme originaux et efficaces pour caractériser et extraire les motifs fermés et générateurs dans les données numériques. Nous concluons sur l'utilité de tels motifs pour des tâches de classification, mais aussi d'anonymisation de données.
Fichier principal
Vignette du fichier
RR-7416.pdf (300.84 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00526662 , version 1 (01-03-2011)

Identifiants

  • HAL Id : inria-00526662 , version 1

Citer

Mehdi Kaytoue, Sergei O. Kuznetsov, Amedeo Napoli. Pattern Mining in Numerical Data: Extracting Closed Patterns and their Generators. [Research Report] RR-7416, INRIA. 2010, pp.25. ⟨inria-00526662⟩
248 Consultations
491 Téléchargements

Partager

Gmail Facebook X LinkedIn More