Motifs séquentiels δ-libres - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Motifs séquentiels δ-libres

Marc Plantevit
Chedy Raïssi

Résumé

Sequential pattern mining is a challenging task with important locks like the size of the output. In this paper, we propose a new approach that extract the more general patterns and suppress the more specific patterns with similar frequencies. We defined $\delta$-sequential patterns that enable to reduce the output. Even if this notion is already known for itemsets, we show that its extension to the sequence framework is very difficult. The approach produces few and useful patterns for data mining tasks like sequence classification.
Bien que largement étudié, l'extraction de motifs séquentiels reste une tâche très difficile et pose aussi le défi du grand nombre de motifs produits. Dans cet article, nous proposons une nouvelle approche extrayant les motifs séquentiels les plus généraux à fréquence similaire. Nous montrons en quoi l'extension de cette notion, déjà connue pour les motifs ensemblistes, est un problème particulièrement difficile pour les séquences. Outre le nombre réduit de motifs produits, les motifs $\delta$-libres ainsi obtenus facilitent les usages d'un processus de fouille et nous montrons leur apport comme descripteurs dans un contexte de classification de séquences.

Mots clés

Fichier non déposé

Dates et versions

hal-00653579 , version 1 (19-12-2011)

Identifiants

  • HAL Id : hal-00653579 , version 1

Citer

Marc Plantevit, Chedy Raïssi, Bruno Crémilleux. Motifs séquentiels δ-libres. Extraction et gestion des connaissances (EGC'2011), Ali Khenchaf, Pascal Poncelet, Jan 2011, Brest, France. ⟨hal-00653579⟩
266 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More