Vers une mesure de similarité pour les séquences complexes

Elias Egho 1 Chedy Raïssi 1 Toon Calders 2 Nicolas Jay 1 Amedeo Napoli 1
1 ORPAILLEUR - Knowledge representation, reasonning
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Le calcul de similarité entre les séquences est d'une extrême importance dans de nombreuses approches d'explorations de données. Il existe une multitude de mesures de similarités de séquences dans la littérature. Or, la plupart de ces mesures sont conçues pour des séquences simples, dites séquences d'items. Dans ce travail, nous étudions d'un point de vue purement combinatoire le problème de similarité entre des séquences complexes (i.e., des séquences d'ensembles ou itemsets). Nous présentons de nouveaux résultats afin de compter efficacement toutes les sous-séquences communes à deux séquences. Ces résultats théoriques sont la base d'une mesure de similarité calculée efficacement grâce à une approche de programmation dynamique.
Type de document :
Communication dans un congrès
Extraction et gestion des connaissances (EGC'2013), Jan 2013, Toulouse, France. Cépaduès, pp.335-340, 2013, Extraction et gestion des connaissances
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00885965
Contributeur : Elias Egho <>
Soumis le : samedi 9 novembre 2013 - 23:29:12
Dernière modification le : jeudi 11 janvier 2018 - 06:25:24
Document(s) archivé(s) le : lundi 10 février 2014 - 12:00:21

Fichier

EGC.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00885965, version 1

Collections

Citation

Elias Egho, Chedy Raïssi, Toon Calders, Nicolas Jay, Amedeo Napoli. Vers une mesure de similarité pour les séquences complexes. Extraction et gestion des connaissances (EGC'2013), Jan 2013, Toulouse, France. Cépaduès, pp.335-340, 2013, Extraction et gestion des connaissances. 〈hal-00885965〉

Partager

Métriques

Consultations de la notice

571

Téléchargements de fichiers

177