Density-Based Diffusion for Soft Clustering - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2014

Density-Based Diffusion for Soft Clustering

Clustering soft par diffusion basée sur la densité

Thomas Bonis
  • Fonction : Auteur
  • PersonId : 963649
Steve Oudot
  • Fonction : Auteur
  • PersonId : 845393

Résumé

In this paper we advocate the use of diffusion processes guided by density to perform soft clustering tasks. Our approach interpolates between classical mode seeking and spectral clustering, being parametrized by a temperature parameter β > 0 controlling the amount of random motion added to the gradient ascent. In practice we simulate the diffusion process in the continuous domain by random walks in neighborhood graphs built on the input data. We prove the convergence of this scheme under mild sampling conditions, and we derive guarantees for the clustering obtained in terms of the cluster membership distributions. Our theoretical results are cooroborated by preliminary experiments on man-ufactured data and on real data.
Ccet article promeut l'usage de processus de diffusion basés sur la densité pour effectuer du clustering soft. Notre approche interpole entre la recherche de modes classique et le clustering spectral, et elle est paramétrée par un paramètre de temếrature β > 0 contrôlant la quantité de mouvement Brownien ajoutée à la montée de gradient. En pratique nous simulons le processus de diffusion dans le domaine continu par des marches aléatoires dans des graphes de voisinage construits sur les points de données. Nous prouvons la convergence de ce schéma sous des hypothèses d'échantillonnage faibles, et nous dérivons des garanties sur le clustering obtenu en termes de fonctions d'appartenance. Nos résultats théoriques sont corroborés par des expériences préliminaires sur des données synthétiques et des données réelles.
Fichier principal
Vignette du fichier
draft.pdf (1.29 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01111854 , version 1 (31-01-2015)
hal-01111854 , version 2 (21-06-2016)

Identifiants

  • HAL Id : hal-01111854 , version 1

Citer

Thomas Bonis, Steve Oudot. Density-Based Diffusion for Soft Clustering. 2014. ⟨hal-01111854v1⟩
296 Consultations
279 Téléchargements

Partager

Gmail Facebook X LinkedIn More