A Fuzzy Clustering Algorithm for the Mode-Seeking Framework - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Pattern Recognition Letters Année : 2018

A Fuzzy Clustering Algorithm for the Mode-Seeking Framework

Clustering soft par diffusion basée sur la densité

Thomas Bonis
  • Fonction : Auteur
  • PersonId : 963649
Steve Oudot
  • Fonction : Auteur
  • PersonId : 845393

Résumé

In this paper, we propose a new fuzzy clustering algorithm based on the modeseeking framework. Given a dataset in Rd, we define regions of high density that we call cluster cores. We then consider a random walk on a neighborhood graph built on top of our data points which is designed to be attracted by high density regions. The strength of this attraction is controlled by a temperature parameter beta > 0. The membership of a point to a given cluster is then the probability for the random walk to hit the corresponding cluster core before any other. While many properties of random walks (such as hitting times, commute distances, etc. . . ) have been shown to enventually encode purely local information when the number of data points grows, we show that the regularization introduced by the use of cluster cores solves this issue. Empirically, we show how the choice of beta influences the behavior of our algorithm: for small values of beta the result is close to hard modeseeking whereas when beta is close to 1 the result is similar to the output of a (fuzzy) spectral clustering. Finally, we demonstrate the scalability of our approach by providing the fuzzy clustering of a protein configuration dataset containing a million data points in 30 dimensions.
Cet article promeut l'usage de processus de diffusion basés sur la densité pour effectuer du clustering soft. Notre approche interpole entre la recherche de modes classique et le clustering spectral, et elle est paramétrée par un paramètre de temếrature β > 0 contrôlant la quantité de mouvement Brownien ajoutée à la montée de gradient. En pratique nous simulons le processus de diffusion dans le domaine continu par des marches aléatoires dans des graphes de voisinage construits sur les points de données. Nous prouvons la convergence de ce schéma sous des hypothèses d'échantillonnage faibles, et nous dérivons des garanties sur le clustering obtenu en termes de fonctions d'appartenance. Nos résultats théoriques sont corroborés par des expériences préliminaires sur des données synthétiques et des données réelles.
Fichier principal
Vignette du fichier
Density-Based_Soft_Clustering.pdf (1.17 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01111854 , version 1 (31-01-2015)
hal-01111854 , version 2 (21-06-2016)

Identifiants

Citer

Thomas Bonis, Steve Oudot. A Fuzzy Clustering Algorithm for the Mode-Seeking Framework. Pattern Recognition Letters, 2018, ⟨10.1016/j.patrec.2017.11.019⟩. ⟨hal-01111854v2⟩
296 Consultations
279 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More