A Quasi-Bayesian Perspective to Online Clustering

Le Li 1 Benjamin Guedj 2 Sébastien Loustau 3
2 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille - École polytechnique universitaire de Lille, Université de Lille, Sciences et Technologies
Abstract : When faced with high frequency streams of data, clustering raises theoretical and algorithmic pitfalls. We introduce a new and adaptive online clustering algorithm relying on a quasi-Bayesian approach, with a dynamic (i.e., time-dependent) estimation of the (unknown and changing) number of clusters. We prove that our approach is supported by minimax regret bounds. We also provide an RJMCMC-flavored implementation (called PACBO, see https://cran.r-project.org/web/packages/PACBO/index.html) for which we give a convergence guarantee. Finally, numerical experiments illustrate the potential of our procedure.
Type de document :
Article dans une revue
Electronic journal of statistics , Shaker Heights, OH : Institute of Mathematical Statistics, 2018, 〈10.1214/18-EJS1479〉
Liste complète des métadonnées

Littérature citée [52 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01264233
Contributeur : Benjamin Guedj <>
Soumis le : vendredi 25 mai 2018 - 17:54:31
Dernière modification le : mercredi 14 novembre 2018 - 14:40:11
Document(s) archivé(s) le : dimanche 26 août 2018 - 14:24:11

Fichier

main.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales 4.0 International License

Identifiants

Collections

Citation

Le Li, Benjamin Guedj, Sébastien Loustau. A Quasi-Bayesian Perspective to Online Clustering. Electronic journal of statistics , Shaker Heights, OH : Institute of Mathematical Statistics, 2018, 〈10.1214/18-EJS1479〉. 〈hal-01264233v4〉

Partager

Métriques

Consultations de la notice

246

Téléchargements de fichiers

26