A Quasi-Bayesian Perspective to Online Clustering

Le Li 1 Benjamin Guedj 2 Sébastien Loustau 3
2 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille, Université de Lille 1, IUT’A
Abstract : When faced with high frequency streams of data, clustering raises theoretical and algorith-mic pitfalls. We introduce a new and adaptive online clustering algorithm relying on a quasi-Bayesian approach, with a dynamic (i.e., time-dependent) estimation of the (unknown and changing) number of clusters. We prove that our approach is supported by minimax regret bounds. We also provide an RJMCMC-flavored implementation (called PACBO) for which we give a convergence guarantee. Finally, numerical experiments illustrate the potential of our procedure.
Type de document :
Pré-publication, Document de travail
2016
Liste complète des métadonnées

Littérature citée [50 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01264233
Contributeur : Benjamin Guedj <>
Soumis le : samedi 8 avril 2017 - 10:28:40
Dernière modification le : jeudi 31 mai 2018 - 14:11:41
Document(s) archivé(s) le : dimanche 9 juillet 2017 - 12:32:19

Fichier

main.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales 4.0 International License

Identifiants

  • HAL Id : hal-01264233, version 3

Collections

Citation

Le Li, Benjamin Guedj, Sébastien Loustau. A Quasi-Bayesian Perspective to Online Clustering. 2016. 〈hal-01264233v3〉

Partager

Métriques

Consultations de la notice

501

Téléchargements de fichiers

54