Les modèles de mélange pour la classification de données massives en temps réel

Résumé : La classification automatique (clustering) est un outil très utilisé en fouille de données (data mining). Elle permet notamment d'extraire d'un grand jeu de données des classes où les individus ont des caractéristiques similaires, et peut ainsi être utile dans plusieurs domaines : gestion, Web, contrôle industriel par émission acoustique ... Lorsque les données sont très volumineuses ou parviennent en temps réel, les méthodes habituelles de classification doivent être adaptées pour pouvoir répondre rapidement. Dans le cadre d'une application de contrôle de cuves sous pression, nous avons ainsi développé une méthode de classification automatique basée sur les modèles de mélange et sur une discrétisation préalable de données acoustiques. Nous présenterons sa mise en oeuvre sur des données simulées et sur des données réelles.
Type de document :
Communication dans un congrès
41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009
Liste complète des métadonnées

https://hal.inria.fr/inria-00386796
Contributeur : Conférence Jds2009 <>
Soumis le : vendredi 22 mai 2009 - 09:21:59
Dernière modification le : mercredi 4 juillet 2018 - 16:44:02

Identifiants

  • HAL Id : inria-00386796, version 1

Collections

Citation

Allou Samé, Gérard Govaert, Christophe Ambroise. Les modèles de mélange pour la classification de données massives en temps réel. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009. 〈inria-00386796〉

Partager

Métriques

Consultations de la notice

198