Sequential fault monitoring

Dawei Feng 1 Cecile Germain-Renaud 1 Julien Nauroy 2
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Abstract : For large-scale distributed systems, the knowledge component at the core of the MAPE-K loop remains elusive. In the context of end-to-end probing, fault monitoring can be re- casted as an inference problem in the space-time domain. We propose and evaluate Sequential Matrix Factorization (SMF), a fully spatio-temporal method that exploits both the recent advances in matrix factorization for the spatial information and a new heuristics based on historical information. Adaptivity oper- ates at two levels: algorithmically, as the exploration/exploitation tradeoff is controlled by a self-calibrating parameter; and at the policy level, as active learning is required for the most challenging cases of a real-world dataset.
Type de document :
Communication dans un congrès
Cloud and Autonomic Computing, Sep 2014, London, United Kingdom. IEEE, 2014
Liste complète des métadonnées

Littérature citée [34 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01064161
Contributeur : Cecile Germain <>
Soumis le : lundi 15 septembre 2014 - 20:05:36
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : mardi 16 décembre 2014 - 11:30:33

Fichier

seqmCACFinal.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01064161, version 1

Collections

Citation

Dawei Feng, Cecile Germain-Renaud, Julien Nauroy. Sequential fault monitoring. Cloud and Autonomic Computing, Sep 2014, London, United Kingdom. IEEE, 2014. 〈hal-01064161〉

Partager

Métriques

Consultations de la notice

219

Téléchargements de fichiers

517