Active Data: A Data-Centric Approach to Data Life-Cycle Management

Anthony Simonet 1, * Gilles Fedak 1 Matei Ripeanu 2 Samer Al-Kiswany 2
* Auteur correspondant
1 AVALON - Algorithms and Software Architectures for Distributed and HPC Platforms
Inria Grenoble - Rhône-Alpes, LIP - Laboratoire de l'Informatique du Parallélisme
Résumé : Les importants volumes de données produits par la science présentent de nouvelles opportunités d'innovation et de découvertes. Cependant ceci sera conditionné par notre capacité à gérer efficacement de très grands jeux de données. La gestion de données pour les applications scientifiques data-intensive présente un véritable défi~; elle requière le support de cycles de vie très complexes, la coordination de plusieurs sites, de la tolérance aux pannes et de passer à l'échelle sur des dizaines de sites avec plusieurs péta-octets de données. Dans cet article nous argumentons que la gestion des données pour les applications scientifiques data-intensive nécessite une approche fondamentalement différente de l'actuel paradigme centré sur les tâches. Nous proposons Active Data, un nouveau paradigme pour la gestion du cycle de vie des données. Active Data suit deux principes~: il est centré sur les données et à base d'événements. Nous présentons le modèle de programmation Active Data, un prototype d'implémentation et discutons des avantages et limites de notre approche à partir d'étude de cas d'applications scientifiques.
Type de document :
Communication dans un congrès
Schwan, Karsten and Hildebrand, Dean. PDSW '13 - 8th Parallel Data Storage Workshop, Nov 2013, Denver, United States. ACM, pp.39-44, 2013, 〈10.1145/2538542.2538566〉
Liste complète des métadonnées

Littérature citée [20 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00921080
Contributeur : Anthony Simonet <>
Soumis le : jeudi 19 décembre 2013 - 16:08:06
Dernière modification le : vendredi 20 avril 2018 - 15:44:26
Document(s) archivé(s) le : jeudi 20 mars 2014 - 12:00:42

Fichiers

active_data_v30.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Anthony Simonet, Gilles Fedak, Matei Ripeanu, Samer Al-Kiswany. Active Data: A Data-Centric Approach to Data Life-Cycle Management. Schwan, Karsten and Hildebrand, Dean. PDSW '13 - 8th Parallel Data Storage Workshop, Nov 2013, Denver, United States. ACM, pp.39-44, 2013, 〈10.1145/2538542.2538566〉. 〈hal-00921080〉

Partager

Métriques

Consultations de la notice

377

Téléchargements de fichiers

296