LIX - Laboratoire d'informatique de l'École polytechnique [Palaiseau], LRI - Laboratoire de Recherche en Informatique, UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France
2AMIB - Algorithms and Models for Integrative Biology (Algorithmes et modèles pour la Biologie Intégrative
Bâtiment Alan Turing - Campus de l'École Polytechnique - 1 rue Honoré d'Estienne d'Orves - 91120 Palaiseau - France)
Lanzhou University (222 South Tianshui Road, Lanzhou 730000, Gansu Province, P.R.China - China)
Résumé : Les systèmes de workflow sont nombreux et disposent de modules de gestion de provenance qui collectent les informations relatives aux exécutions (données consommées et produites) permettant d'assurer la reproductibilité d'une expérience. Un grand nombre d'approches s'est développé pour aider à la gestion de ces masses de données de provenance. Un certain nombre de ces approches ont une bonne complexité parce qu'elles sont dédiées à des structures de workflows série-parallèles. Réécrire un workflow en un workflow série-parallèle permettrait donc de mieux exploiter l'ensemble des outils de provenance existants. Nos contributions sont : (i) introduction de la notion de réécriture de workflow provenance-equivalence, (ii) revue de transformations de graphes, (iii) conception de l'algorithme de réécriture SPFlow préservant la provenance (iv) évaluation de notre approche sur un millier de workflows.
https://hal.inria.fr/hal-00748031
Contributor : Sarah Cohen-Boulakia <>
Submitted on : Saturday, November 3, 2012 - 5:46:27 PM Last modification on : Wednesday, September 16, 2020 - 5:06:36 PM Long-term archiving on: : Monday, February 4, 2013 - 3:41:38 AM
Sarah Cohen-Boulakia, Christine Froidevaux, Jiuqiang Chen. Réécriture de workflows scientifiques et provenance. Proc. of the 28th Journées de Bases de Données Avancées, Oct 2012, Clermont Ferrand, France. ⟨hal-00748031⟩