C. Augonnet, S. Thibault, R. Namyst, and P. Wacrenier, StarPU: a unified platform for task scheduling on heterogeneous multicore architectures. Concurrency and Computation: Practice and Experience. Consulté sur http, 2010.
URL : https://hal.archives-ouvertes.fr/inria-00384363

E. Ayguadé, R. M. Badia, F. D. Igual, and J. Labarta, An Extension of the StarSs Programming Model for Platforms with Multiple GPUs, Proceedings of the 15th international euro-par conference on parallel processing, pp.851-862978, 2009.
DOI : 10.1109/TPDS.2003.1214317

U. Bondhugula, A. Hartono, J. Ramanujam, and P. Sadayappan, A practical automatic polyhedral parallelizer and locality optimizer, Proceedings of the 2008 acm sigplan conference on programming language design and implementation, pp.101-113, 2008.
DOI : 10.1145/1375581.1375595

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.151.5126

L. Chen, L. Liu, S. Tang, and L. Huang, Unified Parallel C for GPU Clusters: Language Extensions and Compiler Implementation, Proceedings of the 23rd international conference on languages and compilers for parallel computing, pp.151-165, 2011.
DOI : 10.1007/978-3-642-03869-3_82

. Clearspeed, Runtime user manual, version 3.1, 2010.

D. Cunningham, R. Bordawekar, and V. Saraswat, GPU Programming in a High Level Language -Compiling X10 to CUDA, ACM SIGPLAN 2011 X10 Workshop, 2011.

G. Diamos and S. Yalamanchili, Harmony, Proceedings of the 17th international symposium on High performance distributed computing, HPDC '08, 2008.
DOI : 10.1145/1383422.1383447

G. F. Diamos and S. Yalamanchili, Harmony, Proceedings of the 17th international symposium on High performance distributed computing, HPDC '08, pp.197-200, 2008.
DOI : 10.1145/1383422.1383447

R. Dolbeau, S. Bihan, and F. Bodin, HMPP: A hybrid Multi-core Parallel Programming Environment, Workshop on General Purpose Processing Using GPUs, 2007.

E. International and . Inc, SWift Adpative Runtime Machine(SWARM), 2011.

K. Fatahalian, T. J. Knight, M. Houston, and M. Erez, Sequoia: Programming the Memory Hierarchy, ACM/IEEE SC 2006 Conference (SC'06), p.4, 2006.
DOI : 10.1109/SC.2006.55

D. Grewe and M. F. O-'boyle, A Static Task Partitioning Approach for Heterogeneous Systems Using OpenCL, Cc '11: Proceedings of the 20th international conference on compiler construction, 2011.
DOI : 10.1007/978-3-540-92990-1_4

J. Lee, M. T. Tran, T. Odajima, and T. Boku, An Extension of XcalableMP PGAS Language for Multi-node GPU Clusters, HeteroPar'11 Proceedings, 2011.

. Nvidia-corporation, NVIDIA CUDA SDK 4, 2011.

V. Saraswat, B. Bloom, I. Peshansky, and O. Tardieu, X10 Language Specification, 2011.

A. Denis, Alexandre Denis est chargé de recherches à l'INRIA Bordeaux Sud-Ouest depuis 2004, membre de l'équipe INRIA Runtime Il est ancien élève de l'École Normale Supérieure de Lyon et a obtenu un doctorat en Informatique de l'Université de Rennes 1 en 2003. Il s'intéresse aux domaines des sytèmes parallèles et du calcul haute performance

D. Barthou, Institut Polytechnique de Bordeaux depuis 2009, membre du LaBRI dans l'équipe INRIA Runtime Il a obtenu un master d'informatique théorique à l'Ecole Normale Supérieure de Lyon en 1993. Il a soutenu sa thèse en 1998 sur l'analyse de flot de données non-affine a l'Université de Versailles St Quentin sous la direction de P. Feautrier. Ses principaux centres d'intérêt en recherche portent sur le calcul haute performance