Stoichiometry Determination for Mass-spectrometry Data: the Interval Case

Deepesh Agarwal 1, * Frédéric Cazals 1 Noël Malod-Dognin 1
* Auteur correspondant
1 ABS - Algorithms, Biology, Structure
CRISAM - Inria Sophia Antipolis - Méditerranée
Résumé : En protéomique structurale, étant données les masses exactes d'un ensemble de protéines et la masse exacte d'un complexe, le problème de la détermination de la stoechiométrie (SD), consiste à énumérer les stoechiométries de ces protéines permettant de reconstituer la masse du complexe. Si celle-ci présente une incertitude, il s'agit d'énumérer les stoechiométries compatibles avec une masse appartenant à un intervalle. Nous présentons des contributions dans deux registres. D'un point de vue théorique, nous apportons des modifications aux algorithmes exacts de SD, afin de résoudre le problème par intervalle. La première modification concerne l'algorithme de recherche exhaustif, et conduit à l'algorithme DIOPHANTINE qui travaille à mémoire constante. La seconde concerne l'algorithme état de l'art utilisant la programmation dynamique, et conduit à l'algorithme DP++, lequel est sensible à la sortie. D'un point de vue appliqué, nous présentons trois résultats. Tout d'abord, nous montrons que DIOPHANTINE et DP++ sont plus rapides de 3 à 4 ordres de grandeur que l'algorithme état de l'art résolvant le problème exact, pour des complexes protéiques typiques présentant des incertitudes de l'ordre de 0.1% a 1%. Nous montrons que ce gain tient à l'évitement de calculs redondants lorsque l'algorithme exact est appellé sur chacune des masses d'un intervalle. D'autre part, nous montrons que DIOPHANTINE a un comportement d'autant plus sensible à la sortie que la taille de l'intervalle augmente. Enfin et d'un point de vue biologique, en étudiant plusieurs complexes protéiques (facteur de traduction eucaryote, exosome de la levure, sous-unité 19S du protéasome, pore nucléaire), nous soulignons l'importance des solutions multiples, même à un niveau d'incertitude nul. Nous introduisons également une représentation de toutes les solutions d'un problème par intervalle, mettant en evidence les types de protéines les plus utilisés. Les programmes sont disponibles via http://team.inria.fr/abs/addict/.
Liste complète des métadonnées

Littérature citée [40 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00741491
Contributeur : Frederic Cazals <>
Soumis le : vendredi 8 février 2013 - 12:26:23
Dernière modification le : jeudi 11 janvier 2018 - 16:31:49
Document(s) archivé(s) le : samedi 1 avril 2017 - 20:27:09

Fichier

RR-8101-addict.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00741491, version 3

Collections

Citation

Deepesh Agarwal, Frédéric Cazals, Noël Malod-Dognin. Stoichiometry Determination for Mass-spectrometry Data: the Interval Case. [Research Report] RR-8101, INRIA. 2013, pp.52. 〈hal-00741491v3〉

Partager

Métriques

Consultations de la notice

450

Téléchargements de fichiers

225