Stoichiometry Determination for Mass-spectrometry Data: the Interval Case - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2012

Stoichiometry Determination for Mass-spectrometry Data: the Interval Case

Frédéric Cazals
Noël Malod-Dognin
  • Fonction : Auteur
  • PersonId : 883298

Résumé

In structural proteomics, given the individual masses of a set of protein types and the exact mass of a protein complex, the exact stoichiometry determination problem (SD), also known as the money-change problem, consists of enumerating all the stoichiometries of these types which allow to recover the target mass. If the target mass suffers from experimental uncertainties, the interval SD problem consists of finding all the stoichiometry vectors compatible with a target mass within an interval. We make contributions in two directions. From a theoretical standpoint, we present a constant-memory space algorithm (DIOPHANTINE) and an output sensitive dynamic programming based algorithm (DP++), both inherently addressing the interval SD problem. From an applied perspective, we raise three points. First, we show that DIOPHANTINE and DP++ yield an improvement from 3 to 4 orders of magnitude over state-of-the-art exact SD algorithms, for typical protein complexes facing uncertainties on the target mass in the range 0.1-1%. Second, we show that DIOPHANTINE behaves like an output-sensitive algorithm---especially when the interval width increases, albeit such a property cannot be expected in general. Third, from a biological perspective, using a panel of biological complexes (eukaryotic translation factor, yeast exosome, 19S proteasome sub-unit, nuclear pore complex), we stress the importance of enumeration, even at a null noise level. The programs accompanying this paper are available from http://team.inria.fr/abs/addict/
En protéomique structurale, étant données les masses exactes d'un ensemble de protéines et la masse exacte d'un complexe, le problème de la détermination de la stoechiométrie (SD), consiste à énumérer les stoechiométries de ces protéines permettant de reconstituer la masse du complexe. Si celle-ci présente une incertitude, généralement inférieure a 1%, il s'agit d'énumérer les stoechiométries compatibles avec une masse appartenant à un intervalle. Nous présentons des contributions dans deux registres. D'un point de vue théorique et contrairement aux travaux antérieurs focalisés sur le problème exact, nous développons un algorithme travaillant à taille mémoire constante (DIOPHANTINE), ainsi qu'un algorithme sensible à la sortie basé sur la programmation dynamique (DP++), tous deux résolvant le problème de détermination de la stoechiométrie pour un intervalle. D'un point de vue appliqué, nous présentons trois résultats. Tout d'abord, nous montrons que DIOPHANTINE et DP++ sont plus rapides de 3 à 4 ordres de grandeur que l'algorithme état de l'art résolvant le problème exact, pour des complexes protéiques typiques présentant des incertitudes de l'ordre de 0.1% a 1%. D'autre part, nous montrons que DIOPHANTINE a un comportement d'autant plus sensible à la sortie que la taille de l'intervalle augmente. Enfin et d'un point de vue biologique, en étudiant plusieurs complexes protéiques (facteur de traduction eucaryote, exosome de la levure, sous-unité 19S du protéasome, pore nucléaire), nous soulignons l'importance des solutions multiples, même à un niveau d'incertitude nul. Les logiciels présentés sont disponibles à l'adresse suivante http://team.inria.fr/abs/addict/
Fichier principal
Vignette du fichier
RR-8101-addict.pdf (681.58 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00741491 , version 1 (12-10-2012)
hal-00741491 , version 2 (25-10-2012)
hal-00741491 , version 3 (08-02-2013)

Identifiants

  • HAL Id : hal-00741491 , version 1

Citer

Deepesh Agarwal, Frédéric Cazals, Noël Malod-Dognin. Stoichiometry Determination for Mass-spectrometry Data: the Interval Case. [Research Report] RR-8101, 2012, pp.31. ⟨hal-00741491v1⟩
342 Consultations
363 Téléchargements

Partager

Gmail Facebook X LinkedIn More