Méthodes multivariées combinant ondelettes et analyse en composantes principales pour le débruitage de données issues de spectrométrie de masse

Elise Mostacci 1 Caroline Truntzer 1, 2 Hervé Cardot 3 Patrick Ducoroy 2, 1
1 CLIPP - Plate-forme Protéomique CLIPP - Clinical and Innovation Proteomic Platform [Dijon]
FEMTO-ST - Franche-Comté Électronique Mécanique, Thermique et Optique - Sciences et Technologies (UMR 6174), ICMUB - Institut de Chimie Moléculaire de l'Université de Bourgogne [Dijon]
Résumé : L'identification de nouveaux biomarqueurs diagnostiques ou pronostiques est un des objectifs majeurs en recherche clinique. L'utilisation des technologies à haut débit comme la spectrométrie de masse est prometteuse pour l'identification de tels marqueurs. A partir d'un prélèvement de sang ou de tumeur par exemple, cette technologie permet de traduire sous forme de spectres le profil protéique des individus. Le signal biologique observé dans les spectres est masqué par différentes sources de variabilités techniques, qu'une phase préalable de prétraitement doit permettre de retirer. La méthode classique permettant de retirer le bruit aléatoire de mesure de ce signal combine la méthodologie des ondelettes et un seuillage, ceci spectre à spectre. L'utilisation des ondelettes permet la séparation du bruit aléatoire (coefficients de détail) et du signal biologique (coefficients d'approximation). Le seuillage des coefficients de détails permet ensuite d'annuler un certain nombre d'entre eux. Nous proposons dans ce travail d'améliorer le débruitage classique des données en tenant compte de la structure commune des signaux. Nous avons pour cela adapté aux données spectrométriques deux méthodes de débruitage qui combinent les ondelettes, le seuillage et les analyses en composantes principales classique ou creuse. Les méthodes proposées ont été évaluées et comparées à la méthode de seuillage univariée classique, ceci pour des données réelles et simulées. Il a été montré que l'ajout d'une étape de réduction de la dimension sur les approximations par une analyse en composantes principales en plus d'un seuillage classique sur les détails améliore le débruitage.
Complete list of metadatas

Cited literature [9 references]  Display  Hide  Download

https://hal.inria.fr/inria-00494794
Contributor : Conférence Sfds-Hal <>
Submitted on : Thursday, June 24, 2010 - 8:58:50 AM
Last modification on : Friday, July 6, 2018 - 3:06:10 PM
Long-term archiving on : Monday, September 27, 2010 - 11:39:40 AM

File

p143.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00494794, version 1

Citation

Elise Mostacci, Caroline Truntzer, Hervé Cardot, Patrick Ducoroy. Méthodes multivariées combinant ondelettes et analyse en composantes principales pour le débruitage de données issues de spectrométrie de masse. 42èmes Journées de Statistique, 2010, Marseille, France, France. ⟨inria-00494794⟩

Share

Metrics

Record views

340

Files downloads

2124