Méthodes multivariées combinant ondelettes et analyse en composantes principales pour le débruitage de données issues de spectrométrie de masse

Elise Mostacci 1 Caroline Truntzer 1, 2 Hervé Cardot 3 Patrick Ducoroy 2, 1
1 CLIPP - Plate-forme Protéomique CLIPP - Clinical and Innovation Proteomic Platform [Dijon]
FEMTO-ST - Franche-Comté Électronique Mécanique, Thermique et Optique - Sciences et Technologies (UMR 6174), ICMUB - Institut de Chimie Moléculaire de l'Université de Bourgogne [Dijon]
Résumé : L'identification de nouveaux biomarqueurs diagnostiques ou pronostiques est un des objectifs majeurs en recherche clinique. L'utilisation des technologies à haut débit comme la spectrométrie de masse est prometteuse pour l'identification de tels marqueurs. A partir d'un prélèvement de sang ou de tumeur par exemple, cette technologie permet de traduire sous forme de spectres le profil protéique des individus. Le signal biologique observé dans les spectres est masqué par différentes sources de variabilités techniques, qu'une phase préalable de prétraitement doit permettre de retirer. La méthode classique permettant de retirer le bruit aléatoire de mesure de ce signal combine la méthodologie des ondelettes et un seuillage, ceci spectre à spectre. L'utilisation des ondelettes permet la séparation du bruit aléatoire (coefficients de détail) et du signal biologique (coefficients d'approximation). Le seuillage des coefficients de détails permet ensuite d'annuler un certain nombre d'entre eux. Nous proposons dans ce travail d'améliorer le débruitage classique des données en tenant compte de la structure commune des signaux. Nous avons pour cela adapté aux données spectrométriques deux méthodes de débruitage qui combinent les ondelettes, le seuillage et les analyses en composantes principales classique ou creuse. Les méthodes proposées ont été évaluées et comparées à la méthode de seuillage univariée classique, ceci pour des données réelles et simulées. Il a été montré que l'ajout d'une étape de réduction de la dimension sur les approximations par une analyse en composantes principales en plus d'un seuillage classique sur les détails améliore le débruitage.
Type de document :
Communication dans un congrès
42èmes Journées de Statistique, 2010, Marseille, France, France. 2010
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00494794
Contributeur : Conférence Sfds-Hal <>
Soumis le : jeudi 24 juin 2010 - 08:58:50
Dernière modification le : vendredi 6 juillet 2018 - 15:06:10
Document(s) archivé(s) le : lundi 27 septembre 2010 - 11:39:40

Fichier

p143.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00494794, version 1

Citation

Elise Mostacci, Caroline Truntzer, Hervé Cardot, Patrick Ducoroy. Méthodes multivariées combinant ondelettes et analyse en composantes principales pour le débruitage de données issues de spectrométrie de masse. 42èmes Journées de Statistique, 2010, Marseille, France, France. 2010. 〈inria-00494794〉

Partager

Métriques

Consultations de la notice

314

Téléchargements de fichiers

2050