Approche variationnelle pour la fusion de jeux de données d'expression génique
Résumé
L'analyse conjointe de multiples jeux de données de même nature pour en dégager l'information pertinente est un problème complexe. Ce problème est rencontré notamment dans la comparaison des résultats obtenus sur différentes plateformes bio-puces dans la recherche de gènes différentiellement exprimés ou l'inférence de réseaux de régulation géniques. Souvent les analyses sont d'abord effectuées indépendamment sur chacun des jeux de données et les résultats obtenus sont ensuite croisés pour en dégager une information commune. Mais ceci est clairement sous-optimal et il serait souvent préférable d'exploiter simultanément les jeux de données. Le problème inhérent est alors celui de la calibration, c'est à dire le pré-traitement destiné à les rendre comparables. Cette présentation se focalise sur la question primordiale: comment homogénéiser différents jeux de données de même nature pour les rendre comparables? Une méthode basée sur une approche variationnelle est proposée. Des fonctions de "rectification" non-linéaires (une par jeu de données) sont estimées à partir de jeux multiples, par optimisation numérique d'une fonctionnelle. Cette dernière est constituée d'un terme d'attache aux données et d'un terme de régularisation par pénalisation de la dérivée seconde de la fonction de rectification. L'optimisation est effectuée numériquement par un algorithme itératif. L'approche proposée est illustrée sur une simulation, dans laquelle des jeux artificiels sont constitués à partir d'un jeu de données réel d'expression de E. Coli.
Domaines
Statistiques [math.ST]
Origine : Fichiers produits par l'(les) auteur(s)
Loading...