Integrative analysis of high-dimensional data applied to vaccine research

Boris P. Hejblum 1, 2
1 SISTM - Statistics In System biology and Translational Medicine
Inria Bordeaux - Sud-Ouest, Epidémiologie et Biostatistique [Bordeaux]
Résumé : Les données d’expression génique sont reconnues comme étant de grande dimension, et nécessitant l’emploi de méthodes statistiques adaptées. Mais dans le contexte des essais vaccinaux, d’autres mesures, comme par exemple les mesures de cytométrie en flux, sont également de grande dimension. De plus, ces données sont souvent mesurées de manière longitudinale. Ce travail est bâti sur l’idée que l’utilisation d’un maximum d’information disponible, en modélisant les connaissances a priori ainsi qu’en intégrant l’ensemble des différentes données disponibles, améliore l’inférence et l’interprétabilité des résultats d’analyses statistiques en grande dimension. Tout d’abord, nous présentons une méthode d’analyse par groupe de gènes pour des données d’expression génique longitudinales. En- suite, nous décrivons deux analyses intégratives dans deux études vaccinales. La première met en évidence une sous-expression des voies biologiques d’inflammation chez les patients ayant un rebond viral moins élevé à la suite d’un vaccin thérapeutique contre le VIH. La deuxième étude identifie un groupe de gènes lié au métabolisme lipidique dont l’impact sur la réponse à un vaccin contre la grippe semble régulé par la testostérone, et donc lié au sexe. Enfin, nous introduisons un nouveau modèle de mélange de distributions t asymétriques à processus de Dirichlet pour l’identification de populations cellulaires à partir de données de cytométrie en flux disponible notamment dans les essais vaccinaux. En outre, nous proposons une stratégie d’approximation séquentielle de la partition a posteriori dans le cas de mesures répétées. Ainsi, la reconnaissance automatique des populations cellulaires pourrait permettre à la fois une avancée pratique pour le quotidien des immunologistes ainsi qu’une interprétation plus précise des résultats d’expression génique après la prise en compte de l’ensemble des populations cellulaires.
Liste complète des métadonnées

Littérature citée [245 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01203547
Contributeur : Boris Hejblum <>
Soumis le : dimanche 13 novembre 2016 - 02:05:12
Dernière modification le : mardi 18 septembre 2018 - 16:24:01
Document(s) archivé(s) le : mardi 14 mars 2017 - 13:41:09

Identifiants

  • HAL Id : tel-01203547, version 1

Collections

Citation

Boris P. Hejblum. Integrative analysis of high-dimensional data applied to vaccine research. Santé publique et épidémiologie. Université de Bordeaux, 2015. English. 〈NNT : 2015BORD0049〉. 〈tel-01203547〉

Partager

Métriques

Consultations de la notice

220

Téléchargements de fichiers

190