Analyses et méthodes pour les données transcriptomiques issues d’espèces non modèles : Variation de l’expression des éléments transposables (et des gènes) et variants nucléotidiques

Résumé : Le développement de la seconde génération de séquenceurs haut débit a généralisé l’accès à l’étude du transcriptome via le protocole RNAseq. Celui-ci permet d’obtenir à la fois la séquence et l’abondance des transcrits d’un échantillon. De nombreuses méthodes bioinformatiques ont été et sont encore développées pour permettre l’analyse des données issues du RNAseq et en tirer le maximum d’information. Ce type d’analyse est notamment possible sans utiliser de génome de référence, et donc pour les espèces modèles ou non-modèles, grâce à des méthodes d’assemblage. Durant ma thèse, j’ai principalement travaillé à partir de données RNA-seq issues d’espèces non modèles. Je me suis intéressée dans un premier temps à l’impact de l’hybridation inter spécifique sur la stabilité des génomes chez les hybrides issus des croisements réciproques de D. mojavensis et D. arizonae. Nos résultats ne montrent pas une dérégulation globale,mais plutôt quelques gènes et éléments transposables qui sont spécifiquement dérégulés. La pipeline d’analyse mis en place ici sera réutilisée pour l’étude des niveaux d’expression des transcrits chez les mâles ainsi que pour les croisements issus d’autres lignées de D. mojavensis avec D. arizonae, conduisant à une fertilité variable chez les hybrides. Dans un second temps, j’ai participé à la validation du logiciel KisSplice pour la détection de SNP dans des données RNA-seq sans génome de référence. Celui-ci permet de trouver différents types de variants (épissage, indels) directement dans le graphe de de Bruijn construit à partir des lectures séquencées. J’ai également participé au développement d’outils de post-traitement permettant de prédire l’impact des SNP sur les protéines.
Type de document :
Thèse
Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Claude Bernard Lyon 1, 2017. Français
Liste complète des métadonnées

https://hal.inria.fr/tel-01575640
Contributeur : Marie-France Sagot <>
Soumis le : jeudi 7 septembre 2017 - 08:48:27
Dernière modification le : lundi 15 janvier 2018 - 14:57:21

Licence


Distributed under a Creative Commons Paternité 4.0 International License

Identifiants

  • HAL Id : tel-01575640, version 2

Collections

Citation

Hélène Lopez-Maestre. Analyses et méthodes pour les données transcriptomiques issues d’espèces non modèles : Variation de l’expression des éléments transposables (et des gènes) et variants nucléotidiques. Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Claude Bernard Lyon 1, 2017. Français. 〈tel-01575640v2〉

Partager

Métriques

Consultations de la notice

97

Téléchargements de fichiers

18