Prédiction de transcriptome : analyse comparative multi-gènes, orthologues - Archive ouverte HAL Access content directly
Master Thesis Year : 2018

Prédiction de transcriptome : analyse comparative multi-gènes, orthologues

(1)
1

Abstract

The formation of eukaryotic gene transcripts is due to an alternative splicing process that selects some regions, called exons, in which some will be translated into proteins. Partners of this study have developed a method for predicting transcripts called CG-Alcode, taking advantage of the conservation principle of sequences of the same gene between two species (called orthologous genes). This work aims to extend the method in order to deal with multi-species comparison, first based on three study species (human, mouse and dog). The study involves a cohort of 2,167 triplets of orthologous genes and is illustrated on one gene in particular : the CREM gene. The protocol used reinjects transcript predictions of an expressible source gene into the target species’ repertory. This aims to complete current knowledge and to annotate the transcriptome of the species, especially the dog transcriptome, which is still poorly documented. 7,201 transcripts are predicted that way. From there, the construction of orthology relationship graphs was implemented to provide an overview on the evolution of genes and their expressed transcripts. 83 orthologous gene triplets were found as having an identical fine gene structure between the three species, these gene triplets have been shared since the ancestor Eutheria. These results thus show a first track of understanding evolution, in terms of information gain and loss, in gene structures.
La formation des transcrits à partir des gènes eucaryotes est due à un processus d’épissage alternatif qui sélectionne une partie des régions, les exons, dans lesquels certains seront traduits en protéines. Des partenaires de cette étude ont développé une méthode de prédiction des transcrits baptisée CG-Alcode, qui exploite le principe de conservation de séquences d’un même gène entre deux espèces (dits "gènes orthologues"). Ces travaux ont pour objectif d'étendre l'approche comparative pairwise à de la comparaison multi-espèces, en se basant sur trois espèces d’étude (homme, souris et chien). L’étude porte sur une cohorte de 2 167 triplets de gènes orthologues et est illustrée sur un gène en particulier : le gène CREM. Le protocole employé réinjecte les prédictions de transcrits d’un gène source exprimable chez un gène cible dans le répertoire de l’espèce cible. Cela vise à compléter les connaissances actuelles et à annoter le transcriptome des espèces, en particulier celui du chien encore peu documenté. 7 201 transcrits sont ainsi prédits. A partir de là, la construction de graphes de relations d’orthologie a été mise en place pour apporter une vision sur l’évolution des gènes et sur leurs transcrits exprimés. 83 triplets de gènes orthologues ont pu être retrouvés comme présentant une structure fine de gène identique entre les trois espèces, partagée depuis l’ancêtre Eutheria. Ces résultats montrent ainsi une première piste de compréhension en terme d'évolution (gain et de perte d’information) dans les structures de gènes.
Fichier principal
Vignette du fichier
M2_NGuillaudeux_181206.pdf (4.07 Mo) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-01948461 , version 1 (10-12-2018)

Identifiers

  • HAL Id : hal-01948461 , version 1

Cite

Nicolas Guillaudeux. Prédiction de transcriptome : analyse comparative multi-gènes, orthologues. Bio-informatique [q-bio.QM]. 2018. ⟨hal-01948461⟩
84 View
166 Download

Share

Gmail Facebook Twitter LinkedIn More