Caractérisation en séquence et en structure des protéines virales - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Mémoires D'étudiants -- Hal-Inria+ Année : 2015

Caractérisation en séquence et en structure des protéines virales

Résumé

Viruses play an important role in marine ecology, but their diversity and exact roles remain unclear. It seems particularly interesting to make use of the newly available metagenomics data collected from the TARA-Oceans program, to start evaluating the diversity and the impact of marine viruses. Nonetheless, viruses harbor a high mutation rate in their genome, which makes difficult their correct identification. The aim of this internship was to improve viruses identification in metagenomics data exploring two different type of information for characterizing two viral proteins families : the RNA-dependent RNA-polymerases (RdRps), which is conserved in primary sequence and is found in all RNA viruses, and the capsid proteins, which are characteristic of viruses, and are conserved in structure. The characterization of RdRps sequences has confirmed the difficulty to identify them because of the high mutation rate, and the difficulty to discriminate them from eukaryotics RdRps. This was the case for all the different methods we applied, like BLAST, HMMER and Protomata, and even with the parameter optimization done for this last one. The study of the specificity of contact fragments (pair of carbon ribbons segments interacting ) of capsid proteins was very promising. Indeed, it allowed us to identify characteristic fragments of viruses.
Les virus jouent un rôle important dans l’écologie marine mais leur diversité et leurs rôles demeurent peu connus. Il semble particulièrement intéressant de profiter de la collecte des données métagénomiques du programme TARA-Oceans pour commencer à évaluer la diversité et l’impact de ces virus marins. Toutefois, les génomes de virus possèdent un fort taux de mutation qui rend leur identification difficile. Le but de ce stage était d’améliorer l’identification des virus dans les données métagénomiques en explorant deux sources d’informations différentes pour caractériser deux familles de protéines virales : les ARN-polymérases ARN-dépendantes (RdRps) conservées en séquence et présentes chez tous les virus à ARN, et les protéines de capsides, caractéristiques des virus et conservées en structure. La caractérisation en séquences des RdRps a confirmé la difficulté à identifier ces séquences qui mutent beaucoup et à les distinguer des RdRps cellulaires, malgré l’utilisation de différents outils tels que BLAST, HMMER et Protomata ainsi qu’un effort de paramétrisation de ce dernier. L’étude de la spécificité des fragments de contact (paire de segments de squelette carboné en interaction) des protéines de capsides s’est en revanche révélée prometteuse puisqu’elle nous a permis d’identifier des fragments caractéristiques des virus.
Fichier principal
Vignette du fichier
Maud_JUSOT_rapport_de_stage_M2BI_2015 (1).pdf (1.82 Mo) Télécharger le fichier
Loading...

Dates et versions

hal-01246372 , version 1 (18-12-2015)

Identifiants

  • HAL Id : hal-01246372 , version 1

Citer

Maud Jusot. Caractérisation en séquence et en structure des protéines virales : Etude de l’ARN-polymérase ARN-dépendante et des protéines de capside. Bio-Informatique, Biologie Systémique [q-bio.QM]. 2015. ⟨hal-01246372⟩
182 Consultations
300 Téléchargements

Partager

Gmail Facebook X LinkedIn More