kisSplice, détection d'évènements d'épissages alternatifs dans les données RNA-seq - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2011

kisSplice, détection d'évènements d'épissages alternatifs dans les données RNA-seq

Résumé

In this paper, we address the problem of identifying polymorphisms in RNA-seq data when no reference genome is available, without performing an assembly of the transcripts. Based on the fundamental idea that each polymor- phism will correspond to a recognisable pattern in a De Bruijn graph constructed from the RNA-seq reads, we propose a general model for all polymorphisms in such graphs. We then introduce an exact algorithm to extract alternative splic- ing events and show that it enables to identify more correct events than current transcriptome assemblers. Additionally, when we applied our method on a 71M reads dataset from human, we were able to identify 3884 events, out of which 57% are not present in the annotations, which con rms recent estimates show- ing that the complexity of alternative splicing has been largely underestimated so far.
Nous proposons une approche permettant l'identi cation de poly- morphismes dans les données RNA-seq. Nous nous plaçons dans le cadre où l'on ne dispose pas de génome de référence et où l'on ne construit pas par as- semblage un tel génome. Notre approche s'appuie sur l'idée fondamentale que chaque polymorphisme génère un motif reconnaissable dans le graphe de De- Bruijn construit à partir des données RNA-seq. Nous proposons un modèle général pour tout type de polymorphisme avant de proposer un algorithme ex- act pour la détection d'évènements d'épissages alternatifs. Nous montrons que cette approche détecte plus nement ces évènements que les approches basées sur l'assemblage des données. Nous avons appliqué notre approche sur un jeux de données de 71 millions de lectures provenant de cellules humaines. Ceci nous a permis d'identi er 3884 évènements, dont 57% n'étaient pas référencés dans les annotations. Ceci con rme les estimations récentes qui démontrent que la complexité de l'épissage alternative à largement été sous estimé jusqu'à présent.
Fichier principal
Vignette du fichier
RR-7852.pdf (956.15 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00654249 , version 1 (21-12-2011)
hal-00654249 , version 2 (20-01-2012)

Identifiants

  • HAL Id : hal-00654249 , version 2
  • PRODINRA : 244189

Citer

Gustavo Akio Tominaga Sacomoto, J. Kielbassa, Pavlos Antoniou, Rayan Chikhi, Raluca Uricaru, et al.. kisSplice, détection d'évènements d'épissages alternatifs dans les données RNA-seq. [Research Report] RR-7852, INRIA. 2011, pp.12. ⟨hal-00654249v2⟩
437 Consultations
348 Téléchargements

Partager

Gmail Facebook X LinkedIn More