8494 articles  [english version]

hal-00654249, version 2

kisSplice, détection d'évènements d'épissages alternatifs dans les données RNA-seq

Gustavo Akio Tominaga Sacomoto b1, J. Kielbassa b1, Pavlos Antoniou () 2, Rayan Chikhi () a2, Raluca Uricaru () 3, Marie-France Sagot (Auteur à contacter de préférence) b1, Pierre Peterlongo () b2, Vincent Lacroix () c1

N° RR-7852 (2011)

Résumé : In this paper, we address the problem of identifying polymorphisms in RNA-seq data when no reference genome is available, without performing an assembly of the transcripts. Based on the fundamental idea that each polymor- phism will correspond to a recognisable pattern in a De Bruijn graph constructed from the RNA-seq reads, we propose a general model for all polymorphisms in such graphs. We then introduce an exact algorithm to extract alternative splic- ing events and show that it enables to identify more correct events than current transcriptome assemblers. Additionally, when we applied our method on a 71M reads dataset from human, we were able to identify 3884 events, out of which 57% are not present in the annotations, which con rms recent estimates show- ing that the complexity of alternative splicing has been largely underestimated so far.

  • a –  Ecole Normale Supérieure de Cachan, antenne de Bretagne
  • b –  INRIA
  • c –  Université Claude Bernard - Lyon I
  • 1 :  BAMBOO (LBBE Lyon / INRIA Grenoble Rhône-Alpes)
  • Université Claude Bernard - Lyon I – INRIA – CNRS : UMR5558 – Laboratoire de Biométrie et Biologie Evolutive
  • 2 :  SYMBIOSE (INRIA - IRISA)
  • CNRS : UMR6074 – INRIA – Institut National des Sciences Appliquées (INSA) - Rennes – Université de Rennes 1
  • 3 :  Amélioration des Plantes et Biotechnologies Végétales (APBV)
  • Institut national de la recherche agronomique (INRA) : UMR118 – Agrocampus Ouest – Université de Rennes 1
  • Domaine : Informatique/Bio-informatique
    Sciences du Vivant/Bio-Informatique, Biologie Systémique
  • Mots-clés : algorithms – genome – bioinformatics – NGS – alternative transcripts – RNA-seq
  • Référence interne : RR-7852
  • Versions disponibles :  v1 (22-12-2011) v2 (20-01-2012)
 
  • hal-00654249, version 2
  • oai:hal.inria.fr:hal-00654249
  • Contributeur : 
  • Soumis le : Vendredi 20 Janvier 2012, 16:32:44
  • Dernière modification le : Jeudi 22 Novembre 2012, 14:52:18