8494 articles  [english version]

hal-00654249, version 1

kisSplice, détection de transcrits alternatifs dans les données RNA-seq

Gustavo Akio Tominaga Sacomoto b1, J. Kielbassa b1, Pavlos Antoniou () 2, Rayan Chikhi () a2, Raluca Uricaru () 3, Marie-France Sagot (Auteur à contacter de préférence) b1, Pierre Peterlongo () b2, Vincent Lacroix () 4

N° RR-7852 (2011)

Résumé : In this paper, we address the problem of identifying polymorphisms in RNA-seq data when no reference genome is available, without performing an assembly of the transcripts. Based on the fundamental idea that each polymor- phism will correspond to a recognisable pattern in a De Bruijn graph constructed from the RNA-seq reads, we propose a general model for all polymorphisms in such graphs. We then introduce an exact algorithm to extract alternative splic- ing events and show that it enables to identify more correct events than current transcriptome assemblers. Additionally, when we applied our method on a 71M reads dataset from human, we were able to identify 3884 events, out of which 57% are not present in the annotations, which con rms recent estimates show- ing that the complexity of alternative splicing has been largely underestimated so far.

  • a –  Ecole Normale Supérieure de Cachan, antenne de Bretagne
  • b –  INRIA
  • 1 :  BAMBOO (LBBE Lyon / INRIA Grenoble Rhône-Alpes)
  • Université Claude Bernard - Lyon I – INRIA – CNRS : UMR5558 – Laboratoire de Biométrie et Biologie Evolutive
  • 2 :  SYMBIOSE (INRIA - IRISA)
  • CNRS : UMR6074 – INRIA – Institut National des Sciences Appliquées (INSA) - Rennes – Université de Rennes 1
  • 3 :  Amélioration des Plantes et Biotechnologies Végétales (APBV)
  • Institut national de la recherche agronomique (INRA) : UMR118 – Agrocampus Ouest – Université de Rennes 1
  • 4 :  Laboratoire de Biométrie et Biologie Evolutive (LBBE)
  • Université Claude Bernard - Lyon I – CNRS : UMR5558 – INRIA
  • Domaine : Informatique/Bio-informatique
    Sciences du Vivant/Bio-Informatique, Biologie Systémique
  • Mots-clés : algorithms – genome – bioinformatics – NGS – alternative transcripts – RNA-seq
  • Référence interne : RR-7852
  • Versions disponibles :  v1 (22-12-2011) v2 (20-01-2012)
 
  • hal-00654249, version 1
  • oai:hal.inria.fr:hal-00654249
  • Contributeur : 
  • Soumis le : Mercredi 21 Décembre 2011, 13:22:11
  • Dernière modification le : Mercredi 4 Janvier 2012, 12:13:10