Compareads: comparing huge metagenomic experiments - Archive ouverte HAL Access content directly
Poster Communications Year : 2012

Compareads: comparing huge metagenomic experiments

(1) , (1) , (1) , (1) , (1)
1

Abstract

Nowadays, metagenomic sample analyses are mainly achieved by comparing them with a priori knowledge stored in data banks. Even if powerful, such approaches do not allow to exploit unknown and/or "unculturable" species, for instance estimated at 99% for Bacteria. This work introduces Compareads, a de novo comparative metagenomic approach that returns the reads that are similar between two possibly metagenomic datasets generated by High Throughput Sequencers. One originality of this work consists in its ability to deal with huge datasets. The time and memory features make Compareads usable on read sets each composed of more than 100 million Illumina reads in a few hours and consuming 4Gb of memory, and thus usable on today's personal computers. Compareads is released under the CeCILL license and can be freely downloaded from http://alcovna.genouest.org/compareads/.
De nos jours, les analyses de séquences métagénomiques sont principalement menées par comparaison avec les connaissances des bases de données biologiques. Bien que puissantes, ces approches ne permettent pas d'étudier les espèces inconnues et/ou non-cultivables, estimées à 99% chez les bactéries. Ce poster présente Compareads, une approche de métagénomique comparative de novo qui permet de trouver les lectures similaires entre deux jeux de données métagénomique générés par les NGS. Une des originalités de cette approche est la possibilité d'analyser de très grands jeux de données. L'efficacité en temps et en mémoire de Compareads permet de traiter des jeux de données composés de plusieurs centaines de millions de lecture Illumina en quelques heures, en utilisant 4Go de mémoire. Ces performances rendent l'outil utilisable sur les ordinateurs portables actuels. Compareads est disponible sous licence CeCILL et peut être gratuitement téléchargé à l'adresse suivante : http://alcovna.genouest.org/compareads/
Fichier principal
Vignette du fichier
poster_nico_maillet.pdf (1.38 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-00760332 , version 1 (03-12-2012)

Identifiers

  • HAL Id : hal-00760332 , version 1

Cite

Nicolas Maillet, Claire Lemaitre, Rayan Chikhi, Dominique Lavenier, Pierre Peterlongo. Compareads: comparing huge metagenomic experiments. 13e édition des Journées Ouvertes en Biologie, Informatique et Mathématiques - JOBIM 2012, Jul 2012, Rennes, France. 2012. ⟨hal-00760332⟩
321 View
79 Download

Share

Gmail Facebook Twitter LinkedIn More