Clustering high-throughput sequencing data with Poisson mixture models

Résumé : De plus en plus, les études d'expression de gènes utilisent les techniques de séquençage de nouvelle génération, entraînant une recherche grandissante sur les méthodes les plus appropriées pour l'exploitation des données digitales d'expression, à commencer pour leur normalisation et l'analyse différentielle. Ici, nous nous intéressons à la classification non supervisée des profils d'expression pour la découverte de groupes de gènes coexprimés. Nous proposons deux paramétrisations d'un modèle de mélange de Poisson pour classer des données de séquençage haut-débit. Par des simulations, nous comparons les performances de ces modèles avec des méthodes similaires conçus pour l'analyse en série de l'expression des gènes (SAGE). Nous étudions aussi les performances de ces modèles sur deux jeux de données réelles. Le package R HTSCluster associé à cette étude est disponible sur le CRAN.
Type de document :
Rapport
[Research Report] RR-7786, INRIA. 2011, pp.36
Liste complète des métadonnées

Littérature citée [32 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01193758
Contributeur : Andrea Rau <>
Soumis le : jeudi 3 novembre 2011 - 18:26:48
Dernière modification le : mercredi 28 février 2018 - 10:22:59
Document(s) archivé(s) le : samedi 4 février 2012 - 02:30:40

Fichiers

RR-7786.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01193758, version 2

Citation

Andrea Rau, Gilles Celeux, Marie-Laure Martin-Magniette, Cathy Maugis-Rabusseau. Clustering high-throughput sequencing data with Poisson mixture models. [Research Report] RR-7786, INRIA. 2011, pp.36. 〈hal-01193758v2〉

Partager

Métriques

Consultations de la notice

1314

Téléchargements de fichiers

1178