Accurate prediction of the statistics of repetitions in random sequences: a case study in Archaea genomes

Mireille Regnier 1, 2 Philippe Chassignet 2, 1
1 AMIB - Algorithms and Models for Integrative Biology
CNRS - Centre National de la Recherche Scientifique : UMR8623, X - École polytechnique, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique, LIX - Laboratoire d'informatique de l'École polytechnique [Palaiseau]
Abstract : Repetitive patterns in genomic sequences have a great biological significance and also algorithmic implications. Analytic combinatorics allow to derive formula for the expected length of repetitions in a random sequence. Asymptotic results, that generalize previous works on a binary alphabet, are easily computable. Simulations on random sequences show their accuracy. As an application, the sample case of Archaea genomes illustrates how biological sequences may differ from random sequences.
Type de document :
Article dans une revue
Frontiers in Bioengineering and Biotechnology, Frontiers, 2016
Liste complète des métadonnées

Littérature citée [18 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01304366
Contributeur : Mireille Regnier <>
Soumis le : mardi 19 avril 2016 - 16:29:54
Dernière modification le : jeudi 12 avril 2018 - 01:50:12
Document(s) archivé(s) le : mardi 15 novembre 2016 - 06:28:56

Fichier

revision4.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01304366, version 1

Citation

Mireille Regnier, Philippe Chassignet. Accurate prediction of the statistics of repetitions in random sequences: a case study in Archaea genomes. Frontiers in Bioengineering and Biotechnology, Frontiers, 2016. 〈hal-01304366〉

Partager

Métriques

Consultations de la notice

510

Téléchargements de fichiers

68