inria-00000453, version 1
FouDanGA : Fouille de données pour l'annotation de génomes d'actinomycètes
(2005)
Résumé : L'accumulation des séquences issues des projets de séquençage oblige la mise en œuvre de méthodes de fouilles de données pour comprendre les mécanismes impliqués dans l'expression, la transmission et l'évolution des gènes. Nous nous intéressons aux méthodes combinatoires et stochastiques permettant de prédire les séquences promotrices et autres petites séquences régulatrices chez les bactéries. Deux approches informatiques sont développées. La première correspond à l'utilisation d'algorithmes de recherche de mots puis de couples de mots sur-représentés dans les régions en amont de gènes orthologues d'espèces phylogénétiquement proches. La seconde correspond à une méthode de fouille de données génomiques sans a priori pour faire émerger des sous-séquences d'ADN dans les régions intergéniques. Le processus de fouille de données se traduit par la spécification de modèles de Markov cachés du second-ordre (HMM2), leur apprentissage et leur utilisation pour faire apparaître des irrégularités dans des grandes séquences d'ADN.
- 1 :
- INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
- 2 :
- INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
- Domaine : Informatique/Intelligence artificielle
Sciences du Vivant/Biochimie, Biologie Moléculaire/Génomique, Transcriptomique et Protéomique - Mots-clés : fouille de données – approche comparative – SFFT – facteur sigma
- Commentaire : Poster de présentation de l'ACI FouDanga aux journées JOBIM 2005 (Lyon) : rapport d'avancement à 1 an.
- inria-00000453, version 1
- http://hal.inria.fr/inria-00000453
- oai:hal.inria.fr:inria-00000453
- Contributeur :
- Soumis le : Mardi 18 Octobre 2005, 11:55:06
- Dernière modification le : Mercredi 28 Juin 2006, 12:19:44


Documents associés

Exporter