inria-00000453, version 1
FouDanGA : Fouille de données pour l'annotation de génomes d'actinomycètes
(2005)
Abstract: L'accumulation des séquences issues des projets de séquençage oblige la mise en œuvre de méthodes de fouilles de données pour comprendre les mécanismes impliqués dans l'expression, la transmission et l'évolution des gènes. Nous nous intéressons aux méthodes combinatoires et stochastiques permettant de prédire les séquences promotrices et autres petites séquences régulatrices chez les bactéries. Deux approches informatiques sont développées. La première correspond à l'utilisation d'algorithmes de recherche de mots puis de couples de mots sur-représentés dans les régions en amont de gènes orthologues d'espèces phylogénétiquement proches. La seconde correspond à une méthode de fouille de données génomiques sans a priori pour faire émerger des sous-séquences d'ADN dans les régions intergéniques. Le processus de fouille de données se traduit par la spécification de modèles de Markov cachés du second-ordre (HMM2), leur apprentissage et leur utilisation pour faire apparaître des irrégularités dans des grandes séquences d'ADN.
- 1:
- INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
- 2:
- INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
- Domain : Computer Science/Artificial Intelligence
Life Sciences/Biochemistry, Molecular Biology/Genomics - Keywords : fouille de données – approche comparative – SFFT – facteur sigma
- Comment : Poster de présentation de l'ACI FouDanga aux journées JOBIM 2005 (Lyon) : rapport d'avancement à 1 an.
- inria-00000453, version 1
- http://hal.inria.fr/inria-00000453
- oai:hal.inria.fr:inria-00000453
- From:
- Submitted on: Tuesday, 18 October 2005 11:55:06
- Updated on: Wednesday, 28 June 2006 12:19:44


Associated documents

Export