3543 articles – 5273 Notices  [english version]

inria-00000453, version 1

FouDanGA : Fouille de données pour l'annotation de génomes d'actinomycètes

Jean-François Mari () 1, Fabrice Touzain () 2, Sébastien Hergalant () 1, Isabelle Debled-Rennesson () 2

(2005)

Résumé : L'accumulation des séquences issues des projets de séquençage oblige la mise en œuvre de méthodes de fouilles de données pour comprendre les mécanismes impliqués dans l'expression, la transmission et l'évolution des gènes. Nous nous intéressons aux méthodes combinatoires et stochastiques permettant de prédire les séquences promotrices et autres petites séquences régulatrices chez les bactéries. Deux approches informatiques sont développées. La première correspond à l'utilisation d'algorithmes de recherche de mots puis de couples de mots sur-représentés dans les régions en amont de gènes orthologues d'espèces phylogénétiquement proches. La seconde correspond à une méthode de fouille de données génomiques sans a priori pour faire émerger des sous-séquences d'ADN dans les régions intergéniques. Le processus de fouille de données se traduit par la spécification de modèles de Markov cachés du second-ordre (HMM2), leur apprentissage et leur utilisation pour faire apparaître des irrégularités dans des grandes séquences d'ADN.

  • 1 :  ORPAILLEUR (INRIA Lorraine - LORIA)
  • INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
  • 2 :  ADAGE (INRIA Lorraine - LORIA)
  • INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
  • Domaine : Informatique/Intelligence artificielle
    Sciences du Vivant/Biochimie, Biologie Moléculaire/Génomique, Transcriptomique et Protéomique
  • Mots-clés : fouille de données – approche comparative – SFFT – facteur sigma
  • Commentaire : Poster de présentation de l'ACI FouDanga aux journées JOBIM 2005 (Lyon) : rapport d'avancement à 1 an.
 
  • inria-00000453, version 1
  • oai:hal.inria.fr:inria-00000453
  • Contributeur : 
  • Soumis le : Mardi 18 Octobre 2005, 11:55:06
  • Dernière modification le : Mercredi 28 Juin 2006, 12:19:44