Recherches de motifs et de similarités en bioinformatique : modélisations, solutions logicielles et matérielles

Mathieu Giraud 1 Laurent Noé 2 Gregory Kucherov 2 Dominique Lavenier 1
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
2 ADAGE - Applying discrete algorithms to genomics
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Ce tutoriel expose certains problèmes fondamentaux en algorithmique du texte pour la bioinformatique, leurs solutions actuelles ainsi que quelques perspectives de recherche. Après une introduction expliquant pourquoi la bioinformatique s'intéresse aux séquences de caractères et d'où provient le problème de recherche de motifs, nous présentons de façon progressive différentes modélisations des motifs (partie 2). Un motif peut être un simple mot ou un ensemble de mots que l'on recherche de manière exacte ou approchée, par similarités. Plus généralement, on définit un motif comme un langage pouvant se situer à différents niveaux de la hiérarchie de Chomsky et formalisable par des structures telles que des grammaires ou des automates. Le tutoriel se poursuit par la présentation des méthodes logicielles ou matérielles qui résolvent les recherches de motifs selon la modélisation choisie (partie 3). Ces algorithmes s'effectuent avec ou sans pré-traitements du motif ou de la banque de séquences. Quand les motifs deviennent complexes, la recherche par balayage devient la seule solution possible, que cela soit par heuristique ou de manière exacte. Nous évoquerons aussi les architectures spécialisées destinées à traiter de grandes quantités de données : ces machines doivent équilibrer puissance de calcul et accès aux données.
Document type :
Conference papers
Complete list of metadatas

https://hal.inria.fr/inria-00001036
Contributor : Elodie Foret <>
Submitted on : Tuesday, January 17, 2006 - 9:53:14 AM
Last modification on : Friday, November 16, 2018 - 1:22:51 AM
Long-term archiving on : Saturday, April 3, 2010 - 9:26:49 PM

File

Identifiers

  • HAL Id : inria-00001036, version 1

Citation

Mathieu Giraud, Laurent Noé, Gregory Kucherov, Dominique Lavenier. Recherches de motifs et de similarités en bioinformatique : modélisations, solutions logicielles et matérielles. MajecSTIC 2005 : Manifestation des Jeunes Chercheurs francophones dans les domaines des STIC, IRISA – IETR – LTSI, Nov 2005, Rennes/France, pp.18--37. ⟨inria-00001036⟩

Share

Metrics

Record views

742

Files downloads

780