Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques

Gaelle Garet 1
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : A l'heure où les banques de séquences génomiques débordent, l'annotation automatique de celles-ci est devenu un problème crucial. De nombreuses familles ont déjà été caractérisées et l'enjeu aujourd'hui est d'aller vers des modèles toujours plus expressifs. C'est dans ce contexte que s'inscrit l'objectif de ce stage. Nous développons ainsi une approche basée sur l'apprentissage de langages algébriques capables de modéliser des familles de protéines afin de reconnaitre de nouvelles séquences non encore annotées. En effet, alors que les représentations actuelles ne prennent pas les interactions à longues distance d'une séquence, l'utilisation des grammaires hors-contexte dans ce but devrait ainsi permettre l'obtention d'un modèle plus proche de la structure.
Liste complète des métadonnées

https://hal.inria.fr/hal-00639334
Contributor : François Coste <>
Submitted on : Tuesday, November 8, 2011 - 5:51:11 PM
Last modification on : Friday, November 16, 2018 - 1:24:20 AM

Identifiers

  • HAL Id : hal-00639334, version 1

Citation

Gaelle Garet. Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques. Bio-Informatique, Biologie Systémique [q-bio.QM]. 2011. ⟨hal-00639334⟩

Share

Metrics

Record views

157