Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques

Gaelle Garet 1
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : A l'heure où les banques de séquences génomiques débordent, l'annotation automatique de celles-ci est devenu un problème crucial. De nombreuses familles ont déjà été caractérisées et l'enjeu aujourd'hui est d'aller vers des modèles toujours plus expressifs. C'est dans ce contexte que s'inscrit l'objectif de ce stage. Nous développons ainsi une approche basée sur l'apprentissage de langages algébriques capables de modéliser des familles de protéines afin de reconnaitre de nouvelles séquences non encore annotées. En effet, alors que les représentations actuelles ne prennent pas les interactions à longues distance d'une séquence, l'utilisation des grammaires hors-contexte dans ce but devrait ainsi permettre l'obtention d'un modèle plus proche de la structure.
Type de document :
Mémoires d'étudiants -- Hal-inria+
Bio-Informatique, Biologie Systémique [q-bio.QM]. 2011
Liste complète des métadonnées

https://hal.inria.fr/hal-00639334
Contributeur : François Coste <>
Soumis le : mardi 8 novembre 2011 - 17:51:11
Dernière modification le : vendredi 16 novembre 2018 - 01:24:20

Identifiants

  • HAL Id : hal-00639334, version 1

Collections

Citation

Gaelle Garet. Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques. Bio-Informatique, Biologie Systémique [q-bio.QM]. 2011. 〈hal-00639334〉

Partager

Métriques

Consultations de la notice

152