Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Mémoires D'étudiants -- Hal-Inria+ Année : 2011

Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques

Résumé

A l'heure où les banques de séquences génomiques débordent, l'annotation automatique de celles-ci est devenu un problème crucial. De nombreuses familles ont déjà été caractérisées et l'enjeu aujourd'hui est d'aller vers des modèles toujours plus expressifs. C'est dans ce contexte que s'inscrit l'objectif de ce stage. Nous développons ainsi une approche basée sur l'apprentissage de langages algébriques capables de modéliser des familles de protéines afin de reconnaitre de nouvelles séquences non encore annotées. En effet, alors que les représentations actuelles ne prennent pas les interactions à longues distance d'une séquence, l'utilisation des grammaires hors-contexte dans ce but devrait ainsi permettre l'obtention d'un modèle plus proche de la structure.
Fichier non déposé

Dates et versions

hal-00639334 , version 1 (08-11-2011)

Identifiants

  • HAL Id : hal-00639334 , version 1

Citer

Gaelle Garet. Apprentissage de grammaires algébriques par alignement multiple de séquences protéiques. Bio-Informatique, Biologie Systémique [q-bio.QM]. 2011. ⟨hal-00639334⟩
86 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More