inria-00185428, version 1
Parsing avec erreurs par un protomate
(2007)
Résumé : Mon stage a consisté en l'implémentation en langage C d'un parseur permettant de scanner rapidement une banque de données de séquences protéiques. Le scan permet de connaître l'appartenance des séquences à une famille modélisée par un automate pondéré. Les séquences rendues par le scan peuvent appartenir exactement à la famille ou être à une faible distance de celleci. À la fin du scan on obtient un score résumant l'adéquation automateséquence. Ce programme a été complété par une option permettant de mémoriser pour chaque séquence de la banque de données quel chemin a été pris dans l'automate, et l'évolution du score en fonction de l'avancement dans la séquence. Nous avons également réfléchi à la mise en ligne du programme et pour cela nous avons travaillé sur le découpage en modules de l'interface Web.
- a – Institut National des Sciences Appliquées de Rennes
- 1 : SYMBIOSE (INRIA - IRISA)
- CNRS : UMR6074 – INRIA – INSA Rennes – Université de Rennes 1
- Domaine : Sciences du Vivant/Bio-Informatique, Biologie Systémique
- inria-00185428, version 1
- http://hal.inria.fr/inria-00185428
- oai:hal.inria.fr:inria-00185428
- Contributeur : François Coste
- Soumis le : Mardi 6 Novembre 2007, 09:20:33
- Dernière modification le : Mardi 6 Novembre 2007, 09:22:41






Documents associés
Exporter