Apprentissage d'automates par fusions de paires de fragments significativement similaires et premières expérimentations sur les protéines MIP

François Coste 1 Goulven Kerbellec 1 Boris Idmont 1 Daniel Fredouille 1 Christian Delamarche 2
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Nous proposons une nouvelle approche permettant d'apprendre des automates non déterministes pour la caractérisation et la modélisation de séquences protéiques. Cette approche est basée sur la fusion de fragments significativement similaires pour la caractérisation de la famille. Trois heuristiques d'ordonnancement des paires de fragment sont introduites, dont une utilisant la présence de contre-exemples, et un processus de généralisation, basé sur l'identification des propriétés physico-chimiques des acides aminés, est proposé. Les premières expérimentations menées sur la caractérisation de protéines de la famille MIP montrent la pertinence des automates appris, attestée par un bon pouvoir de prédiction. Mots clés : Inférence d'automates, découverte de motifs, séquences protéiques, propriétés physico-chimiques des acides aminés.
Document type :
Reports
Complete list of metadatas

Cited literature [13 references]  Display  Hide  Download

https://hal.inria.fr/inria-00071412
Contributor : Rapport de Recherche Inria <>
Submitted on : Tuesday, May 23, 2006 - 5:21:57 PM
Last modification on : Friday, November 16, 2018 - 1:21:58 AM
Long-term archiving on : Tuesday, February 22, 2011 - 11:56:12 AM

Identifiers

  • HAL Id : inria-00071412, version 1

Citation

François Coste, Goulven Kerbellec, Boris Idmont, Daniel Fredouille, Christian Delamarche. Apprentissage d'automates par fusions de paires de fragments significativement similaires et premières expérimentations sur les protéines MIP. [Rapport de recherche] RR-5176, INRIA. 2004. ⟨inria-00071412⟩

Share

Metrics

Record views

378

Files downloads

284