inria-00071412, version 1
Apprentissage d'automates par fusions de paires de fragments significativement similaires et premières expérimentations sur les protéines MIP
François Coste
a, 1Goulven Kerbellec
1Boris Idmont 1Daniel Fredouille
1Christian Delamarche 2
N° RR-5176 (2004)
Abstract: Nous proposons une nouvelle approche permettant d'apprendre des automates non déterministes pour la caractérisation et la modélisation de séquences protéiques. Cette approche est basée sur la fusion de fragments significativement similaires pour la caractérisation de la famille. Trois heuristiques d'ordonnancement des paires de fragment sont introduites, dont une utilisant la présence de contre-exemples, et un processus de généralisation, basé sur l'identification des propriétés physico-chimiques des acides aminés, est proposé. Les premières expérimentations menées sur la caractérisation de protéines de la famille MIP montrent la pertinence des automates appris, attestée par un bon pouvoir de prédiction. Mots clés : Inférence d'automates, découverte de motifs, séquences protéiques, propriétés physico-chimiques des acides aminés.
- a – INRIA
- 1: SYMBIOSE (INRIA - IRISA)
- CNRS : UMR6074 – INRIA – INSA Rennes – Université de Rennes 1
- 2: Interactions cellulaires et moléculaires (ICM)
- CNRS : UMR6026 – Université de Rennes 1 – IFR140
- Domain : Computer Science/Other
- Keywords : INFERENCE D'AUTOMATES / DECOUVERTE DE MOTIFS / SEQUENCES PROTEIQUES / PROPRIETES PHYSICO-CHIMIQUES DES ACIDES AMINES
- Internal note : RR-5176
- inria-00071412, version 1
- http://hal.inria.fr/inria-00071412
- oai:hal.inria.fr:inria-00071412
- From: Rapport De Recherche Inria
- Submitted on: Tuesday, 23 May 2006 17:21:57
- Updated on: Tuesday, 24 February 2009 10:16:00






Associated documents

Export