Identification rapide de familles protéiques par dominance

Mathilde Le Boudic-Jamin; Noël Malod-Dognin; Alexandre Cornu; Jacques Nicolas; Rumen Andonov

Communication Dans Un Congrès Année : 2011

Identification rapide de familles protéiques par dominance

(1) , (2) , (1) , (1) , (1)

1
2

Mathilde Le Boudic-Jamin

Fonction : Auteur correspondant
PersonId : 905810

Connectez-vous pour contacter l'auteur

Biological systems and models, bioinformatics and sequences

Noël Malod-Dognin

Fonction : Auteur
PersonId : 883298

Algorithms, Biology, Structure

Alexandre Cornu

Fonction : Auteur
PersonId : 856774

Biological systems and models, bioinformatics and sequences

Jacques Nicolas

Fonction : Auteur
PersonId : 5225
IdHAL : jacques-nicolas
IdRef : 116276142

Biological systems and models, bioinformatics and sequences

Rumen Andonov

Fonction : Auteur
PersonId : 180618
IdHAL : rumen-andonov
ORCID : 0000-0003-4842-7102
IdRef : 110438221

Biological systems and models, bioinformatics and sequences

Résumé

Structural comparison of proteins is a frequent and important operation in bioinformatics, giving precious information for determining the possible functions of proteins. Unfortunately, the corresponding optimization problems are often NP-Hard. Different analysis approaches exist: Most are based on the superimposition of residue coordinates (like VAST) or on the comparison of internal distances. The objective is to quickly identify and classify similar structures. We used the comparison tool A_purva, which is based on Contact Map Overlap (CMO), to classify protein structure coming from the CATH database. The obtained results show that A_purva was able to correctly classify 92% of the structures, and that introducing the notion of dominance drastically reduces the computational time needed for classifying the protein structures.

La comparaison de stuctures protéiques est une opération fréquente et importante dans le domaine de la bioinformatique. Elle apporte des informations aidant à la détermination des fonctions d'une protéine. Néanmoins, le problème sous-jacent est NP-complet. Différentes approches d'analyse existent: certaines basées sur la superposition de coordonnées (e.g. VAST) et d'autres sur les distances internes conservées dans les structures. L'objectif est donc d'identifier et de classer rapidement des structures similaires. Nous avons classé des structures de la base de données CATH avec un programme nommé A_purva qui utilise l'approche CMO (Conctact Map Overlap). Nous montrons que ce dernier a permis de prédire correctement la classification de 92% des structures soumises et que l'introduction de la notion de dominance a réduit considérablement les temps de classement des protéines.

Mots clés

Protein comparison alignment branch and bounds dominance

Domaines

Bio-informatique [q-bio.QM] Bio-Informatique, Biologie Systémique [q-bio.QM]

Fichier principal

RR-7696.pdf (308.14 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Noel Malod-Dognin : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00611457

Soumis le : mardi 26 juillet 2011-13:53:40

Dernière modification le : vendredi 24 mars 2023-14:52:54

Archivage à long terme le : dimanche 4 décembre 2016-07:53:53

Dates et versions

inria-00611457 , version 1 (26-07-2011)

Identifiants

HAL Id : inria-00611457 , version 1

Citer

Mathilde Le Boudic-Jamin, Noël Malod-Dognin, Alexandre Cornu, Jacques Nicolas, Rumen Andonov. Identification rapide de familles protéiques par dominance. 12th Annual Congress of the French National Society of Operations Research and Decision Science (ROADEF), École Nationale Supérieure des Mines de Saint-Étienne, Mar 2011, Saint-Étienne, France. pp.791-792. ⟨inria-00611457⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA IRISA-D7 INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE ANR UR1-MATH-NUM

142 Consultations

85 Téléchargements

Identification rapide de familles protéiques par dominance

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager