Classification et caractérisation de familles enzymatiques à l'aide de méthodes formelles - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Thèse Année : 2014

Classification and characterization of enzymatic families with formal methods

Classification et caractérisation de familles enzymatiques à l'aide de méthodes formelles

Résumé

This thesis proposes a new approach to discover signatures of families (and superfamilies) enzymes. At first, given a sample of aligned sequences belonging to the same family, this approach infers context-free grammars characteristic of this family. To do this, new principles of generalization and new classes have been introduced based on substitutability. An algorithm has also been developed for this purpose, which produces a reduced grammar able to retain the structure of examples. In a second step, this manuscript presents a method for classification of a superfamily sequences into families with a formal concept analysis based on alignement sequences allowing detection of new families and the discovery of patterns to improve functional previous signatures.
Cette thèse propose une nouvelle approche de découverte de signatures de familles (et superfamilles) d'enzymes. Dans un premier temps, étant donné un échantillon aligné de séquences appartenant à une même famille, cette approche infère des grammaires algébriques caractérisant cette famille. Pour ce faire, de nouveaux principes de généralisation et de nouvelles classes de langages ont été introduites sur la base de la substituabilité locale. Un algorithme a également été développé à cet effet qui produit une grammaire réduite, conservant la structuration des exemples, d'un langage substituable. Dans un second temps, ce manuscrit présente une méthode de classification des séquences d'une superfamille en familles à l'aide d'une analyse de concepts formels basée sur l'alignement des séquences qui permet la détection de nouvelles familles et la découverte des motifs fonctionnels pour améliorer les signatures précédentes.
Fichier principal
Vignette du fichier
These_Gaelle_Garet.pdf (3.16 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01096916 , version 1 (18-12-2014)
tel-01096916 , version 2 (02-02-2015)

Identifiants

  • HAL Id : tel-01096916 , version 2

Citer

Gaëlle Garet. Classification et caractérisation de familles enzymatiques à l'aide de méthodes formelles. Bio-informatique [q-bio.QM]. Université de Rennes, 2014. Français. ⟨NNT : 2014REN1S082⟩. ⟨tel-01096916v2⟩
353 Consultations
1141 Téléchargements

Partager

Gmail Facebook X LinkedIn More