Analyse des Séquences InterORF chez les Levures - Application à la Recherche des petits ARN

Résumé : La somme considérable de données brutes extraites des programmes de séquençage nécessite de nouvelles techniques d'analyse. La première étape dans l'exploitation des génomes consiste à rechercher les régions codantes des protéines ORF (Open Reading Frame). Les séquences situées entres ces ORF, qui peuvent coder des ARN stables ou des ARN régulateurs, sont plus difficiles à étudier bien que très importantes. Le développement d'outils d'analyse appropriés à l'étude de ces régions est donc un challenge de premier ordre dans l'ère post-génomique. Nous travaillons actuellement sur les génomes de levures Hémiascomycètes. En plus du génome complet de S. cerevisiae, une étude récente - le projet Génolevures (1) - portant sur 13 espèces représentatives de la classe des Hémiascomycètes, a donné naissance à une base de données conséquente. A partir de ces données nous avons extrait les séquences interORF. A côté de cette approche déductive, nous utilisons un outil issu de l'apprentissage statistique (SVM pour Support Vector Machine) afin d'obtenir par une autre approche les bases de séquences interORF. La comparaison des différentes bases de données obtenues (par déduction ou par discrimination) nous permettra de juger de l'intérêt de ces modèles de reconnaissance de formes dans l'exploitation des bases de données génomiques. La seconde application directe de la technique SVM sera la recherche de séquences d'intérêts (snoRNA) sur les bases de données interORF de levures. Une étape d'amélioration de la recherche sera ensuite mise en place par intégration de paramètres supplémentaires (données de motifs connus ou déduites d'analyses comparatives entre les génomes).
Type de document :
Communication dans un congrès
Structure, Intégration, Fonction et Réactivité des ARN - SIFRARN, Oct 2002, Nancy, France, 2002
Liste complète des métadonnées

https://hal.inria.fr/inria-00101006
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 14:53:29
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51

Identifiants

  • HAL Id : inria-00101006, version 1

Collections

Citation

Emmanuel Gothié, Yann Guermeur, Fabrice Leclerc, Christiane Branlant, Alexander Bockmayr. Analyse des Séquences InterORF chez les Levures - Application à la Recherche des petits ARN. Structure, Intégration, Fonction et Réactivité des ARN - SIFRARN, Oct 2002, Nancy, France, 2002. 〈inria-00101006〉

Partager

Métriques

Consultations de la notice

79