28572 articles – 22062 Notices  [english version]

hal-00018114, version 2

A unifying framework for seed sensitivity and its application to subset seeds.

Gregory Kucherov () 12, Laurent Noé (Auteur à contacter de préférence) 12, Mihkail Roytberg () 3

Journal of Bioinformatics and Computational Biology 4, 2 (2006) 553-69

Résumé : We propose a general approach to compute the seed sensitivity, that can be applied to different definitions of seeds. It treats separately three components of the seed sensitivity problem--a set of target alignments, an associated probability distribution, and a seed model--that are specified by distinct finite automata. The approach is then applied to a new concept of subset seeds for which we propose an efficient automaton construction. Experimental results confirm that sensitive subset seeds can be efficiently designed using our approach, and can then be used in similarity search producing better results than ordinary spaced seeds.

  • 1 :  Laboratoire d'Informatique Fondamentale de Lille (LIFL)
  • CNRS : UMR8022 – Université Lille I - Sciences et technologies – Université Lille III - Sciences humaines et sociales – INRIA
  • 2 :  SEQUOIA (INRIA Lille - Nord Europe)
  • INRIA – CNRS : UMR8022 – Université Lille I - Sciences et technologies – Université Lille III - Sciences humaines et sociales
  • 3 :  Institute of Mathematical Problems in Biology (IMPB RAS)
  • Russian Academy of Science
  • Domaine : Informatique/Bio-informatique
    Sciences du Vivant/Bio-Informatique, Biologie Systémique
  • Versions disponibles :  v1 (27-01-2006) v2 (15-09-2006)
 
  • hal-00018114, version 2
  • oai:hal.archives-ouvertes.fr:hal-00018114
  • Contributeur : 
  • Soumis le : Jeudi 14 Septembre 2006, 17:58:36
  • Dernière modification le : Jeudi 21 Juillet 2011, 14:13:44