A New Challenge for Compression Algorithms: Genetic Sequences - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Information Processing and Management Année : 1994

A New Challenge for Compression Algorithms: Genetic Sequences

(1) , (1)
1
Stéphane Grumbach
Fariza Tahi
  • Fonction : Auteur

Résumé

Universal data compression algorithms fail to compress genetic sequences. It is due to the specificity of this particular kind of "text". We analyze in some details the properties of the sequences, which cause the failure of classical algorithms. We then present a lossless algorithm, biocompress-2, to compress the information contained in DNA and RNA sequences, based on the detection of regularities, such as the presence of palindromes. The algorithm combines substitutional and statistical...
Fichier principal
Vignette du fichier
grumbach.pdf (207.19 Ko) Télécharger le fichier
Vignette du fichier
biocompress/.DS_Store (6 Ko) Télécharger le fichier
Vignette du fichier
biocompress/allocb2.c (633 B) Télécharger le fichier
Vignette du fichier
biocompress/arith-2-memetable.c (38.99 Ko) Télécharger le fichier
Vignette du fichier
biocompress/autn.c (4.58 Ko) Télécharger le fichier
Vignette du fichier
biocompress/auton3 (56 Ko) Télécharger le fichier
Vignette du fichier
biocompress/Biocompress (64 Ko) Télécharger le fichier
Vignette du fichier
biocompress/Biocompress-2 (100.26 Ko) Télécharger le fichier
Vignette du fichier
biocompress/Biocompress.c (12.54 Ko) Télécharger le fichier
Vignette du fichier
biocompress/Biocompress2.c (16.4 Ko) Télécharger le fichier
Vignette du fichier
biocompress/bitio.c (5.13 Ko) Télécharger le fichier
Vignette du fichier
biocompress/bitio.h (1.47 Ko) Télécharger le fichier
Vignette du fichier
biocompress/codeb3.c (1.03 Ko) Télécharger le fichier
Vignette du fichier
biocompress/encode13.c (15.72 Ko) Télécharger le fichier
Vignette du fichier
biocompress/errhand.c (648 B) Télécharger le fichier
Vignette du fichier
biocompress/errhand.h (334 B) Télécharger le fichier
Vignette du fichier
biocompress/main-c.c (4.48 Ko) Télécharger le fichier
Vignette du fichier
biocompress/main-e.c (2.91 Ko) Télécharger le fichier
Vignette du fichier
biocompress/main.h (532 B) Télécharger le fichier
Vignette du fichier
biocompress/Makefile-Biocompress (406 B) Télécharger le fichier
Vignette du fichier
biocompress/Makefile-Biocompress-2 (823 B) Télécharger le fichier
Vignette du fichier
biocompress/ReadMe (488 B) Télécharger le fichier
Vignette du fichier
biocompress/typeb2.h (755 B) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre
Format : Autre

Dates et versions

inria-00180949 , version 1 (22-10-2007)

Identifiants

  • HAL Id : inria-00180949 , version 1

Citer

Stéphane Grumbach, Fariza Tahi. A New Challenge for Compression Algorithms: Genetic Sequences. Information Processing and Management, 1994, Information processing & management, 30. ⟨inria-00180949⟩

Collections

INRIA INRIA2
370 Consultations
2293 Téléchargements

Partager

Gmail Facebook Twitter LinkedIn More