Mise à jour incrémentale de tableau des suffxes en cours de recodage

François Coste 1 Pierre Peterlongo 1 Matthias Gallé 1
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : De part sa légèreté, sa puissance et sa simplicité, le tableau des suffixes est une structure de données de plus en plus utilisée dans l'algorithmique du texte, en particulier pour les problèmes nécessitant une indexation. Cependant, l'un des points faibles de cette structure réside dans le fait que sa mise à jour, suite à une modification du texte indexé n'est pas aisée. En particulier, elle se prête assez mal à la suppression ou l'ajout de portions de texte. Motivés par des problématiques d'inférence grammaticale, nous cherchons dans ce travail une solution pour mettre à jour le tableau des suffixes suite à la substitution dans le texte indexé de toutes les occurrences d'un mot par un nouveau caractère unique. De ce travail en cours d'aboutissement, nous présenterons les principaux axes algorithmiques ainsi que les premiers résultats, qui sont encourageants.
Complete list of metadatas

https://hal.inria.fr/inria-00186352
Contributor : François Coste <>
Submitted on : Thursday, November 8, 2007 - 5:26:32 PM
Last modification on : Tuesday, January 29, 2019 - 10:02:08 PM

Identifiers

  • HAL Id : inria-00186352, version 1

Citation

François Coste, Pierre Peterlongo, Matthias Gallé. Mise à jour incrémentale de tableau des suffxes en cours de recodage. Algorithmique, combinatoire du texte et applications en bio-informatique, Sep 2007, Chessy, France. ⟨inria-00186352⟩

Share

Metrics

Record views

285