Mise à jour incrémentale de tableau des suffxes en cours de recodage

François Coste 1 Pierre Peterlongo 1 Matthias Gallé 1
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : De part sa légèreté, sa puissance et sa simplicité, le tableau des suffixes est une structure de données de plus en plus utilisée dans l'algorithmique du texte, en particulier pour les problèmes nécessitant une indexation. Cependant, l'un des points faibles de cette structure réside dans le fait que sa mise à jour, suite à une modification du texte indexé n'est pas aisée. En particulier, elle se prête assez mal à la suppression ou l'ajout de portions de texte. Motivés par des problématiques d'inférence grammaticale, nous cherchons dans ce travail une solution pour mettre à jour le tableau des suffixes suite à la substitution dans le texte indexé de toutes les occurrences d'un mot par un nouveau caractère unique. De ce travail en cours d'aboutissement, nous présenterons les principaux axes algorithmiques ainsi que les premiers résultats, qui sont encourageants.
Type de document :
Communication dans un congrès
Algorithmique, combinatoire du texte et applications en bio-informatique, Sep 2007, Chessy, France. 2007
Liste complète des métadonnées

https://hal.inria.fr/inria-00186352
Contributeur : François Coste <>
Soumis le : jeudi 8 novembre 2007 - 17:26:32
Dernière modification le : mercredi 16 mai 2018 - 11:23:05

Identifiants

  • HAL Id : inria-00186352, version 1

Citation

François Coste, Pierre Peterlongo, Matthias Gallé. Mise à jour incrémentale de tableau des suffxes en cours de recodage. Algorithmique, combinatoire du texte et applications en bio-informatique, Sep 2007, Chessy, France. 2007. 〈inria-00186352〉

Partager

Métriques

Consultations de la notice

281