Modélisation du prétraitement des textes

Thomas Heitz

Communication Dans Un Congrès Année : 2006

Modélisation du prétraitement des textes

(1, 2)

1
2

Thomas Heitz

Fonction : Auteur
PersonId : 836597

Laboratoire de Recherche en Informatique

Algorithmic number theory for cryptology

Résumé

Dans cet article, nous définissons un modèle pour l'étape de prétraitement des textes dans le cadre de la fouille de textes et plus généralement de l'extraction d'informations à partir de textes. Cet article ne contient pas les détails de l'implémentation. L'objectif est d'obtenir un modèle générique de normalisation des textes bruts. La motivation de cet article est de généraliser les travaux assez confidentiels et spécialisés qui existent pour cette étape de prétraitement. Cette étape est pourtant incontournable et d'elle dépend grandement la qualité des analyses obtenues à toutes les étapes ultérieures.

Domaines

Traitement du texte et du document

Fichier principal

heitz_JADT2006.pdf (53.17 Ko)

Slides_jadt2006.pdf (498.54 Ko)

heitz_JADT2006_poster.pdf (416.04 Ko)

Origine : Fichiers éditeurs autorisés sur une archive ouverte

Format : Autre

Thomas Heitz : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00119608

Soumis le : lundi 11 décembre 2006-14:12:13

Dernière modification le : samedi 10 février 2024-03:07:53

Archivage à long terme le : mardi 6 avril 2010-19:23:40

Dates et versions

inria-00119608 , version 1 (11-12-2006)

Identifiants

HAL Id : inria-00119608 , version 1

Citer

Thomas Heitz. Modélisation du prétraitement des textes. JADT'06 (International Conference on Statistical Analysis of Textual Data), 2006, Besançon, France, pp.499-506. ⟨inria-00119608⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

X EC-PARIS CNRS INRIA LIX X-LIX X-DEP-INFO UMR8623 INRIA2 UNIV-PARIS-SACLAY

170 Consultations

1289 Téléchargements

Modélisation du prétraitement des textes

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager