Modélisation du prétraitement des textes - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Modélisation du prétraitement des textes

Résumé

Dans cet article, nous définissons un modèle pour l'étape de prétraitement des textes dans le cadre de la fouille de textes et plus généralement de l'extraction d'informations à partir de textes. Cet article ne contient pas les détails de l'implémentation. L'objectif est d'obtenir un modèle générique de normalisation des textes bruts. La motivation de cet article est de généraliser les travaux assez confidentiels et spécialisés qui existent pour cette étape de prétraitement. Cette étape est pourtant incontournable et d'elle dépend grandement la qualité des analyses obtenues à toutes les étapes ultérieures.
Fichier principal
Vignette du fichier
heitz_JADT2006.pdf (53.17 Ko) Télécharger le fichier
Slides_jadt2006.pdf (498.54 Ko) Télécharger le fichier
heitz_JADT2006_poster.pdf (416.04 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Format : Autre
Format : Autre

Dates et versions

inria-00119608 , version 1 (11-12-2006)

Identifiants

  • HAL Id : inria-00119608 , version 1

Citer

Thomas Heitz. Modélisation du prétraitement des textes. JADT'06 (International Conference on Statistical Analysis of Textual Data), 2006, Besançon, France, pp.499-506. ⟨inria-00119608⟩
170 Consultations
1289 Téléchargements

Partager

Gmail Facebook X LinkedIn More