Automated Error Detection in Digitized Cultural Heritage Documents

Kata Gábor 1 Benoît Sagot 1
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
Abstract : The work reported in this paper aims at performance optimization in the digitization of documents pertaining to the cultural heritage domain. A hybrid method is roposed, combining statistical classification algorithms and linguistic knowledge to automatize post-OCR error detection and correction. The current paper deals with the integration of linguistic modules and their impact on error detection.
Type de document :
Communication dans un congrès
EACL 2014 Workshop on Language Technology for Cultural Heritage, Apr 2014, Göteborg, Sweden. 2014
Liste complète des métadonnées

Littérature citée [29 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01022402
Contributeur : Kata Gábor <>
Soumis le : jeudi 10 juillet 2014 - 13:07:53
Dernière modification le : mercredi 12 octobre 2016 - 01:23:52
Document(s) archivé(s) le : vendredi 10 octobre 2014 - 11:41:16

Fichier

W14-0608.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01022402, version 1

Collections

Citation

Kata Gábor, Benoît Sagot. Automated Error Detection in Digitized Cultural Heritage Documents. EACL 2014 Workshop on Language Technology for Cultural Heritage, Apr 2014, Göteborg, Sweden. 2014. 〈hal-01022402〉

Partager

Métriques

Consultations de la notice

471

Téléchargements de fichiers

292