Segmentation de documents composites par une technique de recouvrement des espaces blancs

Yves Rangoni 1 Abdel Belaid 1
1 READ - Recognition of writing and analysis of documents
LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Nous présentons dans cet article une méthode pour la segmentation de documents composites. Contrairement à la majorité des publications, nous nous focalisons sur des documents à structure non-Manhattan qui sont généralement créés par montage. Les pages à traiter contiennent donc plusieurs sous-documents qu'il faut isoler. Nous nous inspirons d'une technique par recouvrement d'espaces blancs proposée par Baird et al. ainsi qu'une suite de pré-traitements et post-traitements spécifiques à ces documents particuliers. Les évaluations sont faites sur des documents administratifs d'origines diverses qui nous sont fournis par une société partenaire. Ne disposant pas de documents de vérité, nous avons comparé nos résultats à ceux d'OCR commerciaux que notre méthode surpasse.
Type de document :
Communication dans un congrès
CIFED-CORIA, Mar 2012, Bordeaux, France. 2012
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00779235
Contributeur : Abdel Belaid <>
Soumis le : mercredi 23 janvier 2013 - 17:49:30
Dernière modification le : jeudi 11 janvier 2018 - 06:25:25
Document(s) archivé(s) le : mercredi 24 avril 2013 - 03:54:32

Fichier

cifed_version_publiee_yves.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00779235, version 1

Collections

Citation

Yves Rangoni, Abdel Belaid. Segmentation de documents composites par une technique de recouvrement des espaces blancs. CIFED-CORIA, Mar 2012, Bordeaux, France. 2012. 〈hal-00779235〉

Partager

Métriques

Consultations de la notice

158

Téléchargements de fichiers

327