A Texture-based Method for Document Segmentation and Classification

Résumé : Dans cet article nous présentons un modèle hybride de segmentation et classification du contenu d'images de documents. Chaque image est segmentée en trois types de régions: graphiques, textes et espaces. L'image de chaque document est subdivisée en blocs; pour chacun de ces blocs, cinq caractéristiques sont extraites de leur Matrice de Co-occurrence de leur niveaux de gris. Les blocs sont ensuite regroupés en trois classes en utilisant l'algorithme du K-means. Les blocs connectés sont fusionnés pour former un ensemble de régions homogènes. Des règles heuristiques sont ensuite utilisées pour donner un label à chacune des trois classes. Des expérimentations ont été effectuées avec des images scannées de journaux et des images de la base de données documentaire MediaTeam
Type de document :
Article dans une revue
Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2007, 6, pp.49-56
Liste complète des métadonnées

Littérature citée [24 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01262352
Contributeur : Coordination Episciences Iam <>
Soumis le : mardi 26 janvier 2016 - 16:05:16
Dernière modification le : lundi 18 avril 2016 - 16:45:38
Document(s) archivé(s) le : mercredi 27 avril 2016 - 13:21:31

Fichier

arima00604.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01262352, version 1

Collections

Citation

Ming-Wei Lin, Jules-Raymond Tapamo, Baird Ndovie. A Texture-based Method for Document Segmentation and Classification. Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2007, 6, pp.49-56. 〈hal-01262352〉

Partager

Métriques

Consultations de la notice

182

Téléchargements de fichiers

311