Word-wise Hand-written Script Separation for Indian Postal automation

K. Roy; U. Pal

Communication Dans Un Congrès Année : 2006

Word-wise Hand-written Script Separation for Indian Postal automation

(1) , (2)

1
2

K. Roy

Fonction : Auteur

West Bengal University of Technology

U. Pal

Fonction : Auteur
PersonId : 835697

Computer Vision and Pattern Recognition Unit

Résumé

In a multi-lingual multi-script country like India, a postal document may contain words of two or more scripts. For recognition of this document it is necessary to separate different scripts from the document. In this paper, an automatic scheme for word-wise identification of hand-written Roman and Oriya scripts is proposed for Indian postal automation. In the proposed scheme, at first, document skew is corrected. Next, using a piecewise projection method the document is segmented into lines and then lines into words. Finally, using different features like, water reservoir concept based features, fractal dimension based features, topological features, scripts characteristics based features etc., a Neural Network (NN) classifier is used for word-wise script identification. For experiment we consider 2500 words and overall accuracy of 97.69% is obtained from the proposed identification scheme.

Mots clés

Script separation Indian script Multilingual OCR Handwritten recognition

Domaines

Traitement du texte et du document Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

cr1065210301587.pdf (321.95 Ko)

Anne Jaigu : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00104358

Soumis le : vendredi 6 octobre 2006-13:07:21

Dernière modification le : samedi 28 juillet 2018-14:54:01

Archivage à long terme le : mardi 6 avril 2010-18:49:10

Dates et versions

inria-00104358 , version 1 (06-10-2006)

Identifiants

HAL Id : inria-00104358 , version 1

Citer

K. Roy, U. Pal. Word-wise Hand-written Script Separation for Indian Postal automation. Tenth International Workshop on Frontiers in Handwriting Recognition, Université de Rennes 1, Oct 2006, La Baule (France). ⟨inria-00104358⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

IWFHR10

112 Consultations

179 Téléchargements

Word-wise Hand-written Script Separation for Indian Postal automation

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager