Segmentation en lignes de documents anciens

Nazih Ouwayed 1
1 READ - READ
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : L'indexation de documents numérisés manuscrits pose le problème de la segmentation en lignes qui, si elle échoue, handicape les étapes suivantes d'extraction et de reconnaissance de mots. Dans les documents arabe anciens, s'ajoute à ce problème, la présence dans les marges, d'annotations souvent composées de lignes obliques. La détection de ces lignes est nécessaire et constitue un défi important pour l'indexation de ces documents. Ainsi, la segmentation visée dans ce livre concerne l'extraction de lignes multi-orientées. Pour ce problème, la bibliographie ne présente que des techniques rudimentaires basées essentiellement sur une projection directe de l'image du document suivant une seule direction et donc non applicable à du texte multi-orienté. Devant ce manque, nous avons proposé une approche adaptative permettant de localiser d'abord les zones d'orientation différentes, puis de s'appuyer sur chaque orientation locale pour extraire les lignes.
Type de document :
Ouvrage (y compris édition critique et traduction)
Editions Universitaires Europeennes, 160 p., 2010, 978-6131520396
Liste complète des métadonnées

https://hal.inria.fr/inria-00507760
Contributeur : Nazih Ouwayed <>
Soumis le : vendredi 30 juillet 2010 - 23:57:29
Dernière modification le : jeudi 11 janvier 2018 - 06:19:59

Identifiants

  • HAL Id : inria-00507760, version 1

Collections

Citation

Nazih Ouwayed. Segmentation en lignes de documents anciens. Editions Universitaires Europeennes, 160 p., 2010, 978-6131520396. 〈inria-00507760〉

Partager

Métriques

Consultations de la notice

48