Un nouveau descripteur de texte pour la détection des lignes de texte multi-orientées dans les scènes réelles

Mehdi Felhi 1, 2 Salvatore Tabbone 1 Nicolas Bonnier 2
1 QGAR - Querying Graphics through Analysis and Recognition
LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Dans cet article, nous proposons un nouveau descripteur de texte basé sur la squelettisation et la fonction distance appliquées sur les composantes candidates de texte. Nous proposons aussi une approche complète d'extraction des lignes de texte multi-orientées et curvilignes. Notre nouvelle approche commence par extraire les composantes connexes. Ces régions seront regroupées pour former un graphe qui relie par l'intermédiaire de ses arcs les composantes similaires et voisines. Notre descripteur de texte sera appliqué dans un deuxième temps au niveau de chaque noeud du graphe. Pour cela, nous extrayons pour chaque composante son squelette et nous effectuons un ébarbulage qui consiste à garder uniquement les traits/régions d'épaisseurs quasi-uniformes. La proportion de ces régions par rapport à la taille de la composante est considérée comme un indicateur d'appartenance du noeud (correspondant à la composante analysée) à la classe " texte ". Ensuite, nous raffinons les connexions du graphe ainsi formées en utilisant un algorithme modifié de parcours en profondeur (DFS) appliqué sur les arcs. Ce traitement vise à éliminer les connexions non susceptibles de former des lignes de texte. Finalement, nous appliquons l'algorithme de Graph Cuts sur le graphe construit afin de détecter les régions/lignes de texte.
Type de document :
Communication dans un congrès
7ème Colloque International Francophone sur l'Écrit et le Document - CIFED 2012, Mar 2012, Bordeaux, France. 2012
Liste complète des métadonnées

https://hal.inria.fr/hal-00764708
Contributeur : Mehdi Felhi <>
Soumis le : jeudi 13 décembre 2012 - 16:07:04
Dernière modification le : jeudi 11 janvier 2018 - 06:25:25
Document(s) archivé(s) le : jeudi 14 mars 2013 - 03:47:29

Fichier

CIFED_2012_camera_ready.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00764708, version 1

Collections

Citation

Mehdi Felhi, Salvatore Tabbone, Nicolas Bonnier. Un nouveau descripteur de texte pour la détection des lignes de texte multi-orientées dans les scènes réelles. 7ème Colloque International Francophone sur l'Écrit et le Document - CIFED 2012, Mar 2012, Bordeaux, France. 2012. 〈hal-00764708〉

Partager

Métriques

Consultations de la notice

229

Téléchargements de fichiers

246