Skip to Main content Skip to Navigation
Conference papers

Un nouveau descripteur de texte pour la détection des lignes de texte multi-orientées dans les scènes réelles

Mehdi Felhi 1, 2 Salvatore Tabbone 1 Nicolas Bonnier 2
1 QGAR - Querying Graphics through Analysis and Recognition
LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Dans cet article, nous proposons un nouveau descripteur de texte basé sur la squelettisation et la fonction distance appliquées sur les composantes candidates de texte. Nous proposons aussi une approche complète d'extraction des lignes de texte multi-orientées et curvilignes. Notre nouvelle approche commence par extraire les composantes connexes. Ces régions seront regroupées pour former un graphe qui relie par l'intermédiaire de ses arcs les composantes similaires et voisines. Notre descripteur de texte sera appliqué dans un deuxième temps au niveau de chaque noeud du graphe. Pour cela, nous extrayons pour chaque composante son squelette et nous effectuons un ébarbulage qui consiste à garder uniquement les traits/régions d'épaisseurs quasi-uniformes. La proportion de ces régions par rapport à la taille de la composante est considérée comme un indicateur d'appartenance du noeud (correspondant à la composante analysée) à la classe " texte ". Ensuite, nous raffinons les connexions du graphe ainsi formées en utilisant un algorithme modifié de parcours en profondeur (DFS) appliqué sur les arcs. Ce traitement vise à éliminer les connexions non susceptibles de former des lignes de texte. Finalement, nous appliquons l'algorithme de Graph Cuts sur le graphe construit afin de détecter les régions/lignes de texte.
Complete list of metadata

https://hal.inria.fr/hal-00764708
Contributor : Mehdi Felhi <>
Submitted on : Thursday, December 13, 2012 - 4:07:04 PM
Last modification on : Wednesday, November 25, 2020 - 10:30:04 AM
Long-term archiving on: : Thursday, March 14, 2013 - 3:47:29 AM

File

CIFED_2012_camera_ready.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00764708, version 1

Collections

Citation

Mehdi Felhi, Salvatore Tabbone, Nicolas Bonnier. Un nouveau descripteur de texte pour la détection des lignes de texte multi-orientées dans les scènes réelles. 7ème Colloque International Francophone sur l'Écrit et le Document - CIFED 2012, Mar 2012, Bordeaux, France. ⟨hal-00764708⟩

Share

Metrics

Record views

327

Files downloads

439