Outil de sélection de texte manuscrit sur des documents numérisés

Résumé : Les logiciels d'édition d'images existent depuis plusieurs décennies et fournissent de nombreux outils de sélection de pixels basés sur des techniques d'interaction et algorithmes de traitements variés. Mais malgré les nombreuses déclinaisons de ces outils, ils ne permettent pas de sélectionner précisément et rapidement du texte manuscrit sur des images numérisées de part la complexité des formes à sélectionner. Les outils de sélection les plus élémentaires permettent de sélectionner des pixels par une forme géo-métrique (rectangle, ellipse, polygone ou forme libre). Cette approche peut s'avérer efficace lorsqu'il s'agit de sélectionner un élément plein. Dès lors qu'il s'agit de sélectionner un élément plus complexe, un mot manuscrit par exemple, cette tâche peut s'avérer fastidieuse, chronophage et imprécise. D'autres outils reposent sur une dimension sémantique avant tout, comme par exemple la Magic Wand ou Paint sélec-tion [2] qui se basent sur les informations que l'on peux extraire d'un ou plusieurs pixel (valeurs RGB, pixels voisins...). Bien que très efficaces dans de nombreuses situations, ces approches sont là encore peu adaptés à la sélection de texte dans des documents manuscrits. En effet sur de tels documents, les mots peuvent se chevaucher, et la couleur du texte et du fond varie d'une zone du document à une autre, mettant alors en défaut ce type d'approches. L'utilisateur sait par contre en général délimiter les formes du texte, grâce à sa perception adaptative des couleurs, ses connaissances sémantiques des mots, et plus généralement de l'écriture (la forme des lettres par exemple). L'outil que nous présentons est une combinaison d'outils pour la sélection progressive de texte dans des documents manuscrits qui exploite à la fois les données spatiales et sémantiques des pixels. L'idée directrice est de combiner au mieux les avantages des algorithmes de traitement et les connaissances des utilisateurs qui les paramètrent et les manipulent. Nous proposons en particulier une brosse dont l'utilisateur peut ajuster la taille et le seuil de sélection grâce au principe de manipulation directe. Cette brosse fournit des informations en feed-forward afin de montrer en avance à l'utilisateur les pixels qui seront sélectionnés, et ainsi ajuster le seuil efficacement. Cette sélection est déterminée par un calcul de la luminance relative entre chaque pixel de cette zone et le seuil.
Complete list of metadatas

Cited literature [2 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01899373
Contributor : Thomas Pietrzak <>
Submitted on : Tuesday, October 23, 2018 - 4:24:33 PM
Last modification on : Friday, March 22, 2019 - 1:36:47 AM

Identifiers

  • HAL Id : hal-01899373, version 1

Collections

Citation

Elie Alawoe, Thomas Pietrzak, Stéphane Huot. Outil de sélection de texte manuscrit sur des documents numérisés. SIFED 2018 - Symposium International Francophone sur l'Ecrit et le Document, May 2018, Tours, France. ⟨hal-01899373⟩

Share

Metrics

Record views

70

Files downloads

17