Outil de sélection de texte manuscrit sur des documents numérisés

Résumé : Les logiciels d'édition d'images existent depuis plusieurs décennies et fournissent de nombreux outils de sélection de pixels basés sur des techniques d'interaction et algorithmes de traitements variés. Mais malgré les nombreuses déclinaisons de ces outils, ils ne permettent pas de sélectionner précisément et rapidement du texte manuscrit sur des images numérisées de part la complexité des formes à sélectionner. Les outils de sélection les plus élémentaires permettent de sélectionner des pixels par une forme géo-métrique (rectangle, ellipse, polygone ou forme libre). Cette approche peut s'avérer efficace lorsqu'il s'agit de sélectionner un élément plein. Dès lors qu'il s'agit de sélectionner un élément plus complexe, un mot manuscrit par exemple, cette tâche peut s'avérer fastidieuse, chronophage et imprécise. D'autres outils reposent sur une dimension sémantique avant tout, comme par exemple la Magic Wand ou Paint sélec-tion [2] qui se basent sur les informations que l'on peux extraire d'un ou plusieurs pixel (valeurs RGB, pixels voisins...). Bien que très efficaces dans de nombreuses situations, ces approches sont là encore peu adaptés à la sélection de texte dans des documents manuscrits. En effet sur de tels documents, les mots peuvent se chevaucher, et la couleur du texte et du fond varie d'une zone du document à une autre, mettant alors en défaut ce type d'approches. L'utilisateur sait par contre en général délimiter les formes du texte, grâce à sa perception adaptative des couleurs, ses connaissances sémantiques des mots, et plus généralement de l'écriture (la forme des lettres par exemple). L'outil que nous présentons est une combinaison d'outils pour la sélection progressive de texte dans des documents manuscrits qui exploite à la fois les données spatiales et sémantiques des pixels. L'idée directrice est de combiner au mieux les avantages des algorithmes de traitement et les connaissances des utilisateurs qui les paramètrent et les manipulent. Nous proposons en particulier une brosse dont l'utilisateur peut ajuster la taille et le seuil de sélection grâce au principe de manipulation directe. Cette brosse fournit des informations en feed-forward afin de montrer en avance à l'utilisateur les pixels qui seront sélectionnés, et ainsi ajuster le seuil efficacement. Cette sélection est déterminée par un calcul de la luminance relative entre chaque pixel de cette zone et le seuil.
Type de document :
Communication dans un congrès
SIFED 2018 - Symposium International Francophone sur l'Ecrit et le Document, May 2018, Tours, France
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01899373
Contributeur : Thomas Pietrzak <>
Soumis le : mardi 23 octobre 2018 - 16:24:33
Dernière modification le : mercredi 16 janvier 2019 - 11:18:35

Identifiants

  • HAL Id : hal-01899373, version 1

Collections

Citation

Elie Alawoe, Thomas Pietrzak, Stéphane Huot. Outil de sélection de texte manuscrit sur des documents numérisés. SIFED 2018 - Symposium International Francophone sur l'Ecrit et le Document, May 2018, Tours, France. 〈hal-01899373〉

Partager

Métriques

Consultations de la notice

27

Téléchargements de fichiers

9