Une méthode stochastique pour la reconnaissance de l'écriture arabe imprimée

Najoua Ben Amara; Abdel Belaïd

Résumé

Les techniques liées au traitement de l'information connaissent actuellement un développement très actif en liaison avec l'informatique et présentent un potentiel de plus en plus important dans le domaine de l'interaction Homme-machine. L'Homme veut communiquer avec l'ordinateur de la façon la plus simple, la plus naturelle pour faciliter et accélerer l'interaction et l'échange d'informations. Il cherche à rendre ces machines accessibles par la voix, capables de lire, de voir, de se déplacer...et de traiter et d'analyser rapidement l'information reçue. Ecrire pour communiquer a été de tous les temps une préoccupation première de l'Homme. L'écrit a été, et restera, l'un des grands fondements des civilisations et le mode par excellence de conservation et de transmission du savoir. Malgré les avancées d'autres moyens de communication tel que l'audio visuel, nombreuses sont les applications dont l'existence commence sur le papier, plus particulièrement dans la bureautique (saisie, indexation et archivage automatique de documents), en publication assistée par ordinateur (pour faciliter la composition à partir d'une sélection de plusieurs documents), dans la poste (lecture des adresses et tri automatique), dans les banques (traitement des chèques, des factures).... Cependant malgré les progrès technologiques, le clavier reste encore un moyen obligé de communication avec l'ordinateur. Contrairement au latin, la reconnaissance de l'écriture arabe manuscrite ou imprimée reste encore aujourd'hui au niveau de la recherche et de l'expérimentation, le problème n'est pas encore résolu bien que l'on sache atteindre des taux assez élevés dans certaines applications pour lesquelles soit le vocabulaire est limité, soit la fonte est unique. Les travaux sont généralement axés sur la méthodologie du développement plutôt que sur la réalisation d'un produit fini vendable. Une version commercialisable reste encore au stade du rêve, les efforts doivent se multiplier pour le réaliser. Il est vrai que l'écriture arabe présente certaines caractéristiques qui sont à l'origine de la complexité du traitement, particulièrement parce qu'elle est cursive aussi bien dans sa forme imprimée que manuscrite ; de plus les caractères changent de forme selon la position dans le mot, et même dans certains cas, selon sa phonétique. D'autre part, le caractère arabe présente une forme cursive voyellée nécessitant, pour la majorité des lettres, des matrices de dimensions plus grandes que celles communément utilisées pour le latin, ce qui laisse jusqu'à présent les formes informatisées des caractères arabes non encore normalisées. La reconnaissance de l'écriture arabe date des années 80. Depuis, les recherches se sont multipliés dans ce domaine. Certains chercheurs se sont intéressés à la reconnaissance en temps réel en utilisant des tablettes graphiques, ce qui simplifie en partie le problème en restituant le sens du tracé, d'autres se sont penchés sur l'imprimé et/ou le manuscrit en "Off-line" en utilisant un scanner ou une caméra pour la saisie des documents. Depuis, plusieurs outils de pré-traitement ont été développés pour la squeletisation de l'image, de son lissage, pour la détermination du contour et l'extraction de primitives...et différentes techniques de reconnaissance ont été élaborées, parmi lesquelles figurent des méthodes statistiques, structurelles ou géométriques, avec ou sans segmentation en caractères. Généralement toutes ces méthodes et bien d'autres, tendent à extraire, chacune à sa façon, une catégorie de caractéristiques et d'évaluer par la suite la vraisemblance entre les primitives extraites et celles de formes prototypes déjà apprises par le système de reconnaissance. Dans ce cadre, nous proposons une méthode stochastique, sans segmentation, de reconnaissance de chaînes de caractères arabes imprimées correspondant à des mots ou des parties de mots. En effet, les mots arabes se composent d'une ou de plusieurs parties, que nous conviendrons d'appeler PAW (de l'anglais : Piece of Arabic Word). Ceci est dû au fait que certains caractères ne peuvent se rattacher à la lettre qui les suit sur leur gauche. Le choix du PAW comme unité de traitement, évite à la fois le problème d'une mauvaise segmentation en caractères (ou pseudo caractères) et celui de la complexité de regroupement des PAWs en mots. En effet, une reconnaissance au niveau des caractères nécessite généralement une segmentation au préalable (cas de l'écriture cursive), un processus souvent assez délicat pour une reconnaissance fiable. En effet, plusieurs algorithmes de segmentation ont été développés, la solution miracle reste encore à trouver. Quant à la reconnaissance des mots, elle nécessite, en plus des différentes techniques de traitement choisies, l'application des règles linguistiques de la langue pour pouvoir regrouper les PAWs constituant le même mot, chose qui n'est pas toujours évidente.

Une méthode stochastique pour la reconnaissance de l'écriture arabe imprimée

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager