Conception automatisée de modèles de page en vue de leur utilisation en reconnaissance de documents

Abdel Belaïd 1
1 READ - READ
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Le but de cet article est de décrire un modèle de page utilisé en reconnaissance de documents et sa construction automatisée. Ayant choisi une modélisation fondée sur la perception, l'architecture du modèle se confond avec la description physique des pages. La structure logique est décrite en termes de relations et d'attributs associés aux composants physiques. L'apprentissage est réalisé à partir de plusieurs exemples de documents. Ainsi, le modèle reflète totalement la structure réelle des documents et leur contenu. A cet effet, une démarche particulière est adoptée pour définir les paramètres les plus représentatifs et les moins sensibles au bruit. L'approche utilisée pour l'apprentissage est fondée sur l'inférence de grammaires d'arbres. Elle se limite actuellement à la structure physique. La structure logique est fournie manuellement au début de l'inférence par l'opérateur. Des procédures sont toutefois introduites pour maintenir la cohérence de la structure logique au cours de l'inférence. La validation du modèle ainsi généré a été réalisée par son emploi dans le système de reconnaissance de documents, GRAPHEIN
Type de document :
Communication dans un congrès
Workshop on Electronic Page Models - LAMPE'97, Sep 1997, Lausanne, Suisse. pp.17, 1997
Liste complète des métadonnées

https://hal.inria.fr/inria-00537335
Contributeur : Abdel Belaid <>
Soumis le : jeudi 18 novembre 2010 - 11:45:06
Dernière modification le : jeudi 11 janvier 2018 - 06:19:59

Identifiants

  • HAL Id : inria-00537335, version 1

Collections

Citation

Abdel Belaïd. Conception automatisée de modèles de page en vue de leur utilisation en reconnaissance de documents. Workshop on Electronic Page Models - LAMPE'97, Sep 1997, Lausanne, Suisse. pp.17, 1997. 〈inria-00537335〉

Partager

Métriques

Consultations de la notice

92