Caractérisation de documents hétérogènes

Pierre Adamy 1
1 READ - READ
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Une méthodologie pour la localisation et l'extraction de destinataire dans divers types de documents numérisés est présenté. Elle se base sur un système black board capable d'extraire du document, diverses caractéristiques et agencement de caractéristiques afin d'arriver au résultat. Le système se base sur des agents ordonnés de façon hiérarchique afin de traiter les étapes de recherche d'information, de renforcement d'information et de résolution d'ambiguïtés. Le système utilise un apprentissage par renforcement pour déterminer la tâche à résoudre en fonction des échecs et succès déjà rencontrés. Il utilise aussi diverses techniques pour extraire de l'information du document numérisé tel que la compétition d'OCR ou la recherche d'objets graphiques. Les difficultés dues aux erreurs de reconnaissances sont résolues par des techniques faisant appels aux matrices de confusion ou à la recherche d'informations complémentaires tel que l'équipe ou le bureau.
Type de document :
Rapport
[Stage] A00-R-311 || adamy00a, 2000
Liste complète des métadonnées

https://hal.inria.fr/inria-00099191
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 08:51:38
Dernière modification le : mardi 24 avril 2018 - 13:34:45

Identifiants

  • HAL Id : inria-00099191, version 1

Collections

Citation

Pierre Adamy. Caractérisation de documents hétérogènes. [Stage] A00-R-311 || adamy00a, 2000. 〈inria-00099191〉

Partager

Métriques

Consultations de la notice

169