Comment introduire simplement et uniformément deux modes d'interaction asynchrones complémentaires dans un système d'analyse de documents existant - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Comment introduire simplement et uniformément deux modes d'interaction asynchrones complémentaires dans un système d'analyse de documents existant

Résumé

Extracting contents from degraded documents, like historical ones, is difficult. Existing analysis systems usually rely on a manual correction of results during a post-processing stage, and cannot make use of external information to adapt their response. This paper presents how to adapt an existing document analysis system to enable an efficient interaction during the analysis stage, and benefit from external information. We describe the minimal architecture required, and the two complimentary interaction models we propose: they are suitable for mass document processing, and easy to implement. For transcription tasks in documents dating from the 18th century, our prototype permitted an important reduction of human workload.
L'analyse et la reconnaissance de documents dégradés, en particulier les documents anciens, est difficile. Les systèmes existants recourent généralement une correction manuelle des résultats en post-processing, sans tirer profit de ces nouvelles informations pour améliorer leur réponse. Cet article explique comment adapter un système d'analyse de documents existant pour lui permettre d'interagir avec un opérateur humain ou d'autres processus, durant la phase d'analyse, et exploiter à ce moment les informations externes fournies. Nous décrivons l'architecture minimale requise, puis les deux modes d'interaction complémentaires que nous proposons : ils sont adaptés au traitement de documents en grand volume, et simples à implémenter. Pour des tâches de transcription de mots manuscrits dans des documents du XVIIIe siècle, notre prototype montre une réduction conséquente de la quantité de travail manuel nécessaire.
Fichier principal
Vignette du fichier
20120203_finale_RC5.pdf (383.06 Ko) Télécharger le fichier
2012-03_CIFED_talk_v1-HAL.pdf (2.41 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre

Dates et versions

hal-00686847 , version 1 (11-04-2012)

Identifiants

  • HAL Id : hal-00686847 , version 1

Citer

Joseph Chazalon, Bertrand B. Couasnon, Aurélie Lemaitre. Comment introduire simplement et uniformément deux modes d'interaction asynchrones complémentaires dans un système d'analyse de documents existant. CIFED - Conférence Internationale sur l'Ecrit et le Document, Mar 2012, Bordeaux, France. pp.285-299. ⟨hal-00686847⟩
206 Consultations
301 Téléchargements

Partager

Gmail Facebook X LinkedIn More