Un modèle neuro markovien profond pour l’extraction de séquences dans des documents manuscrits

In this paper, we propose a keyword extraction system able to extract keywords in handwritten documents. The base system rely on a HMM line model made of an Out-Of-KeyWord Vocabulary model and keywords model. In order to be more discriminant at the local level (the frame level), the standard gaussian mixture of the HMM are replaced by a deep neu-ral network (DNN) for computing the observations probabilities. Experimentations are carried out on an unconstrained handwritten document database used for the 2009 ICDAR handwriting recognition competitions. The results demonstrate the interest of the keyword extraction system as opposed to the sequential integration strategy of full text recognition prior to the detection of keywords. We also show the benefit from using the deep architecture instead of the gaussian mixtures.

Dans cet article, nous proposons un système d'extraction de mots clefs dans des documents manuscrits. Notre approche est basée sur la reconnaissance des lignes de texte à l'aide d'un modèle HMM capable de rejeter les mots n'appartenant pas à un lexique prédéfini. Afin d'être plus discriminant, nous avons remplacé les mélanges de gaussiennes des HMM par un réseau de neurones profond pour calculer les probabilités a posteriori des observations. Nous montrons sur la base de documents des compétitions ICDAR 2009 l'intérêt de notre approche d'extraction d'information par rapport à une stratégie basée sur la reconnaissance intégrale du document. Les résultats montrent également l'apport de l'architecture profonde par rapport aux mélanges de gaussiennes.

Mots clés

Out-Of-Vocabulary Model neuro markovian model keyword spotting HMM Offline Handwriting Recognition deep neural network

Domaines

Traitement du texte et du document

Fichier principal

docnum-thomas2013.pdf (2.23 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Clément Chatelain : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01105363

Soumis le : mardi 20 janvier 2015-11:10:17

Dernière modification le : vendredi 22 décembre 2023-15:16:05

Archivage à long terme le : mardi 21 avril 2015-10:36:46

Dates et versions

hal-01105363 , version 1 (20-01-2015)

Identifiants

HAL Id : hal-01105363 , version 1
DOI : 10.3166/dn.16.2.49-68

Citer

Simon Thomas, Clément Chatelain, Thierry Paquet, Laurent Heutte. Un modèle neuro markovien profond pour l’extraction de séquences dans des documents manuscrits. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2013, 16 (2), pp.20. ⟨10.3166/dn.16.2.49-68⟩. ⟨hal-01105363⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSA-ROUEN LITIS COMUE-NORMANDIE UNIROUEN UNILEHAVRE INSA-GROUPE

39 Consultations

391 Téléchargements