Un modèle neuro markovien profond pour l’extraction de séquences dans des documents manuscrits - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2013

Un modèle neuro markovien profond pour l’extraction de séquences dans des documents manuscrits

Résumé

In this paper, we propose a keyword extraction system able to extract keywords in handwritten documents. The base system rely on a HMM line model made of an Out-Of-KeyWord Vocabulary model and keywords model. In order to be more discriminant at the local level (the frame level), the standard gaussian mixture of the HMM are replaced by a deep neu-ral network (DNN) for computing the observations probabilities. Experimentations are carried out on an unconstrained handwritten document database used for the 2009 ICDAR handwriting recognition competitions. The results demonstrate the interest of the keyword extraction system as opposed to the sequential integration strategy of full text recognition prior to the detection of keywords. We also show the benefit from using the deep architecture instead of the gaussian mixtures.
Dans cet article, nous proposons un système d'extraction de mots clefs dans des documents manuscrits. Notre approche est basée sur la reconnaissance des lignes de texte à l'aide d'un modèle HMM capable de rejeter les mots n'appartenant pas à un lexique prédéfini. Afin d'être plus discriminant, nous avons remplacé les mélanges de gaussiennes des HMM par un réseau de neurones profond pour calculer les probabilités a posteriori des observations. Nous montrons sur la base de documents des compétitions ICDAR 2009 l'intérêt de notre approche d'extraction d'information par rapport à une stratégie basée sur la reconnaissance intégrale du document. Les résultats montrent également l'apport de l'architecture profonde par rapport aux mélanges de gaussiennes.
Fichier principal
Vignette du fichier
docnum-thomas2013.pdf (2.23 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01105363 , version 1 (20-01-2015)

Identifiants

Citer

Simon Thomas, Clément Chatelain, Thierry Paquet, Laurent Heutte. Un modèle neuro markovien profond pour l’extraction de séquences dans des documents manuscrits. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2013, 16 (2), pp.20. ⟨10.3166/dn.16.2.49-68⟩. ⟨hal-01105363⟩
39 Consultations
391 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More