Skip to Main content Skip to Navigation
Reports

Classification et modélisation markovienne appliquées à l'analyse de documents de type facture

Jérôme Szlachta 1
1 READ - READ
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Les documents commerciaux tels que les formulaires sont très utilisésactuellement dans plusieurs administrations et services. Leurtraitement automatique est très difficile à cause de plusieursfacteurs : changement fréquent de la mise en page, variation ducontenu, présence de l'écriture manuscrite, etc. A la demande de lasociété ITESOFT, nous avons développé une technique de lectureautomatique de formulaires de type " bons de commande " pour la ventepar correspondance. Cette technique, appelée " technologie adaptative", s'affranchit de l'usage de modèle a priori pour la lecture et sebase uniquement sur la détection de points fixes pour la localisationdes régions d'information.A la demande de la même société, nous avons étendu cette technique àl'analyse des factures. Toutefois, étant d'origines diverses, leurspoints fixes peuvent varier dans leur orthographe, dans leur nombre etdans leur position. Nous avons alors proposer une méthode declassification de ces chaînes de points fixes afin d'en déterminer lesclasses de variation. A cause de l'indéterminisme de ces chaînes, nousavons opté pour une modélisation markovienne. La classification estréalisée par nuées dynamiques où les noyaux des classes sont desmodèles markoviens entraînés à partir d'un ensemble restreint dechaînes d'observations.
Document type :
Reports
Complete list of metadata

https://hal.inria.fr/inria-00099192
Contributor : Publications Loria <>
Submitted on : Tuesday, September 26, 2006 - 8:51:38 AM
Last modification on : Friday, February 26, 2021 - 3:28:07 PM

Identifiers

  • HAL Id : inria-00099192, version 1

Collections

Citation

Jérôme Szlachta. Classification et modélisation markovienne appliquées à l'analyse de documents de type facture. [Stage] A00-R-313 || szlachta00a, 2000. ⟨inria-00099192⟩

Share

Metrics

Record views

97