Extraction de formules à partir de documents mathématiques - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2000

Extraction de formules à partir de documents mathématiques

Résumé

Cet article propose une méthode d'extraction automatique de formules à partir des images des documents mathématiques sans passer par un système de reconnaissance optique de caractères. l'extraction se fait d'abord par repérage des symboles les plus significatifs d'une formule, puis extension aux symboles avoisinants par l'utilisation de règles contextuelles, jusqu'à la délimitation totale de l'espace de la formule. l'étiquetage est réalisé à partir de modèles crées lors d'une phase d'apprentissage utilisant la logique floue. Le taux d'étiquetage primaire des composantes connexes est de l'ordre de 95.3%. Mais leur étiquetage secondaire accroît ce taux d'environ 4%. Les résultats obtenus montrent l'applicabilité de notre système puisque 95% des formules mathématiques sont bien extraites des documents imprimés de bonne qualité. Cet article synthétise le travail effectué, pose les problèmes rencontrés et présente les résultats obtenus.
Fichier non déposé

Dates et versions

inria-00099143 , version 1 (26-09-2006)

Identifiants

  • HAL Id : inria-00099143 , version 1

Citer

Afef Kacem, Abdel Belaïd, Mohamed Ben Ahmed. Extraction de formules à partir de documents mathématiques. Reconnaissance des Formes et Intelligence artificielle - RFIA' 2000, Jan 2000, none, 8 p. ⟨inria-00099143⟩
71 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More