Extraction de formules à partir de documents mathématiques

Afef Kacem 1 Abdel Belaïd 2 Mohamed Ben Ahmed 1
2 READ - READ
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cet article propose une méthode d'extraction automatique de formules à partir des images des documents mathématiques sans passer par un système de reconnaissance optique de caractères. l'extraction se fait d'abord par repérage des symboles les plus significatifs d'une formule, puis extension aux symboles avoisinants par l'utilisation de règles contextuelles, jusqu'à la délimitation totale de l'espace de la formule. l'étiquetage est réalisé à partir de modèles crées lors d'une phase d'apprentissage utilisant la logique floue. Le taux d'étiquetage primaire des composantes connexes est de l'ordre de 95.3%. Mais leur étiquetage secondaire accroît ce taux d'environ 4%. Les résultats obtenus montrent l'applicabilité de notre système puisque 95% des formules mathématiques sont bien extraites des documents imprimés de bonne qualité. Cet article synthétise le travail effectué, pose les problèmes rencontrés et présente les résultats obtenus.
Type de document :
Communication dans un congrès
Reconnaissance des Formes et Intelligence artificielle - RFIA' 2000, Jan 2000, none, 8 p, 2000
Liste complète des métadonnées

https://hal.inria.fr/inria-00099143
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 08:51:18
Dernière modification le : mardi 24 avril 2018 - 13:34:46

Identifiants

  • HAL Id : inria-00099143, version 1

Collections

Citation

Afef Kacem, Abdel Belaïd, Mohamed Ben Ahmed. Extraction de formules à partir de documents mathématiques. Reconnaissance des Formes et Intelligence artificielle - RFIA' 2000, Jan 2000, none, 8 p, 2000. 〈inria-00099143〉

Partager

Métriques

Consultations de la notice

129