1 représente les performances de l'alignement de la méthode sur le corpus 2bis . Les principales erreurs surviennent lorsque la structure physique du document est particulière et que nous ne trouvons plus les bons candidats à aligner ,
Performance analysis framework for layout analysis methods. In Document Analysis and Recognition, Ninth International Conference on, pp.1258-1262, 2007. ,
DOI : 10.1109/icdar.2007.4377117
Scenario driven indepth performance evaluation of document layout analysis methods, Document Analysis and Recognition (ICDAR), 2011 International Conference on, pp.1404-1408, 2011. ,
A hierarchical, HMM-based automatic evaluation of OCR accuracy for a digital library of books, Proceedings of the 6th ACM/IEEE-CS joint conference on Digital libraries , JCDL '06, pp.109-118, 2006. ,
DOI : 10.1145/1141753.1141776
HMM-Based Alignment of Inaccurate Transcriptions for Historical Documents, 2011 International Conference on Document Analysis and Recognition, pp.53-57, 2011. ,
DOI : 10.1109/ICDAR.2011.20
The zonemap metric for page segmentation and area classiication in scanned documents, Image Processing (ICIP), 2014 IEEE International Conference on, pp.2594-2598, 2014. ,
Performance evaluation tools for zone segmentation and classiication (pets), Pattern Recognition (ICPR), 2010 20th International Conference on, pp.503-506, 2010. ,
Pixel-Accurate Representation and Evaluation of Page Segmentation in Document Images, 18th International Conference on Pattern Recognition (ICPR'06), pp.872-875, 2006. ,
DOI : 10.1109/ICPR.2006.934
Object count/area graphs for the evaluation of object detection and segmentation algorithms, International Journal of Document Analysis and Recognition (IJDAR), vol.6, issue.4, pp.280-296, 2006. ,
DOI : 10.1007/s10032-006-0014-0
A fast alignment scheme for automatic ocr evaluation of books, Document Analysis and Recognition (ICDAR), 2011 International Conference on, pp.754-758, 2011. ,
Exemple de cas réel d'erreur de segmentation : Fission horizontale de deux lignes par l' ,
OCRopus corpus 1 accompagné de ses erreurs de segmentation pour chaque document, p.14 ,
Algorithme Zonemap+ Alignment -Résultat de l'évaluation de la méthode sur le corpus 2bis avec l', p.34 ,
Rappel et précision de l'alignement de la sortie d'OCRopus sur le corpus 2bis, p.42 ,
Comparaison des taux de reconnaissance entre la vérité et la méthode sur le corpus 2bis avec l', p.42 ,
Comparaison des taux de reconnaissance entre OCRopus et Tesseract sur le corpus 2bis, p.42 ,
OCRopus " en format HOCR 1 <? xml v e r s i o n = " 1 . 0 " e n c o d i n g ,
D e s c r i p t i o n " c o n t e n t = " OCRopus Output ,