OCR识别软件识别率的影响因素
判断一个OCR文字识别软件的好坏,主要是看软件的功能和识别率。功能是软件开发者才能改变的,用户可以通过一些办法改善软件的识别率,这就要看影响OCR识别软件识别率的因素是什么了。
操作方法
- 01
图像质量:是保证OCR识别率的关键
- 02
1、选择印刷质量较好的文字文稿 文字文稿印刷质量的好坏,直接影响着扫描后得到的文稿图像的质量,也必将影响到OCR的识别率。通常选择正版的书籍、杂志等,再通过正确的扫描方法,就可得到质量较高的扫描文稿图像,并得到较高的OCR识别率。扫描印刷质量粗糙的文字文稿(如纸质较差的报纸、盗版书籍等),很难得到满意的OCR识别率。
- 03
2、正确设置和操作扫描仪 正确操作和设置扫描仪对扫描文稿的图像质量、OCR识别率有着至关重要的影响。在扫描过程中,除了文稿要摆放端正、平整(防止走光)外,还应对扫描的彩色模式、分辨率等参数进行正确的设置。 ①色彩模式:色彩模式通常为三种:彩色、灰度和黑白二值。在运用OCR识别软件进行扫描时,一般将色彩模式设置为黑白二值,即通过扫描得到的图像只有黑白两种颜色。 ②分辨率的设置:分辨率不能设置的过小,通常为300dpi,分辨率过小就不能保证OCR的识别效果.但分辨率数值也不要设得过高,数值过高会影响扫描速度,而且得到的扫描文稿图像过大,使计算机的运行速度降低。
- 04
3、利用图像处理软件提高扫描文稿的图像质量 对纸质较差、印刷质量不佳的文字文稿,可以在扫描后,再用图形图像处理软件进行处理,先改善扫描文稿的图像质量,然后再进行OCR识别。
- 05
在进行OCR识别前,做到了上面几点识别率就能够得到保证了。千万别嫌麻烦,正所谓“磨刀不费砍材工”,如果图像的质量不好,识别率降低,后面的校对工作就有的做了,自己衡量一下利弊吧!
赞 (0)