ocr文字识别软件的识别率与扫描参数有关
现在很多的公司都有安装ocr文字识别软件,很多的扫描文件都需要通过该软件识别达到存档的要求。但是一些用户反映识别扫描文件有时候识别率高有时候识别率低,这是什么原因造成的呢?软件工程师对软件做了多番测试,发现软件是没有问题的,保持在98%左右的识别率。很有可能是扫描文件时出现了问题,使用ocr文字识别软件识别的扫描稿扫描时应设置好扫描参数:
操作方法
- 01
扫描参数的设置 1、一般来讲,分辨率越高识别率也就会越高。但这也不是绝对的,对于一些过大过粗的字体,设置过高的分辨率,识别率可能会降低,而且设置高分辨率后,扫描速度会大大降低。根据实际经验,1、2、3号字的文稿推荐使用200dpi,4、小4、5号字的文稿推荐使用300dpi,小5、6号字的文稿推荐使用400dpi,7、8号字的文稿推荐使用600dpi。
- 02
2、扫描时适当地调整好亮度和对比度值,对识别率的高低影响很大,在进行扫描亮度和对比度的设定时,以扫描后的图像中文字的笔画较细、均匀,且没有明显断点为准。如果扫描后的文字图像存在黑点、黑斑或文字线条很粗很黑,分不清笔画,说明亮度值太小,应该增加亮度值再重新扫描。如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大,应减小亮度后再重新扫描。如果要扫描质量比较差的文稿,比如报纸,扫描出的图像可能会出现大量的黑点,而且在字体的笔画上也会出现粘连现象,为获得较好的识别结果,必须仔细进行亮度和对比度值的调整,反复扫描多次才能获得比较理想的效果。
- 03
同时还提醒广大的用户,扫描文件时一定要正确的操作扫描仪如:保持工作环境清洁、进行预热、摆正扫描稿等等细节,这些都是提高扫描文件质量的基础,进而也会影响到ocr文字识别软件的识别率,所以千万不能忽视。
赞 (0)