如何编辑扫描文档
将文件扫描是减少纸质文件的有效方式,但将文件扫描为图片后,您可能不知道如何编辑这些文件。通过使用恰当的软件,您可以将任何扫描文档转换为与文字处理程序兼容的格式。阅读本指南,了解如何实施。
步骤
- 01
扫描文档。首先抹平纸张上的皱褶,擦除不相关的标记,为扫描做好准备。如果文档纸张过旧或严重变形,则扫描仪可能无法捕捉到清晰可读的文字。可将文档扫描为以下主流格式:PDF、JPG 或 TIFF。 一些新式扫描仪可能自带有软件,能将文档自动转换为可编辑格式。 如果安装了 Office 2003 或 2007,则可使用 Microsoft Office Document Scanning 程序进行扫描。此程序能够在扫描时转换相关文字。后期的 Office 版本中未提供此程序。 如使用 OCR 转换程序,则 TIFF 格式的效果最佳。 尽可能以黑白模式扫描。以黑白颜色扫描将大大提高 OCR 程序在转换文档时的文字识别成功率。只有当您确实需要保留文档中的图片时,才使用彩色模式扫描。
- 02
安装 OCR 程序。OCR(光学字符识别)程序会将图片上的字符与其数据库中的字符相匹配。然后将文档重构为可在任意文字处理程序中编辑的格式。 网上提供了多种免费和收费的 OCR 程序。另外还有一些网站也提供了小型文件的 OCR 功能。 Adobe Acrobat 和Evernote 均带有内置 OCR 功能。 根据扫描文件的质量,在转换后可能会出现一些错误。 OCR 程序通常不能保持原文档的格式,而只会以纯文本格式返回文字。
- 03
在 OCR 程序中打开扫描文档。使用的程序不同,操作的方法也略有差别,但一般来说您只需打开文件即可,程序会为您转换,然后将结果另存为新的文本文件。 大多数 OCR 程序可以选择输出文件的格式。请选择一种能够与您首选的文字处理程序相兼容的格式。
- 04
检查输出文档,删除不必要的格式代码。例如,如果文档在扫描时放斜了,则 OCR 程序可能插入了制表位设置、行间距、字体等大量格式变化内容。可以使用记事本等不能识别格式代码的简单文字处理程序来删除这些内容,或者在剪切和粘贴文档时不要选择这些代码。
- 05
编辑新文档。在 OCR 程序中完成扫描文档的处理后,可在您首选的文字处理程序中打开文档,开始做一些更正。可能有一些文字在识别和转换时发生错误,因此必须更正一些书写和格式。 可使用拼写检查快速查找转换过程中发生的错误。对于那些格式错误和非拼写错误,您仍然需要仔细检查。