用扫描仪和OCR软件实现扫描录入文字

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用扫描仪和OCR软件实现扫描录入文字

将书本文字录入电脑,成为可排版的文字,有多种方法可实现,我这里介绍的是用扫描仪和OCR识别软件来实现。在扫描仪所附送的光盘内,就有OCR识别软件,此外,在office组件里也有OCR识别软件。当然,不同的识别软件操作方法不同,但都大同小异。

下面就以office2003OCR识别软件为例作一些介绍。

1、单击“开始→程序→Microsoft office→Microsoft office工具→Microsoft Office Document Imaging”运行OCR识别软件。第一次使用可能会提示你安装此组件。有些人的电脑可能在“开始→程序”里根本找不到该组件,那就是没有安装此组件,只能自己重新把它安装上。

2、程序运行后,单击“扫描新文档”按键(图一①)开始扫描,弹出“扫描新文档”对话框,第一次扫描要单击“扫描仪”按键(图二③),选择能正常使用的扫描仪。如果原稿超过一页纸,可先选定“换页提示”(图二②),这样在扫描时,每扫描完一页后,会提示放入第二页,节省一点时间。接着单击“扫描”按键(图二①),会弹出扫描控制面版,这一面版与用其它程序进行扫描是一样的,不再多说,但有一点必须要做,就是将输出目的设置为“OCR识别”,或直

接将扫描分辨率自定义为300dpi,这样才能保证转换准确率。

3、扫描完成后,会自动识别,并自动创建一个新文件(*.tif文件)。单击“将文本发送到Word”按键,会将识别后的文字以另一文件存放,但不是*.doc 文件,而是*.him文件。如果要的不是全部,而只是其中的一部分文字,可用选择工具(图一②)选定图片内的文字,复制(快捷键“Ctrl”+“c”)后,到Word文件内粘贴(快捷键“Ctrl”+“v”),将选定的文字复制到Word内进行编辑。

4、如果识别准确率不高时,可单击“工具”→“选项”进行设置,提高准确率,如原稿为全英文时,可在选项卡里单击“OCR”选项卡,将“OCR语言”设置成“英语”,确定后,单击“使用OCR识别文本”键(图一③)重新识别。

原稿的质量是识别准确率的关键,怎样的原稿才能有较高的识别准确率呢?原稿的纸张平整,没有在上面涂画,文字字迹清晰,笔画没有间断,文字底下没有图画或花纹,这样识别准确率会较高。另外纸张灰色(如报纸)和文字有底色对识别准确率影响不大。

相关文档
最新文档