CAJ格式转换成WORD的方法

CAJ 格式转换成WORD 的方法

现在网上许多资料都是以CAJ 、PDF 等文件格式提供的,其中的文本不能被直接编辑。网上提供了许多处理这种情况的软件,但是它们不是效率低,就是只能提取其中部分文本。本文所述利用微软提供的OCR 识别技术从CAJ 、PDF 等文件中提取全部文本的方法,简便快捷,效率很高。 从不同格式的文件中提取文本前需要做好以下准备工作,安装CAJViewer5.5浏览器软件和acrobat 5 专业版浏览器软件安装Office2003,并完全安装Office 工具Microsoft Office Document Imaging ,然后在打印机里面会增加Microsoft Office Document Image Writer打印机。 Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格。

一、CAJ 文件的识别

(一)首先,从网上下载CAJ 格式的资料文件保存到本地硬盘上。

(二)然后,启动CAJViewer 浏览器程序,并在该程序中打开刚才保存的CAJ 格式的文件。浏览文件到最后一页后,不要关闭CAJ 浏览器程序。

(三)在CAJ 浏览器程序窗口中,选择“文件”→“打印”,并选择打印机为Microsoft Office Document Image Writer打印机,勾选打印到文件选项和确定打印页数。

(四)保存打印文件(*.prn)到适当位置。等待打印完成后,Microsoft Office Document Image 自动打开刚才保存的打印文件。

(五)在Microsoft Office Document Image窗口中,选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用OCR 识别文本”提取文本。

(六)选择“工具”下的 “将文本发送到word ”,最后将把整个CAJ 文件识别输出到word 文件中。

免费下载该文档:CAJ格式转换成WORD的方法

CAJ格式转换成WORD的方法的相关文档搜索

相关文档