提取图片中(或扫描版PDF)的文字

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

提取图片中(或扫描版PDF)的文字

如果在书上看到一篇好文章用相机拍下来,或是纸质文章需要输入到电脑时,如果数量比较大,手动输入会很慢,下面介绍几中方法将图片中的文字转化为文本,同样适用于影印版PDF。

1 ABBYY FineReader 11软件

泰比(ABBYY)FineReader提供直观的文件扫描和转换成可编辑、可搜索的电子格式工具。泰比(ABBYY)FineReader可以识别和转换几乎所有打印的文档类型,包括书籍、志上的文章与复杂的布局、表格和电子表格、图片,甚至以准确的精度发传真。

下载地址:网上随便一搜就很多例如:

/soft/Application/Processing/15768.html

破解补丁:

/space/file/l513980209/share/2011/11/2/ABBYY_F ineReader_11_Professional_Edition_-514d-5e8f-5217-53f7-65e0-9650-5236 -7834-89e3-7248-7834-89e3-6587-4ef6.rar/.page#

破解方法:将下载的文件替换安装文件即可。

2 Office200

3 自带组件Microsoft Office Document Imaging

如果Office装的是精简版,那么在就没装这个组件,可以自己装一下或是下载完整版。装完后如下图。

第一步:转换文件格式。用ACDSee打开你的.jpg文件,单击界面上的“浏览器”按钮(或者双击当前图片都可以进入到浏览器界面),在打开的浏览器中,右键这个文件,在右键菜单中选择“工具/转换文件格式”;在转换文件格式对话框中,选择TIFF格式,两次下一步后,就开始转换,结果是将你当前的.jpg 文件转换成了.tif文件。

第二步:将图片转换为文字。选择:开始/所有程序/Microsoft

Office/Microsoft Office工具/Microsoft Office Document Imaging,打开这个工具后,菜单:文件/打开,找到你保存的那个.tif文件,打开它。然后选择菜单:工具/使用OCR识别文本;梢等一会儿,继续菜单:工具/将文本发送到Word。这样,这幅图片就到了Word中成了可以编辑的文字内容了。因为OCR识别并非百分之百成功,所以有些位置可能需要你进行手动修改。

界面如下:

3 通过PDF->文字

也就是先将图片转化为PDF,然后再提取。

第一、下载DoPDF将word转化为PDF,网上多得很例如下载地址:/soft/1329.html

第二、下载AJViewer,地址:/sfinfo/7781.html

第三、打开AJViewer,选择文字识别,如下图

4 慧眼图像文字识别软件

可参考

/article/ceb9fb1006ffed8cad2ba01d.html

说点其他的吧,介绍一款截图软件Snagit 11,很是好用,可以截图、截文字、录视频,有图有真相。

下载地址:/soft/2290.html

序列号

Academic License:

SXS38-USEZF-KWTBP-CMC7A-4MR85

Multi Users License:

ZEN5H-24LZK-TNYET-2EGKJ-MMCE4

Single Users License:

LVCVK-EG4D7-QMQCD-M3HP9-7ABCM

相关文档
最新文档