光学字符识别
ocr 常用算法

ocr 常用算法
OCR(Optical Character Recognition,光学字符识别)常用的算法包括:
1. 模板匹配法:将待识别字符与预设字符库模板进行比较,找出最相似的模板作为识别结果。
2. 特征提取法:基于字符的结构特征如连通域、端点、角点等进行分析,并通过训练得到的分类器识别字符。
3. 神经网络模型:尤其是深度学习技术广泛应用后,卷积神经网络(CNN)结合循环神经网络(RNN)或长短时记忆网络(LSTM)在OCR中表现优秀,通过大量标注数据训练,能够自动学习并提取字符特征进行识别。
4. 隐藏马尔可夫模型(HMM):通过统计学习方法,对字符序列的概率分布进行建模,实现连续字符序列的识别。
以上各算法常结合使用,以提升OCR系统的准确性和鲁棒性。
ocr工作原理

ocr工作原理OCR(Optical Character Recognition,光学字符识别)是一种将印刷体字符转换为可编辑文本的技术。
它通过扫描和识别图像中的字符,将其转化为数字形式,使计算机能够理解和处理这些字符。
OCR技术在许多领域中得到广泛应用,如文档数字化、自动化数据输入、车牌识别等。
OCR的工作原理可以分为四个主要步骤:图像获取、预处理、字符识别和后处理。
1. 图像获取首先,需要获取待识别的图像。
这可以通过扫描纸质文档、拍摄照片或从数字图像中提取得到。
图像获取的质量对后续的识别过程至关重要,因此应尽量保证图像清晰、光照均匀且无噪声。
2. 预处理在进行字符识别之前,需要对图像进行预处理以提高识别准确率。
预处理包括以下步骤:- 图像灰度化:将彩色图像转换为灰度图像,简化后续处理步骤。
- 图像二值化:将灰度图像转换为二值图像,即将字符与背景分离出来,以便更好地进行字符分割。
- 去噪:通过滤波等方法去除图像中的噪声,以减少对字符识别的干扰。
- 字符分割:将图像中的字符分割成单个字符,以便进行逐个字符的识别。
3. 字符识别字符识别是OCR的核心步骤。
在这一步骤中,使用各种算法和模型来识别图像中的字符。
常用的字符识别方法包括:- 模板匹配:将待识别字符与预先定义的模板进行匹配,找到最匹配的字符。
- 特征提取:提取字符的特征,如边缘、形状等,然后与已知字符的特征进行比较,找到最相似的字符。
- 机器学习:使用机器学习算法,如神经网络、支持向量机等,通过训练模型来识别字符。
4. 后处理在字符识别之后,还需要进行后处理以提高识别结果的准确性。
后处理包括以下步骤:- 字符校正:校正可能识别错误的字符,如通过字典校正或语言模型校正。
- 结果整合:将识别出的单个字符组合成单词、句子或段落。
- 格式化:根据需求对识别结果进行格式化,如添加换行符、标点符号等。
总结:OCR工作原理是通过图像获取、预处理、字符识别和后处理四个主要步骤来实现将印刷体字符转换为可编辑文本的技术。
光学字符识别技术教程及案例分析

光学字符识别技术教程及案例分析光学字符识别技术(Optical Character Recognition,OCR)是一种将印刷或手写的字符转换成数字代码的技术。
它可以通过扫描、拍摄或输入图像的方式将字符识别为计算机可读的文字。
OCR技术在实际应用中具有广泛的用途,包括自动化数据录入、文档管理、银行票据处理等。
本文将详细介绍光学字符识别技术的原理、方法和应用,并结合具体案例对其进行分析。
1. 光学字符识别技术原理光学字符识别技术的原理是将图像中的字符转换为数字代码。
首先,图像需经过预处理步骤,包括图像采集、去噪、二值化等。
然后,利用特征提取算法,将字符的特征转化为可识别的代码表示。
最后,通过模式匹配或机器学习算法,将提取到的特征与已知字符库进行比对,从而实现字符识别。
2. 光学字符识别技术方法在光学字符识别技术中,主要有两种方法:基于模板匹配和基于机器学习。
基于模板匹配的方法通过事先构建字符模板集合,将输入的字符与模板进行比对,匹配度最高的即为识别结果。
这种方法适用于字符形状规则、背景干净的场景,但对于不同字体、模糊等情况的适应性较差。
基于机器学习的方法通过训练算法,从大量样本中学习字符的特征,建立分类模型。
这种方法可以适应不同字体、变形等情况,并具有较高的识别准确率。
常用的机器学习算法包括支持向量机(SVM)、神经网络等。
3. 光学字符识别技术应用案例(1) 文本数字化处理: OCR技术可以将图像中的文本信息转换为可编辑的文本文件,大大提高了文档管理和检索的效率。
例如,在法律和金融领域,大量的合同、表格等文件需要数字化处理,OCR技术可以将纸质文件快速转换为电子文档,方便后续的查找、编辑和存储。
(2) 自动化数据录入: 在一些需要大量数据输入的场景中,OCR技术可以实现自动化数据录入,代替人工手动输入。
例如,银行处理支票、快递公司扫描运单、票务系统扫描车票等。
OCR技术可以快速识别出相关信息,并自动录入到系统中,减少了人工错误和时间成本。
OPI的名词解释

OPI的名词解释在当今的科技社会中,OPI(Optical Character Recognition, 光学字符识别)是一个不可或缺的技术。
OPI旨在将印刷文字转化为可编辑、可搜索的数字文字,并且在日常生活中被广泛应用于各种场景中,如办公自动化、图书馆数字化、文档管理以及在线购物等领域。
1. OPI的工作原理和技术发展OPI技术的核心是通过光学传感器捕捉到印刷文字的图像信息,然后将其转化为计算机可读的字符编码。
这一过程一般包括三个主要步骤:图像预处理、特征提取和字符识别。
图像预处理阶段主要是对原始图像进行去噪、增强和滤波处理以提高图像质量。
特征提取是将处理后的图像转换为计算机可以理解的特征向量表达形式,常用的技术包括轮廓分析、边界跟踪和灰度分布等。
最后,字符识别采用各种算法和模型来识别和分类字符,并将其转化为可编辑的文本。
随着人工智能和机器学习的迅速发展,OPI技术也在不断进步。
传统的基于规则的方法正逐渐被基于深度学习的方法所取代。
深度学习允许计算机通过大量的样本数据自动学习特征和模式,从而提高字符识别的准确率和性能。
此外,云计算和大数据技术的快速发展也为OPI的实时性和规模性提供了良好的支持。
2. OPI的应用领域OPI技术在各行各业都有广泛的应用。
在办公自动化方面,OPI通过将印刷文档转化为可编辑的电子文本,提高了文件管理的效率和准确性。
用户可以通过对电子文本的编辑和搜索,快速找到所需信息,避免了翻阅大量纸质文档的困扰。
此外,OPI还可以自动化进行表格、图表和公式的提取和分析,大大减少了人工的工作量。
图书馆数字化是OPI的另一个主要应用领域。
传统的图书馆馆藏大多以印刷书籍和期刊形式存在,但这些物质载体无法直接被电子设备搜索和利用。
通过使用OPI技术,图书馆可以将印刷资料数字化,转化为可搜索和可存储的文本数据。
这样不仅方便了读者的检索和阅读,同时也保护了珍贵的历史文化遗产,防止因纸质材料老化和破损而丧失。
ocr工作原理

ocr工作原理OCR(Optical Character Recognition,光学字符识别)是一项将印刷体字符转换为可编辑文本的技术。
它在现代信息处理中发挥着重要作用,如扫描文档、自动识别车牌号码、数字化图书馆等。
本文将介绍OCR的工作原理,包括图象预处理、字符分割、特征提取、分类识别以及后处理等五个大点。
引言概述:OCR技术的发展使得大量的纸质文档能够被快速、准确地数字化处理。
它不仅提高了信息的利用效率,也为人们的生活带来了极大的便利。
下面将详细介绍OCR的工作原理。
正文内容:1. 图象预处理:1.1 图象获取:通过扫描仪或者摄像头获取纸质文档的图象。
1.2 图象增强:对图象进行去噪、灰度化、二值化等处理,以提高字符的边缘清晰度和对照度。
2. 字符分割:2.1 行分割:将图象分割成多行,以便更好地处理不同行之间的字符。
2.2 字符定位:通过检测字符的边缘或者连通区域,确定字符的位置。
2.3 字符切割:根据字符的位置信息,将图象分割成单个字符。
3. 特征提取:3.1 形状特征:提取字符的轮廓、角点等形状信息。
3.2 纹理特征:提取字符的纹理信息,如灰度直方图、梯度直方图等。
3.3 统计特征:通过统计字符的像素分布、投影等信息,获取字符的特征。
4. 分类识别:4.1 训练模型:使用已标注的样本数据,通过机器学习算法训练OCR模型。
4.2 特征匹配:将待识别字符的特征与训练好的模型进行匹配,得出最可能的字符类别。
4.3 决策阈值:根据匹配结果和阈值设定,确定字符的最终识别结果。
5. 后处理:5.1 字符校正:根据上下文信息对识别结果进行校正,减少识别错误。
5.2 字符连接:对分割错误的字符进行连接,恢复正确的字符形状。
5.3 结果输出:将识别结果输出为可编辑文本或者其他格式,以便后续处理和应用。
总结:通过图象预处理、字符分割、特征提取、分类识别和后处理等步骤,OCR技术能够实现对纸质文档中的字符进行准确识别。
ocr 原理

ocr 原理OCR原理。
OCR(Optical Character Recognition,光学字符识别)是一种通过扫描、识别和转换印刷的文本到电子文本的技术。
它的出现极大地提高了文档数字化的效率,为信息的存储和检索提供了便利。
OCR技术已经广泛应用于各个领域,如图书馆、档案管理、金融、医疗等。
OCR技术的原理主要包括图像预处理、文本行定位、字符分割、字符识别和后处理等几个步骤。
首先,图像预处理是对扫描得到的图像进行处理,包括去除噪声、增强对比度、调整图像大小等,以便后续的处理。
接下来是文本行定位,它的主要目的是确定文本行的位置和边界,以便后续的字符分割。
字符分割是将文本行中的字符切割成单个的字符,这是OCR技术中一个比较关键的步骤,因为字符的大小、字体、间距等都会影响到字符的识别效果。
字符识别是将切割好的字符进行识别,将其转换成计算机可识别的文本。
最后是后处理,对识别出的文本进行校正和修正,以提高识别的准确率和精度。
在OCR技术中,字符识别是最核心的部分。
字符识别的方法主要包括模板匹配、特征提取和神经网络等。
模板匹配是将图像中的字符与预先存储的字符模板进行匹配,从而识别出字符。
特征提取是通过提取字符的特征信息,如边缘、纹理、形状等,然后利用这些特征进行字符的识别。
神经网络是一种模拟人脑神经元网络的计算模型,通过训练神经网络,使其能够识别字符。
这些方法各有优劣,可以根据具体的应用场景来选择合适的方法。
除了字符识别的方法外,OCR技术还需要考虑一些因素来提高识别的准确率。
首先是图像质量,图像的清晰度、分辨率、光照等因素都会影响字符的识别效果。
其次是语言和字体的适配性,不同的语言和字体对OCR技术的要求也不同,需要根据具体的应用场景来选择合适的OCR技术。
此外,还需要考虑文档的布局和格式,不同的文档布局和格式也会对OCR技术的效果产生影响。
总的来说,OCR技术作为一种重要的信息处理技术,已经在各个领域得到了广泛的应用。
光学字符识别

光学字符识别随着数字化技术的快速发展,光学字符识别(Optical Character Recognition,OCR)在各个领域发挥着重要作用。
本文将介绍光学字符识别的原理、应用领域和未来发展趋势。
一、原理光学字符识别技术基于图像处理和模式识别的理论和方法,通过将扫描或拍摄的图像进行预处理,提取其中的字符信息,再利用机器学习算法进行字符识别。
主要包括以下几个步骤:1. 图像获取:利用扫描仪、相机等设备获取待识别图像。
2. 预处理:对获取的图像进行降噪、去除干扰、调整图像大小等操作,以提高后续字符识别的准确性。
3. 字符分割:将预处理后的图像中的字符分割出来,使每个字符成为一个独立的图像。
4. 特征提取:对每个字符图像提取的特征,例如边缘、纹理、灰度等信息。
5. 字符识别:利用机器学习算法,通过对比字符特征与已知字符特征的匹配程度,确定字符的识别结果。
二、应用领域光学字符识别技术在许多领域中都有广泛的应用,如以下几个方面:1. 文字识别:将印刷体或手写体的文字转换为可编辑的电子文本,方便后续的文字处理。
2. 车牌识别:通过识别车牌上的字符信息,实现车辆的自动识别和监控。
3. 银行票据处理:对支票、汇票等票据上的字符进行自动识别,提高票据处理的效率和准确性。
4. 历史文献数字化:对纸质文献进行扫描和识别,将其转换为电子文档,方便保存和检索。
5. 数码相机辅助功能:识别照片上的字符信息,例如日期、地点等,方便后续的管理和分类。
三、未来发展趋势随着深度学习和人工智能技术的快速发展,光学字符识别技术也呈现出以下几个发展趋势:1. 高精度识别:通过引入深度学习算法,进一步提高字符识别的准确性和稳定性,逐步实现和人类相近甚至超越人类的识别能力。
2. 跨语种识别:光学字符识别技术将逐步支持更多语种的文字识别,满足不同地区和国家的需求。
3. 实时识别:结合硬件设备的发展,光学字符识别将更快速地实现对字符的识别,为各种应用场景提供更高效的解决方案。
ocr工作原理

ocr工作原理OCR(Optical Character Recognition)即光学字符识别,是一种将印刷体字符转化为可编辑和可搜索的电子文本的技术。
OCR技术的应用广泛,如扫描文件的文字提取、自动化数据录入等。
本文将详细介绍OCR的工作原理。
一、光学字符识别的概述光学字符识别技术是通过图像处理和模式识别的方法,将印刷体字符转化为计算机可处理的文本形式。
OCR系统通常由图像预处理、字符分割、特征提取和字符识别等几个主要模块组成。
1.1 图像预处理图像预处理是OCR系统的第一步,其目的是消除图像中的噪声、增强字符的对比度和清晰度。
常用的图像预处理技术包括灰度化、二值化、去噪和图像增强等。
灰度化将彩色图像转化为灰度图像,简化后续处理过程。
二值化将灰度图像转化为二值图像,即将字符区域与背景区域分离开来。
去噪技术通过滤波器等方法去除图像中的噪声,以减少对后续处理的干扰。
图像增强技术可以提高字符的对比度和清晰度,有助于提高字符的识别率。
1.2 字符分割字符分割是OCR系统的关键步骤,其目的是将连续的文字区域分割成单个字符。
字符分割可以通过基于像素的方法或基于连通区域的方法来实现。
基于像素的方法是通过检测字符之间的空白像素来进行分割,但在字符之间存在重叠或接触的情况下容易出错。
基于连通区域的方法则是通过检测字符之间的连通性来进行分割,相对更加稳定可靠。
1.3 特征提取特征提取是OCR系统的核心步骤,其目的是从字符图像中提取出能够代表字符特征的信息。
常用的特征提取方法包括投影法、轮廓法和统计法等。
投影法通过计算字符图像在水平和垂直方向上的像素分布来提取特征。
轮廓法则是通过提取字符的边界轮廓来获取特征。
统计法则是通过统计字符图像的像素值分布来提取特征。
特征提取的目标是将字符的形状、结构和纹理等信息转化为计算机可处理的数值特征。
二、OCR的工作原理OCR的工作原理可以分为图像预处理、字符分割、特征提取和字符识别四个部分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
光学字符识别
OCR是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,从根本上改变了人们对计算机汉字人工编码录入的概念。
使人们从繁重的键盘录入汉字的劳动中解脱出来。
只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍。
比如用手机给名片拍照,名片中的姓名、电话号码等信息就会自动识别进入到手机中,从此查询、拨打轻而易举。
目前支持该功能的手机主要有摩托罗拉A1200、索爱P990和LG G832等。
所以,OCR是一种非常快捷、省力的文字输入方式,也是在文字量比较大的今天,很受人们欢迎的一种输入方式。
由于OCR是一门与识别率拔河的技术,因此如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。
而根据文字资料存在的媒体介质不同,及取得这些资料的方式不同,就衍生出各式各样、各种不同的应用。
在此对OCR作一基本介绍,包括其技术简介以及其应用介绍。
OCR的发展
要谈OCR的发展,早在60、70年代,世界各国就开始有OCR的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。
以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。
OCR可以说是一种不确定的技术研究,正确率就像是一个无穷趋近函数,知道其趋近值,却只能靠近而无法达到,永远在与100%作拉锯战。
因为其牵扯的因素太多了,书写者的习惯或文件印刷品质、扫描仪的扫瞄品质、识别的方法、学习及测试的样本……等等,多少都会影响其正确率,也因此,OCR的产品除了需有一个强有力的识别核心外,产品的操作使用方便性、所提供的除错功能及方法,亦是决定产品好坏的重要因素。
一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。
其处理流程如下图:
从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。
在此逐一介绍:
影象输入:欲经过OCR处理的标的物须透过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机。
科技的进步,扫描仪等的输入装置已制作的愈来愈精致,轻薄短小、品质也高,对OCR有相当大的帮助,扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。
影象前处理:影像前处理是OCR系统中,须解决问题最多的一个模块,从得到一个不是黑就是白的二值化影像,或灰阶、彩色的影像,到独立出一个个的文字影像的过程,都属于影像前处理。
包含了影像正规化、去除噪声、影像矫正等的影像处理,及图文分析、文字行与字分离的文件前处理。
在影像处理方面,在学理及技术方面都已达成熟阶段,因此在市面上或网站上有不少可用的链接库;在文件前处理方面,则凭各家本领了;影像须先将图片、表格及文字区域分离出来,甚至可将文章的编排方向、文章的题纲及内容主体区分开,而文字的大小及文字的字体亦可如原始文件一样的判断出来。
文字特征抽取:单以识别率而言,特征抽取可说是OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏,也所以在OCR研究初期,特征抽取的研究报告特别的多。
而特征可说是识别的筹码,简易的区分可分为两类:一为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。
而另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方法为主。
对比数据库:当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。
对比识别:这是可充分发挥数学运算理论的一个模块,根据不同的特征特性,选用不同的数学距离函数,较有名的比对方法有,欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP),以及类神经网络的数据库建立及比对、HMM(Hidden Markov Model)…等著名的方法,为了使识别的结果更稳定,也有所谓的专家系统(Experts System)被提出,利用各种特征比对方法的相异互补性,使识别出的结果,其信心度特别的高。
字词后处理:由于OCR的识别率并无法达到百分之百,或想加强比对的正确性及信心值,一些除错或甚至帮忙更正的功能,也成为OCR系统中必要的一个模块。
字词后处理就是一例,利用比对后的识别文字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑的词,做更正的功能。
字词数据库:为字词后处理所建立的词库。
人工校正:OCR最后的关卡,在此之前,使用者可能只是拿支鼠标,跟着软件设计的节奏操作或仅是观看,而在此有可能须特别花使用者的精神及时间,去更正甚至找寻可能是OCR出错的地方。
一个好的OCR软件,除了有一个稳定的影像处理及识别核心,以降低错误率外,人工校正的操作流程及其功能,亦影响OCR的处理效率,因此,文字影像与识别文字的对照,及
其屏幕信息摆放的位置、还有每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词,都是为使用者设计尽量少使用键盘的一种功能,当然,不是说系统没显示出的文字就一定正确,就像完全由键盘输入的工作人员也会有出错的时候,这时要重新校正一次或能允许些许的错,就完全看使用单位的需求了。
结果输出:其实输出是件简单的事,但却须看使用者用OCR到底为了什么?有人只要文本文件作部份文字的再使用之用,所以只要一般的文字文件、有人要漂漂亮亮的和输入文件一模一样,所以有原文重现的功能、有人注重表格内的文字,所以要和Excel等软件结合。
无论怎么变化,都只是输出档案格式的变化而已。
提高OCR识别率
购买了扫描仪,你一定会发现,附赠的软件中有中英文OCR识别软件,当然一般都是基础版。
很多人认为此类OCR的识别率不是很高,甚至怀疑只有那些正版的数千元的OCR软件其识别率才很高。
其实,你只要注意使用技巧,此类OCR的识别率完全可达实用化水平。
1、处理原稿扫描图像,使之清晰可“辨”。
在其它因素都满足的前提下,对一般的印刷稿、打印稿(包括清晰的针打稿)等质量较好的文稿进行识别,其识别率一般可达到98%以上。
而对报纸、复印件等不太清晰的文稿进行识别,无论哪种OCR都难以达到较高的识别率。
对那些原稿不太清晰的,要注意识别前对图像加以处理,除去其上的污迹。
并注意将偏斜的版面“改斜归正”,通常OCR软件均有此功能,且一般都设有自动纠偏和手动纠偏。
2、分辨率应选择适宜。
一般选择300dpi较合适,分辨率选小了会使识别率降低,选得太大了并不能有效提高识别率,还会大幅度加长文件长度,浪费处理时间。
有的扫描软件设备上有一项“OCR扫描”,干脆将分辨率锁定为300dpi,这是很有道理的。
3、调整好亮度值和对比度值。
这条非常关键,对识别率的影响很大。
亮度值的调整是在识别前,先看看扫描得到的图像中文字质量如何,如果文字线条凹凸不平,甚至有断线,说明亮度值太大了,应减小亮度值;当文字线条很黑很粗,甚至挤成了黑疙瘩,分不清笔划时,则说明亮度值太小了,应增加亮度值;对比度的调节要视原稿确定,笔者常根据预扫时图像清晰度确定。
4、利用OCR的自学习功能。
有时OCR对某些字总是难以识别,比如OCR 开始对“的”和“二”等字总是搞错,这时可以利用OCR软件的自学习功能,“引导”它正确识别一次(有些不同的字体各需一次),它以后就对这些字“熟识”了。
具体操作极易,上机看一下菜单即可明白。
另外,若原稿全是英文或其中中文很少,最好用附赠的英文OCR软件。
还有,现在已有一些很好的文字校对软件,其中一般都设置了OCR校对,利用这些软件先行处理一下所得文本文件,则可大大减轻人工校对负担。