ocr技术调研及进展汇报

合集下载

视觉识别总结报告范文(3篇)

视觉识别总结报告范文(3篇)

第1篇一、前言随着科技的飞速发展,视觉识别技术逐渐成为人工智能领域的研究热点。

视觉识别技术是指计算机系统通过图像处理、机器学习等方法,对图像或视频中的物体、场景、行为等进行识别和理解的能力。

本文旨在对视觉识别技术的研究与应用进行总结,分析其发展现状、关键技术以及未来发展趋势。

二、视觉识别技术发展现状1. 技术背景视觉识别技术的研究始于20世纪50年代,经过几十年的发展,已经取得了显著的成果。

近年来,随着深度学习、大数据、云计算等技术的飞速发展,视觉识别技术得到了进一步的应用和推广。

2. 发展历程(1)早期阶段:以传统图像处理技术为主,如边缘检测、特征提取、形态学处理等。

(2)中期阶段:以机器学习技术为主,如支持向量机(SVM)、决策树、随机森林等。

(3)现阶段:以深度学习技术为主,如卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。

3. 应用领域视觉识别技术在各个领域都有广泛的应用,主要包括:(1)安防监控:人脸识别、车辆识别、异常行为检测等。

(2)医疗诊断:病变细胞识别、影像分析等。

(3)工业自动化:产品质量检测、机器人视觉等。

(4)自动驾驶:车道线识别、障碍物检测等。

(5)智能家居:人脸识别门禁、智能监控等。

三、视觉识别关键技术1. 图像预处理图像预处理是视觉识别的基础,主要包括图像去噪、图像增强、图像分割等。

通过预处理,可以提高图像质量,为后续的识别任务提供更好的数据。

2. 特征提取特征提取是视觉识别的核心,主要包括传统特征提取和深度学习特征提取。

传统特征提取方法有HOG、SIFT、SURF等,而深度学习特征提取方法以卷积神经网络为代表。

3. 分类与识别分类与识别是视觉识别的最后一步,主要包括监督学习和无监督学习。

监督学习方法有SVM、决策树、神经网络等,无监督学习方法有聚类、主成分分析等。

4. 深度学习技术深度学习技术在视觉识别领域取得了显著的成果,主要包括卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。

ocr精品调研报告

ocr精品调研报告

ocr精品调研报告以下是针对OCR精品调研的报告:一、市场概况及发展趋势在科技的推动下,光学字符识别(OCR)技术得到了快速发展。

OCR技术可以将图像中的文字识别并转换成可编辑的文本格式,大大提升了文字信息的利用价值。

目前,OCR技术已经广泛应用于各个行业,如银行、政府、教育、医疗等。

未来,随着人工智能和机器学习的发展,OCR技术将进一步提升精度和速度,拓展应用领域。

二、主要市场参与者1. 公司A:该公司是OCR领域的领导者,拥有先进的技术和强大的研发团队。

他们的产品在多个行业广泛应用,并取得了良好的市场口碑。

2. 公司B:该公司是OCR领域的新兴力量,利用机器学习和深度学习算法不断优化产品性能。

他们在某些领域取得了突破,并迅速获得了市场份额。

3. 公司C:该公司专注于OCR技术的研究和开发,在某些特定场景下具备竞争优势。

他们与行业领先企业建立了合作关系,共同推动OCR技术的发展。

三、市场竞争分析1. 技术创新:各家公司在OCR技术上进行不断的创新和改进,提高识别准确率和处理速度。

关键技术包括图像预处理、特征提取和文本识别等。

2. 产品定位:不同的公司在市场上有着不同的产品定位,满足不同客户的需求。

有的公司注重产品性能,有的注重用户体验,有的注重定制化服务。

3. 行业应用:OCR技术在不同行业具有广泛的应用前景。

不同公司在各个行业的市场份额不同,需要针对行业特点进行精准的产品开发和市场推广。

四、发展机遇与挑战1. 机遇:随着数字化转型的推进,OCR技术将得到更广泛的应用。

行业云计算和大数据的发展也为OCR技术提供了更好的环境和支持。

2. 挑战:OCR技术在面对多样化的环境和文字时仍存在一定的识别误差。

同时,数据隐私和安全问题也需要加强保护,以防止不当使用和滥用。

五、市场前景展望随着OCR技术的不断成熟和普及,市场规模将继续扩大。

未来,OCR技术将在更多的行业和场景中发挥作用,为社会带来更高效和便捷的信息处理方式。

基于OCR技术的文档自动识别与分类研究

基于OCR技术的文档自动识别与分类研究

基于OCR技术的文档自动识别与分类研究随着工业化、信息化的发展以及数字化转型的加速推进,纸质文档渐渐退出历史的舞台,电子文档在企业中占据越来越重要的地位。

随之而来的一个问题是,如何高效地管理这些电子文档,使之便于检索、存储和应用。

OCR技术(Optical Character Recognition,光学字符识别)的出现,提供了一种高效且自动化的解决方案。

本文将探讨基于OCR技术的文档自动识别与分类研究。

一、OCR技术的概述OCR技术是指通过光学扫描仪、相机等设备对纸质文档进行扫描、获取图像信息,再通过图像处理、自然语言处理等技术手段,将图像中的文本识别成数字化文本的过程。

OCR技术应用广泛,如图书馆数字化项目、法律文件处理、医院病历管理等领域,都可以通过OCR技术实现文档的快速处理和智能化管理。

二、文档分类的研究意义在数字化时代,各行各业都面临着大量的电子文档,如果这些文档不能得到有效的管理,那么企业就会面临着信息无法共享、难以搜索和加工、易丢失等问题。

为此,文档分类的研究变得尤为重要。

文档分类是指对大量的电子文档进行分门别类,按照一定的标准进行整理,以方便管理和检索。

文档分类的研究不仅具有实际应用价值,而且对信息管理和自然语言处理领域也具有重要的研究价值。

三、基于OCR技术的文档自动识别与分类方法1.图像处理在进行OCR处理之前,需要先对图像进行处理。

图像处理的方法多种多样,包括降噪、灰度处理、二值化等。

这些处理过程旨在提取文本形态特征,为OCR 识别做准备。

2. 光学字符识别OCR是整个文档自动识别和分类的核心。

OCR技术主要分为两种方式,一种是基于规则的OCR,即根据规则人工训练出的字符模板,对图像中的文本进行字符匹配识别;另一种是基于机器学习的OCR,即使用机器学习算法训练OCR模型,从而实现OCR识别。

3. 自然语言处理自然语言处理是对文字的理解和分析。

对于文档的自动分类而言,通过自然语言处理的方法进行文本分词、词向量化和文本分类等处理,可以大大提高分类的准确率,同时也方便了后期的文本处理。

OCR解决方案

OCR解决方案

OCR解决方案OCR(Optical Character Recognition)即光学字符识别,是一种将印刷体字符转化为可编辑文本的技术。

随着数字化时代的到来,OCR技术的应用越来越广泛,解决了大量手工输入的问题,提高了工作效率和准确性。

本文将介绍OCR解决方案的相关内容,包括其原理、应用领域、优势以及发展趋势。

一、OCR解决方案的原理1.1 光学扫描:OCR解决方案首先需要对纸质文档进行光学扫描,将纸质文档转化为数字图象。

1.2 图象预处理:在进行字符识别之前,需要对图象进行预处理,包括去噪、灰度化、二值化等操作,以提高后续字符识别的准确性。

1.3 字符识别:OCR解决方案通过图象处理和模式识别等算法,将图象中的字符转化为可编辑的文本。

这一过程包括字符分割、特征提取和字符分类等步骤。

二、OCR解决方案的应用领域2.1 文档数字化:OCR解决方案可以将大量纸质文档转化为电子文本,实现文档的数字化管理和存储,提高文档检索的效率。

2.2 自动化办公:OCR技术可以将扫描的文件转化为可编辑的文本,实现自动化办公。

例如,将扫描的合同文件转化为可编辑的文本,方便修改和存档。

2.3 金融行业:OCR解决方案在银行、保险等金融机构中得到广泛应用。

例如,银行可以通过OCR技术自动识别支票上的金额和账号信息,提高处理效率和准确性。

三、OCR解决方案的优势3.1 提高工作效率:OCR解决方案可以将纸质文档转化为可编辑的电子文本,减少了手工输入的工作量,提高了工作效率。

3.2 提高准确性:相比于人工输入,OCR技术可以更准确地将图象中的字符转化为文本,减少了因人为因素导致的错误。

3.3 节省成本:通过使用OCR解决方案,可以减少大量人力资源的投入,降低了企业的运营成本。

四、OCR解决方案的发展趋势4.1 深度学习:随着深度学习技术的发展,OCR解决方案将更加准确和可靠,能够处理更加复杂的文档和图象。

4.2 多语言支持:随着全球化的进程,OCR解决方案将支持更多的语言,满足不同地区和国家的需求。

ocr技术的主要特点和应用领域

ocr技术的主要特点和应用领域

ocr技术的主要特点和应用领域OCR技术(Optical Character Recognition,光学字符识别)是一种将图像中的文字内容转化为可编辑、可搜索的电子文档的技术。

它的主要特点是高精度、高速度和高适应性。

OCR技术的应用领域非常广泛,包括文档数字化、自动化数据录入、身份证识别、银行卡识别、车牌识别、手写文字识别等。

OCR技术的主要特点如下:1. 高精度:OCR技术可以实现非常高的识别精度,能够准确地将图像中的文字转化为可编辑的文本。

随着深度学习和人工智能的发展,OCR技术的识别精度不断提升,已经可以达到甚至超过人眼识别的水平。

2. 高速度:OCR技术可以实现快速的文字识别和处理,能够在短时间内处理大量的图像和文本数据。

这使得OCR技术在大规模数据处理和自动化流程中具有重要的应用价值。

3. 高适应性:OCR技术可以适应不同的图像和文字格式,包括印刷体、手写体、不同字体、不同大小等。

它可以处理各种复杂的场景,例如模糊图像、倾斜文字、光照不均匀等。

OCR技术的应用领域非常广泛,下面将重点介绍其中几个重要的应用领域。

1. 文档数字化:OCR技术可以将印刷文档、书籍、报纸等纸质文档转化为可编辑的电子文档。

这有助于提高文档的检索、存储和共享效率,并且方便进行文本分析和信息提取。

2. 自动化数据录入:OCR技术可以用于自动识别和提取各种表格、票据、发票等中的文字和数字信息。

这可以大大减少人工录入的工作量和错误率,提高数据的准确性和效率。

3. 身份证识别:OCR技术可以用于自动识别和提取身份证中的姓名、性别、民族、住址等信息。

这可以在办理各种证件、开户等场景中减少人工操作,提高效率和便利性。

4. 银行卡识别:OCR技术可以用于自动识别和提取银行卡中的卡号、有效期、持卡人姓名等信息。

这可以在ATM机、POS机等场景中实现快速的识别和支付,提高用户体验和安全性。

5. 车牌识别:OCR技术可以用于自动识别和提取车牌号码。

OCR解决方案

OCR解决方案

OCR解决方案引言概述:随着数字化时代的到来,OCR(光学字符识别)技术成为了解决大量纸质文档转换为电子文档的重要工具。

OCR解决方案通过将纸质文档中的文字转换为可编辑的电子文本,提高了文档的可搜索性和可编辑性。

本文将详细介绍OCR解决方案的五个大点,包括技术原理、应用领域、优势、挑战和未来发展。

正文内容:1. 技术原理1.1 光学字符识别技术光学字符识别技术通过扫描纸质文档并将其转换为数字图像,然后利用图像处理算法分析图像中的字符形状和结构,最终将其转换为可编辑的电子文本。

该技术基于图像处理、模式识别和自然语言处理等领域的算法和模型。

1.2 文字检测和分割OCR解决方案中的一个重要步骤是文字检测和分割。

该步骤通过图像处理技术识别图像中的文字,并将其分割为单个字符或单词。

该过程需要解决文字的大小、颜色、字体和背景等因素对文字识别的影响。

1.3 字符识别和校正字符识别和校正是OCR解决方案中的核心步骤。

该步骤使用机器学习算法和模型对分割后的字符进行识别和校正,以提高识别准确率。

这些算法和模型基于大量的训练数据,并通过不断迭代和优化来提高识别效果。

2. 应用领域2.1 文档转换OCR解决方案广泛应用于文档转换领域。

它可以将大量纸质文档转换为电子文档,提高文档的可搜索性和可编辑性。

这在法律、银行、医疗和教育等领域具有重要意义。

2.2 自动化数据录入OCR解决方案可以实现自动化数据录入,将纸质表格中的数据转换为电子表格。

这大大提高了数据录入的效率和准确性,减少了人工录入的错误和工作量。

2.3 身份证识别OCR解决方案还可以应用于身份证识别。

通过识别身份证上的文字和图像,可以快速准确地获取身份证信息,方便了各种需要验证身份的场景,如银行开户、机场安检等。

3. 优势3.1 提高效率和准确性OCR解决方案可以快速准确地将纸质文档转换为电子文本,大大提高了处理文档的效率和准确性。

相比手动输入,OCR技术能够大幅节省时间和人力成本。

OCR解决方案

OCR解决方案

OCR解决方案一、引言随着数字化时代的到来,大量的纸质文档需要进行数字化处理,以便更好地管理和利用。

OCR(Optical Character Recognition,光学字符识别)技术应运而生,它能够将纸质文档中的文字转化为可编辑的电子文本,极大地提高了工作效率和数据可利用性。

本文将介绍一种OCR解决方案,以满足企业数字化转型的需求。

二、解决方案概述本OCR解决方案采用先进的OCR技术,结合自动化处理流程和可定制化的配置选项,能够快速、准确地将纸质文档中的文字提取出来,并生成可编辑的电子文本。

该解决方案具有以下特点和优势:1. 高效性:采用优化算法和并行处理技术,能够快速处理大量文档,提高工作效率。

2. 准确性:通过深度学习和模式识别技术,能够准确识别各种字体、大小和形态的字符。

3. 多语言支持:支持多种语言的文字识别,包括中文、英文、法文、德文等,满足国际化需求。

4. 可定制化:提供可配置的参数和接口,允许用户根据实际需求进行定制和集成。

5. 数据安全:采用数据加密和权限控制技术,确保文档的安全性和隐私保护。

三、解决方案流程本OCR解决方案的处理流程如下:1. 文档输入:将纸质文档通过扫描仪或数码相机等设备转换为数字图像。

2. 图像预处理:对数字图像进行预处理,包括图像增强、去噪、灰度化等操作,以提高后续文字识别的准确性。

3. 文字识别:采用OCR技术对预处理后的图像进行文字识别,将文字转化为可编辑的电子文本。

4. 后处理:对识别结果进行校正、格式化和校验等操作,以提高文本质量和可读性。

5. 结果输出:将识别后的电子文本输出到指定的目标位置,如数据库、文件夹或云存储等。

四、解决方案应用场景本OCR解决方案适用于各种场景,包括但不限于以下几个方面:1. 文档数字化:将大量的纸质文档进行数字化处理,以便进行全文检索、文档管理和数据分析等工作。

2. 表单识别:对表格、调查问卷等纸质表单进行识别,提取表格中的数据,实现自动化数据录入和统计分析。

OCR 分析报告

OCR 分析报告

OCR定义OCR(Optical Character Recognition)即光学字符识别,是指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程:即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

目前项目使用需求项目名称:吉凯随访系统;项目甲方:吉凯基因技术有限公司;。

需求目标:吉凯随访系统中规划的OCR技术需求范围:利用OCR技术功能模块,解析用户所上传的病历文档图片(包含病历、医嘱、检查、检验等文书),将图片转换为计算机可识别的文字语言;根据转换的结果进行分析、统计等应用;对所建议开发的软件基本要求如下:●病例图片文字识别;●识别率90%以上,识别时间小于10分钟;●输出病例相关内容,需要按照病例格式输出,否则无法判断最终结果;●患者上传相关病例文档图片,上传之后后台识别反馈结果给患者或者医生。

;●数据词库自己训练,需要程序自动带有学习功能;●开发周期两个月。

现状目前市面上OCR技术应用于医疗行业的APP及软件如下:汉王OCR(PC端软件):汉王OCR是一个带有PDF文件处理功能的OCR软件;具有识别正确率高,识别速度快的特点。

有批量处理功能,避免了单页处理的麻烦;支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件;可识别简体、繁体和英文三种语言;具有简单易用的表格识别功能;具有TXT、RTF、HTM和XLS多种输出格式,并有所见即所得的版面还原功能。

新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别,既可以采用OCR的方式将PDF文件转换为可编辑文档,也可以采用格式转换的方式直接转换文字型PDF文件为RTF文件或文本文件;实际测试汉王OCR后发现其受图片质量、图片格式、图片灰度、图片大小等因素影响,实际对于病历文档的识别率不到30%,不能满足项目需求;但其可接受定制化需求,定制化需要额外付费,初步估计在10W以上一个病历模板,目前病历的模板种类数量非常大,项目成本将无法预估;易道博识北京易道博识科技有限公司(简称“易道博识”)成立于2013年,由来自中科院、清华大学、北京大学的多名顶尖的模式识别专家共同组建。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

移动端OCR开源工程
• tess-two ,Tesseract的安卓移植 • microblink ,免费的移动OCR-SDK
OCR问题分类
• 简单文本图片 业界能做到比较好效果 • 复杂图文
复杂图文的文字检测和识别压力很大,非常具有挑战性
• 结构化图文
不光是ocr,需要结合其他方法定位
OCR流程
• OCRopy —— 基于训练的OCR引擎,项目比Tesseract更年轻 Python工程
• Microsoft OCR Library —— 有中文版 Windows8.1之后的版本内置OCR引擎,可用于桌面 windows app 不知道效果如何 • GNU Ocrad —— 命令行工具。有JS移植,可用于前端 • GOCR —— 命令行工具。有JS移植,可用于前端 • Cuneiform for Linux —— 本来是个Windows软件,这是Linux的移植,2011年4月已经停止维 护
Tesseract识别过程图
Tesseract识别关键技术
传统方法和深度学习方法对比
Tesseract训练
• 下载工具jTessBoxEditor • 1、自己扫描获取样本图像 • 2、合并样本图像 • 3、生成Box File文件 • 4、手工矫正生成语言库文件 • 5、使用训练后的语言库进行识别
输入图像
图像预处 理
特征提取 和降维
分类器
分类得到 识别结果
后处理 纠正
输出
图像预处理
• பைடு நூலகம்像增强
• 锐化、去雾、修复
• 图像二值化
• 黑白化
图像预处理
• OpenCV —— 图像处理老大哥。OpenCV3中有Scene Text Detection值得一用。 • Libccv —— 现代图像处理库,被很多人推荐。实现了精选的若干个图像处理 算法,干净容易移植。其中 Stroke Width Transfor 尤其有用。 • lswms —— 分行检测。 • OCRopus —— 基于神经学习网络算法的布局分析库。 • TiRG —— 文字区域检测库 • unpaper —— 检测文字和旋转,用的是 Hough transform 算法。
OCR商业产品
目前国内水平较高的有清华文通、汉王、尚书,国外是 ABBYY和IRIS,其产品各有千秋,但是都价值不菲。效果基本都能 够达到95%,扫描清晰的话正确率可以达到99%以上,腾讯云ocr据 说已经达到99.99%
OCR选型
• Tesseract —— 开源OCR引擎,也有命令行工具。HP开发Google接手。3.0之后支持训练,4.0 以后开始支持深度学习训练 C++ 工程
Tesseract的技术优势
基于项目选型的几点要求:开源、免费、识别率高;所以选择 了Tesseract的OCR引擎。
• 开源 Tesseract的OCR引擎已作为开源项目发布在Google Project,是完全开源 的。 • 多语言支持 通过不同的语言训练库可以支持多种语言(包括中文、日文)。 • 多平台支持 该项目目前支持Windows、Linux和Mac OS 等主流平台。 • 支持样本训练 可以通过jTessBoxEditor工具对样本进行训练,而生成语言文件供 Tesseract使用,从而提高识别精确度。
后期工作
• 本周可以完成产品应用ocr服务接口 • 增量训练 完成增量训练优化 一个月 • 图像预处理 • 场景做定制化 复杂图片识别和结构化识别 三个月 • 目标效果达到90%
总结
• 使用开源工具标注数据,支持增量训练,可以做一个baseline • 前面的图像预处理很重要, • 后面需要针对场景做定制化优化 • 使用深度学习训练达到更好的效果
Tesseract支持增量训练
• 通过输入小数据集进行优化, 将不同的训练文件合在一起,可小 幅度提升效果
后处理语义纠正
• 利用语义模型对一些错误识别进行纠正 • 大树据-》大数据 • 仼小二 -》王小二
Tesseract效果
{meta={code=200, message=识别成功}, data={result=云计算 、 人工智能等技术, 探索构建可灵活扩展的网站架构, 创 新服务模式, 打造智慧型政府网站 u 5' 集约节约。 加强统 筹规划和顶层设计, 优化技术、 资金、人员等要素配置, 避免重复建设, 以集中共享的资源库为基础、安全可控的 云平台为依托, 打造协同联动、 规范高效的政府网站集群 。二、 职贵分工(一) 管理职贵。国务院办公厅是全国政 府网站的主管单位, 负责推进、 指导、 监督全国政府网站 建设和发展。 各省 (区、 市> 人民政府办公厅、 国务院各 部门办公厅 (室) 是本地区、 本部门政府网站的主管单位, 实行全系统垂直管理的国务院部门办公厅 (室) 是本系统 网站的主管单位。 主管单位负责对政府网站进行统筹规 划和监督考核, 做好开办整合、 安全管理、 考核评价和督 查问贵等管理工作。 地市级和县级人民政府办公厅 (室) 承担本地区政府网站的管理职责。中央网信办统筹协调全 国政府网站安全管理工作u 中央编办、 工业和信息化部、 公安部是全国政府网站的协同监管单位,共同做好网站标 识管理、 域名管理和ICP备案、 网络安全等级保护、 打击 网络犯罪等工作。(二) 办站职贵 u 1. 政府网站的主办单位 一般是政府办公厅 (室) 或部门办_ 4 _}}
汉王效果
 { "code":0,"result":"云计算、人工智能等技术,探索构建可灵活扩展的 网站架构,创\u000a新服务模式,打造智慧型政府网站。\u000a 5. 集约节约。加强统筹规划和顶层设计,优化技术、资金、\u000a人员 等要素配置,避免重复建设,以集中共享的资源库为基础、\u000a安 全可控的云平台为依托,打造协同联动、规范高效的政府网站\u000a 集群。\u000a 二、职责分工\u000a (一)管理职责。\u000a 国务 院办公厅是全国政府网站的主管单位,负责推进、指\u000a导、监督 全国政府网站建设和发展。各省(区、市)人民政府办\u000a公厅、 国务院各部门办公厅(室)是本地区、本部门政府网站的\u000a主管 单位,实行全系统垂直管理的国务院部门办公厅(室)是本\u000a系 统网站的主管单位。主管单位负责对政府网站进行统筹规划和\u000a 监督考核,做好开办整合、安全管理、考核评价和督查问责等管 \u000a理工作。地市级和县级人民政府办公厅(室)承担本地区政府 网\u000a站的管理职责。\u000a 中央网信办统筹协调全国政府网站 安全管理工作。中央编\u000a办、工业和信息化部、公安部是全国政 府网站的协同监管单位,\u000a共同做好网站标识管理、域名管理和 ICP备案、网络安全等级\u000a保护、打击网络犯罪等工作。 \u000a (二)办站职责。\u000a 1.政府网站的主办单位一般是政府办 公厅(室)或部门办"}
OCR技术调研及进展汇报
OCR介绍
OCR识别技术通过对图片中的文字进行提取识别,转换成可 检索的数据。OCR基于汉字的识别最早见于20世纪60年代,采用基 于模版匹配的方法,由IBM公司的Casey和Nagy于1966年提出。我 们国家开始于70年代,到了90年代,中文OCR技术慢慢走商业市场, 开始在实际中应用。
相关文档
最新文档