基于TesseractOCR和Baidu语音的证件识别系统毕业设计开题报告

专题题目 ________________________________________________________ 设计（论文）起止日期：2016年3月20日至2016年6月1日

计算机科学与技术学院软件工程专业XX年级X班

学生姓名XX

指导教师XX

教研室（系）主任_ XX —_

教学院长____________ _____________________

年月日2016年4月20日

须知

一、本手册第1 页是毕业设计（论文）任务书，由指导教师填写；第2 页是开题报告；第3 页是答辩申请事项。答辩时学生须向答辩委员会（或答辩小组）提交本手册，作为答辩评分的参考材料，没有本手册不得参加答辩。本手册可以使用电子版打印，但签署姓名和日期处必须手工填写。本手册最后装入学生毕业设计（论文）档案袋。

二、毕业设计（论文）期间，要求学生每天出勤不少于6 小时，在校外进行毕业设计（论文）或实习（调研）者，应遵守有关单位的作息时间，学生如事假（病假）必须按规定的程序办理请假手续，凡未获准请假擅自停止工作者，按旷课论处。

三、学生在毕业设计（论文）中，要严格遵守纪律、服从领导、爱护仪器设备，遵守操作规程和各项规章制度；自觉保持工作场所的肃静和清洁，不做与毕业设计（论文）工作无关的事情。

四、学生要尊敬指导教师、虚心请教，并主动接受老师的随时检查。

五、学生要独立完成毕业设计（论文）任务，在毕业设计（论文）过程中要有严谨的科学态度和朴实的工作作风，严禁抄袭和弄虚作假。

六、毕业设计（论文）成绩评定标准按五级：优秀（90 分以上）、良好（80分以上）、中等（70分?79分）、及格（60分?69分）、不及格（59分以下）。

毕业设计（论文）任务书（指导教师填写）

设计（论文）题目：

基于TesseractOCR和Baidu语音的证件识别系统

设计（论文）主要内容（包括主要技术参数）：

证件的识别出现在日常生活中的各个场合，例如通过校园网的一卡通考勤系统，入住酒店时需要使用身份证实名认证，交警在处理交通事故的时候也需要对驾驶员的驾驶

证进行核对。常见的图像获取和识别通过扫描仪实现，但是不便于携带。随着智能手机的普及，使用手机的摄像头实现基于An droid或IOS系统证件识别系统是更加方便、高效的解决方案。

本毕业设计拟利用TesseractOCR技术和Baidu语音，采用JAVA语言，开发基于

An droid的证件识别系统。主要包括如下功能：

第一，实现基于An droid的APP，完成用户的UI交互和摄像头的图像采集。

第二，实现基于TesseractOCR的包含不同字体汉字数字的证件格式化OCR识别。

第三，利用Baidu语音云服务，实现对识别信息的阅读。

主要参考资料：

[1]池浩，一个基于TesseractOCR Engine的Wrapper的设计与实现[J]，科技传播，2011：

34~36.

[2]朱怀中，基于An droid的手机OCR识别技术设计与实现[J]，电子科技，2012: 9~12.

[3]I Marosi，In dustrial OCR approaches: architecture, algorithms and adaptati on tech niq ues [C]. Document Recognition and Retrieval, SPIE，2007：6500-6510.

[4]A Khan, S Mahmood, W MRST. A New Technique for Information Summarization.

Tran sacti ons on engin eeri ng, Computi ng and Tech no logy, 20051305T313.

⑸刘爽，一种名片识别系统的实现方法.现代计算机，2011，11：12~13.

[6]金鑫，中英文混排名片识别系统研究[硕士学位论文],南京航空航天大学，2011.

指导教师签名_____________________ 毕业设计（论文）开题报告、选题目的及背景

身份证、学生证作为个人信息行之有效的管理工具，已经运用到了生活的方方面面，证件信息的获取具有十分重要的作用。目前，身份证和学生证的信息搜集大多采用人工录入方式，或者利用设备读取其中的磁信号，这两种方式存在着不可忽略的问题。

（1）人工录入方式。耗时耗力，效率低下，且可能因为人工原因导致信息错误录入，造成不必要的麻烦和损失；

（2）利用设备读取证件磁信号。或因证件被消磁等原因无法广泛使用。

于是，急需开发出一种高识别度、易于操作和管理的证件识别系统，使终端设备能够自动识别证件信息并将其保存，便于人们使用。

基于TesseractOCR的证件识别系统可解决上述问题，其优点是从图像处理入手，利用机器抓取图像信息并进行自动识别。所谓的OCR技术，指

的是光学字符识别，即Optical Character Recognition的简称，是利用扫描把所有书籍、文稿及材料进行扫描，再对图片文稿做一下研究分析，取得字符和版面上信息的一个过程⑴⑵。其次，老年人与现在的互联网时代是脱节的，他们或许会因为眼神不好，无法看清重要证件上的关键信息，贝S证件自动识别并自动播报尤为重要，可为老年人提供便利。因此，基于OCR和Baidu语音技术进行证件识别，具有非常重要的实际意义。

二、国内外研究现状

1999年，汉王公司推出了第一个中文名片识别系统，历经9年的发展，

识别技术水平越来越高，功能越来越强大。目前，在国内市场上销售的中文名片识别系统有北京汉王科技有限公司的汉王名片通、台湾蒙恬公司的蒙恬名片王、清华紫光公司的紫光名片大事、新加坡维优公司的维优名片管家等。“汉王名片通”的研发起步最早，识别率最高，从1999年开始已

开发出十几个版本，占中国大陆中文名片识别市场份额的90%以上［2］。

现今，有很多关于名片识别方法的文献，文献［3］提出了一种多阶段识别方法，采用不同类型的神经网络识别中文名片；文献⑷构造了一个完整的中文名片识别系统，但只能处理纯横排或纯竖排的名片，且在已知待识别的字体前提下；文献[5]采用模板匹配的方法分析名片版面，故只能处理固定版面的名片。以上文件未考虑实际复杂情况，例如：名片文字横竖行混排；名片版面复杂；名片文字字体、字号频繁变化、字符连体、英汉混排、简繁混排等。因为证件识别系统的关键在于字符识别

上，所以在此重点介绍字符识别的研究现状。

字符识别研究，上世纪早期，由德国科学家Tausheck6】首先提出并申请了专利。据记载，印刷体汉字的识别最早可追溯到60年代⑺。1966年，

IBM公司的Casey和Nagy发表了第一篇关于印刷体汉字识别的论文，在该论文中他们利用简单的模板匹配法识别了1000个印刷体汉字。70年代以来，日本学者做了许多工作，其中有代表性的系统有1977年东芝综合研究所研制的可识别2,000个汉字的单体印刷汉字识别系统；80年代初期，日本武藏野电气研究所研制的可识别2300个多体汉字的印刷体汉字识别系统，代表了当时汉字识别的最高水平。此外，日本的二洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统。我国在OCR技术方面的研究起

步较晚，在70年代才开始对数字、英文字符和符号的识别进行研究，70年代末才开始最汉字识别的研究，到1986年，汉字识别进入一个实质性的阶段，取得了较大成果。不少研究单位相继推出中文OCR产品，在中文信

息处理领域具有代表性的清华大学、汉王公司等都推出了各自代表性的产品，其中包括汉王的尚书五号、六号，汉王表格自动录入系统，蒙恬OCR 文字扫描辨识系统，清华文通的TH-OCR97，TH-OCR2000、清华紫光的紫光

OCR[8][9]。这些软件在文字识别方面，就识别速度和识别率，基本达到了实用的效果，迄今，印刷体汉字识别技术和系统性能有了长足的进步，系统稳健性也得到了进一步提高。

三、可行性研究

就设计所需设计的功能进行可行性分析，首先，图片的采集，可以通过电脑摄像头或者手机拍摄完成。其次，图片的处理，先提取出照片中需要处理的信息，在对图片信息进行识别前对图片进行预处理，具体方法见“研究内容与方法”。然后，是图片信息的识别，识别率是个问题，但是可以通过训练识别字库进行改善，当然，做到100%