基于matlab的数字识别系统设计
基于MATLAB的身份证号码的识别算法

北
水
利
水
电
学
院
学
报
Vo No 2 L33 . Apr 2 2 , 01
J un lo r h n n t u e o a e n e v n y a d Hy r e e ti P w r o r a f t C i a I s tt f No h i W trCo s r a c n d o l cr o e c
见 表 1 .
表 1 阿拉 伯 数 字 的 欧 拉 数
相 差很 大 .
2 欧拉 数为 0时 , 体上 下 比大 于 1的是 数 字 ) 整
1 7, 于 1的是 4 和 1 不 多 的是 3 上 部 左 右 和 小 , 差 , 比中, 右多 的是数 字 7 对 称 的是 1 , .
第3 3卷 第 2期
邱 道 尹 , : 基 于 MA L B 的身 份 证 号 码 的识 别 算 法 等 TA
9 3
8的欧 拉 数 与其 他 9个 数 字 的欧 拉 数 不一 样 , 字 数 0 6 9的欧拉数 一样 , ,, 剩下 的 6个 数 字 欧拉 数 一样 , 所 以 欧 拉 数 为 一 个 特 征 . 0个 数 字 的 欧 拉 数 1
(笪 H 堡 堡 一 f 坌 堡 f !坌 坚}
图 1 总 体 方 案 流 程
化 的影 响 , 防止拍 摄 到 的 身份 证 图像 表 面有 很 亮 的 反光 , 造成 号 码体 被遮盖 等 , 图 3所示 . 如 构成 装置 的光 源采 用稳 定 的 内置环 形光 源近距 离照 射 , 管为 1 , 灯 OW 固定 于装 置最上 方 . 了避免 为 获得 的身 份证 图像 出现 很 亮 的 白斑 点 , 管 下方 一 灯
利用Matlab神经网络工具箱在VC++.net中进行手写体数字识别

Ab t a t A meh d i + . e a r s n e sr c : t o n VC + n tw s p e e td.wh c s c ri d o t t t b e gn al g te i h i a r u h Ma l n i e c l n e wi a i h f n t n r vd d b t b n u a ew r o l o .h a d r t n d gt lr c g i o s i l - u c i s p o i e y Mal e r l n t o k t ob xT e h n w t ii e o n t n wa mp e o a i e a i me td w t h d a tg s o h o ru n e a e p o r mmi g c p b l y i n e i t e a v n a e f t e p we l i tr c r g a h f f n a a i t n VC+ n ta d t e i +.e n h f n t n d ai g w t o l a e r b e t b t r g a i t r c iey i + .e n t b u ci e l i c mp i t d p o l msi Ma l p o m e a t l VC +n t d Mal . o n h c n a o r n v n a a Ke r s C+ . e ;n u a ewo k;Mal b e gn y wo d :V + n t e r ln t r t n i e;h n w t n d gt l e o n t n a a d r t ii c g i o i e a r i
通信原理课程设计 基于MATLAB的数字基带传输系统的研究和分析

2.2 数字基带信号
2.2.1 基本的基带信号波形 数字基带信号是数字信息的电波形表示,它可以用不同的电平或脉冲来表示相应的消 息代码。数字基带信号的类型有很多,以下是几种基本的基带信号波形。 (1) 单极性波形 这是一种最简单基带信号波形。它用正电平和零电平分别对应二进制代码“1”和“0” ;或者 说,它在一个码元时间内用脉冲的有或无来表示“1”和“0” 。该波形的特点是电脉冲之间无间隔, 极性单一,易于用 TTL,CMOS 电路产生;缺点是有直流分量,要求传输线路具有直流传输能力,因 而不适应有交流耦合的远距离传输,只适用于计算机内部或极近距离的传输。 (2) 双极性波形 它用正电平和负电平的脉冲分别表示二进制代码的“1”和“0” 。因其正负电平的幅度相等, 极性相反,故当“1”和“0”等概率出现时无支流分量,有利于在信道中传输,并且在接收端恢复
塔里木大学信息工程学院通信原理课程设计
2016 届课程设计
《基于 MATLAB 的数字基带传输系统的研究与分 析》 课程设计说明书
学生姓名 学 号 信息工程学院 通信工程 通信 16-1 蒋霎
所属学院 专 班 业 级
指导教师
塔里木大学教务处制
塔里木大学信息工程学院通信原理课程设计
摘
要
本论文主要研究了数字信号的基带传输的基本概念及数字信号基带传输的传输过 程和如何用MATLAB软件仿真设计数字基带传输系统。本文首先介绍了本课题的理论 依据,包括数字通信,数字基带传输系统的组成及数字基带信号的传输过程。接着介 绍了数字基带传输系统的特性包括数字PAM信号功率普密度及常用线路码型,并通过 比较最终选择双极性不归零码。然后介绍了MATLAB仿真软件。之后介绍了数字基带 信号的最佳接收的条件以及如何通过示波器观察基带信号的波形。最后按照仿真过程 基本步骤用MATLAB的仿真工具实现了数字基带传输系统的仿真过程,对系统进行了 分析。 关键字:数字基带传输系统 MATLAB 计算机仿真;
基于MATLAB的人脸识别系统的研究毕业论文

长沙民政职业技术学院毕业实践报告 题目:基于MATLAB 勺人脸识别系统的研扌旨导老师: ______ 谭刚林 ______________________ 系 另寸: 电子信息工程系 __________________ 班 级: ______________ 电子1133 ____________学号:1119013333 1119013334 1119013335 姓 名: 刘盼符思遥樊阳辉类型:2014年5月5日基于MATLAB勺人脸识别系统的研究符思遥、刘盼、樊阳辉指导老师:谭刚林苏宏艮马勇赞【摘要】人脸检测与识别技术是计算机视觉和模式识别等学科的研究热点之一,是进行身份认证最友好直接的手段,在出入境安全检查、内容检索、证件验证、门禁系统等领域都具有十分广泛的应用前景。
多年来,人脸识别技术中的很多问题都被深入地研究,而且大量的算法已经成功应用于人脸识别。
本文在研究了人脸检测和身份识别的关键技术和相关理论的基础上,重点讨论了在光照和背景不同的条件下,彩色静止图像的人脸检测和身份识别问题,它包括基于肤色分割的人脸粗检测、基于人眼检测的几何归一化和基于二维主成分分析法(2DPCA的身份识别。
本文主要工作如下:首先对彩色图像进行光照补偿,其次通过肤色检测获得可能的脸部区域并二值化,再用形态学开闭运算对图像进行滤波处理并通过一定规则确定人脸区域,然后运用水平垂直投影定位人眼坐标以此对人脸进行几何归一化,识别部分运用2DPCA勺图像映射方法对灰度图进行特征匹配,最后输出识别结果并进行语音播报。
实验结果表明,结合肤色和面部几何特征的算法能够对人脸进行较快速和准确的定位,同时2DPCAT法运用于身份识别也能达到较高的识别率。
本毕业设计对实际应用具有一定的参考价值,该系统的操作流程和输入输出方式是以实际应用为出发点,可应用于公安机关证件验证以及日常家庭的自动门禁系统等。
【关键词】人脸检测;肤色分割;人眼检测;2DPCA特征提取1绪论 (1)1.1选题的背景 (1)1.2人脸识别系统 (2)1.3人脸识别的典型方法 (2)2基于YCbCr颜色空间的肤色分割 (3)2.1三种色彩空间 (3)2.1.1 RGB色彩空间 (3)3基于2DPCA特征提取的身份识别 (4)3.1 2DPCA算法实验结果与分析 (5)3.1.1实验用数据库 (5)3.1.2实验结果与分析 (5)3.1.3 结论 (7)4人脸检测与识别系统设计与实现 (7)4.1系统环境 (7)4.2人脸检测与识别系统框图 (7)4.3系统功能模块 (8)4.4实验结果分析 (9)5总结与展望 (10)5.1总结 (10)5.2展望 (10)参考文献 (12)1绪论1.1选题的背景近年来随着计算机技术和互联网的发展,信息技术的安全变得越来越重要,生物特征识别技术得到广泛研究与开发,如人脸识别、指纹识别、掌形识别等。
基于MATLAB的数字图像课程设计-图像频域增强高通滤波器算法设计

基于MATLAB的数字图像课程设计-图像频域增强高通滤波器算法设计目录1 设计任务及目的 (2)1.1 设计任务 (2)1.2 设计目的 (2)2 课程设计相关知识 (3)2.1 数字图像处理简介 (3)2.1.1 数字图像发展概述 (3)2.1.2 数字图像处理内容 (3)2.1.3 数字图像处理技术 (4)2.2 MATLAB简介 (5)2.2.1 MATLAB基本功能 (5)2.2.2 MATLAB产品应用 (6)2.2.3 MATLAB特点 (6)2.2.4 MATLAB系列工具优势 (6)3 图像频域高通滤波原理 (7)3.1 频域滤波增强步骤及流程框图 (7)3.2 傅立叶变换原理 (8)3.3 高通滤波器原理 (9)3.3.1 理想高通滤波 (9)3.3.2 巴特沃斯高通滤波 (9)3.3.3 指数高通滤波 (10)3.3.4 梯形高通滤波 (10)3.3.5 高斯高通滤波 (10)4 MATLAB程序代码 (10)5 仿真结果与分析 (15)5.1 仿真结果 (15)5.2 结果分析 (19)结论 (20)参考文献 (21)图像频域增强算法设计——高通滤波1设计任务及目的1.1设计任务利用所学的数字图像处理技术,建立实现某一个主题处理的系统,利用MATLAB软件系统来实现图像的频域滤波技术,要求:(1)学习和熟悉MATLAB软件的使用方法;(2)熟悉和掌握MATLAB 程序设计过程;(3)利用所学数字图像处理技术知识和MATLAB软件对图像进行高通滤波处理;(4)能对图.jpg、.bmp、.png格式进行打开、保存、另存、退出等一系列功能操作;(5)在程序开发时,必须清楚主要实现函数目的和作用,需要在程序书写时做适当注释说明,理解每一句函数的具体意义和使用范围;(6)比较几种高通滤波器对图像数字化处理效果的异同。
1.2 设计目的本次课程设计的目的在于提高发现问题、分析问题、解决问题的能力,进一步巩固数字图像处理系统中的基本原理与方法。
(完整版)MATLAB车牌识别

目录1.引言 (2)2.设计概述 (3)2.1车牌识别技术 (3)2.2 车牌识别技术的发展 (3)2.3 车牌识别技术的国内外研究现状 (4)2.4 主要应用领域 (6)3.设计方案 (7)4.车牌识别系统的matlab实现 (8)4.1 图像的读取 (8)4.2 图像预处理 (9)4.2.1灰度变换 (9)4.2.2 图像校正 (10)4.3 牌照分割 (10)4.3.1 图像边缘提取及二值化 (11)4.3.2 BP神经网络 (14)4.4 车牌提取 (15)5.设计结果及分析 (16)5.1程序运行结果 (16)5.2程序结果分析 (17)总结体会 (18)参考文献 (19)附录1 (20)附录2 (28)1.引言伴随着世界各国车辆数量的增加,城市交通状况日益受到人们的重视。
如何有效地进行交通管理,越来越成为各国政府的相关部门所关注的焦点。
针对这一问题,人们运行先进的信息处理技术、导航定位技术、无线通信技术、自动控制技术、图像处理和识别技术及计算机网络技术等科学技术,相继研发了各种交通道路监视管理系统、车辆控制系统及公共交通系统。
这些系统将车辆和道路综合起来进行考虑,运行各种先进的技术解决道路交通的问题,统称为智能交通系统( Intelligent Transportation System,简称ITS)。
ITS 是20世纪90年代兴起的新一代交通运输系统。
它可以加强道路、车辆、驾驶员和管理人员的联系,实现道路交通管理自动化和车辆行驶的智能化,增强交通安全,减少交通堵塞,提高运输效率,减少环境污染,节约能源,提高经济活力。
智能交通系统以车辆的自动检测作为信息的来源,因而对车牌照等相关信息的自动采集和处理的一门新的交通信息获取技术——车牌识别(License Plate Recognition ,LPR) 技术逐渐发展起来,成为信息处理技术的一项重要研究课题。
车牌自动识别是智能交通管理系统中的关键技术之一。
基于MATLAB的信号与系统实验教程

基于MATLAB的信号与系统实验教程第一部分 MATLAB基础第1章 MATLAB环境1.1 MATLAB界面图1.1 MATLAB主界面图1.2 Workspace图1.3 MATLAB.m文件编辑窗口界面1.2 文件类型图1.4 设置路径图1.5 例1-1运行结果1.3 系统和程序控制指令1.4 练习第2章 数据类型与数学运算2.1 数值、变量和表达式2.1.1 数值的记述2.1.2 变量命名规则2.1.3 运算符和表达式2.2 数组、矩阵及其运算2.2.1 复数和复数矩阵2.2.2 数组和矩阵的运算2.2.3 特殊矩阵(Specialized matrices)2.3 关系和逻辑运算2.4 练习第3章 数值计算与符号计算3.1 线性代数与矩阵分析3.1.1 线性代数3.1.2 特征值分解3.1.3 奇异值分解3.1.4 矩阵函数3.2 线性方程组求解3.2.1 确定性线性方程组求解3.2.2 线性最小二乘问题的方程求解3.3 数据分析函数图3.1 例3-4运行结果3.4 符号计算图3.2 数值型与符号型数据转换关系3.5 练习第4章 绘图4.1 基本绘图指令4.1.1 plot的基本调用格式图4.1 例4-1运行结果4.1.2 stem: 离散数据绘制(火柴杆图)图4.2 例4-2运行结果4.1.3 polar: 极坐标图图4.3 例4-3运行结果4.2 各种图形标记、控制指令图4.4 例4-4运行结果4.2.1 图的创建与控制4.2.2 轴的产生与控制4.2.3 分格线(grid)、坐标框(box)、图保持(hold)4.2.4 图形标志4.3 其他常用绘图指令4.3.1 其他类型图的绘制图4.5 例4-5运行结果图4.6 例4-6运行结果简易绘图指令图4.7 例4-7运行结果4.4 练习第5章 SIMULINK5.1 SIMULINK的基本使用方法图5.1 Simulink Library Browser窗口图5.2 Pulse Generator模块的参数设置5.2 SIMULINK模型概念及基本模块介绍图5.4 SIMULINK模型的一般结构5.2.1 常用的sources——信号源模块5.2.2 常用的sinks——信号显示与输出模块图5.5 示波器纵坐标设置对话框图5.6 示波器属性对话框5.2.3 math operations——数学运算单元模块5.2.4 continuous——连续系统模块5.2.5 discrete——离散系统模块5.3 SIMULINK模型的仿真5.3.1 仿真参数设置图5.7 仿真设置对话框5.3.2 建立子系统图5.8 例5-2的SIMULINK模型图5.9 例5-2的子系统模型图5.10 例5-2仿真输出波形5.4 练习第6章 M函数和工具箱6.1 M函数6.2 工具箱图6.1 演示程序中的工具箱(Toolbox)使用帮助6.3 练习第7章 MATLAB实用技术遴选7.1 图形用户界面设计7.1.1 设计原则与设计步骤7.1.2 界面与控件介绍图7.1 标准菜单样式7.1.3 GUI实例分析。
基于matlab的听音识曲系统的设计与实现

基于matlab的听音识曲系统的设计与实现随着人工智能技术的发展,听音识曲技术成为了一个重要的研究课题,它是利用计算机识别歌曲,并自动辨别出歌曲的名字和作者的技术。
在这里,我们将介绍一种基于Matlab的听音识曲系统的设计与实现方法。
第一步是语音分析,也叫音频特征提取。
这一步需要我们对输入的音频进行语音信号分析,来提取出语音的频率特性和能量特性。
我们可以使用Matlab的一些函数来实现这一步,比如短时傅立叶变换、滑动均值滤波及基于频率特性的谱聚类函数等。
这些函数可以实现音频的带宽限定和变换,同时提取出音频的语音特征,如能量特性、基频、频率谱、音频频谱等特征。
第二步是特征比较,也叫特征识别。
这一步需要我们与设定的歌曲数据库中的特征进行比较,以确定输入音频的歌曲名称和识别分数。
为了提高识别率,我们可以采用Matlab的矩阵计算技术,来自动计算特征之间的差异度,从而实现准确的歌曲识别。
第三步是输出结果。
当特征比较完成后,就可以给出歌曲名称和识别出的表示。
为了更好的展示,我们可以利用Matlab中的数据可视化技术,来展示识别出来的歌曲及其相应的特征、识别分数等信息,以便更好的识别结果。
以上就是基于Matlab的听音识曲系统的设计方法和实现方法,该系统可以有效的实现歌曲的名称识别和准确的歌曲特征比较,具有较高的精度及可靠性。
此外,该设计还具有较好的实现维护性、可扩展性及可行性,可以有效改进歌曲识别效率,有利于实现数字音频的自动化处理。
总之,Matlab是一款强大的计算机软件工具,可以完美的支持基于Matlab的听音识曲系统的设计与实现,帮助用户在音频识曲任务中取得更多的成功。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精品文档 随意编辑 数字识别系统
1.绪论 1.1研究背景 1.1.1索书号的简介 索书号是图书馆赋予每一种馆藏图书的号码,这种号码具有一定结构并带有特定的意义。在馆藏系中,每种书的索书号是唯一的,可准确地确定馆藏图书在书架上的排列位置,它是读者查找图书必要的代码信息。 索书号通常是根据中国图书资料分类法编排的【1】——简称《中图法》。《中图法》采拉丁字母 和阿拉伯数字相结合的混合标记符号。根据图书的学科主题,以拉丁字母标记并顺序展列出22个基本大类,其中没有L、M和Y开头的——参考附录1中图法简表。由于“T工业技术”的大类范围广泛、内容繁多,故又在该类基础上采用双位拉丁字母标记出16个二级类目,如TK、TL、TM和TN等。字母之后再用阿拉伯数字对大类进行细分。如B表示哲学、宗教一大类;B020则表示宗教理论。有的图书馆如清华大学还在图书分类号码后添加按照图书作者姓名所编排的著者号码,或者是按照图书进馆时间的先后所取用的顺序号码。 不同索书号确定排列先后顺序的步骤是,先比较分类号码:如分类号码相同再比较著者号码 或顺序号码。最后按照字母表和数字大小的顺序排列。 1.1.2书库中图书查找存在的问题 精品文档 随意编辑 随着电子计算机和网络技术的发展,现代图书馆都已经广泛建立电子数据库图书管理系统, 方便用户查找、阅览书籍。读者借图书的流程如图2所示,一般利用书目查询系统,根据图书的 书名,出版社,作者以及书的内容等在电子数据库中检索自己需要的图书,记录图书相关信息。 最后,根据图书的索书号,快速方便地在书库中找到相应的图书。但是,经常会遇到下列问题:电子数据库系统显示图书状态为“归还”,利用检索到号,却无法在书库找到此书。出现这种情况主要有两个原因:(1)图书错位放置,即图书在书库中摆放的位置与索书号不一致。(2)图书已经丢失,即虽然电子数据库中显示图书状态为“归还”,但实质图书已经丢失,并不在书库中。随着图书馆藏书数目的不断增加,每天借阅的人数增多,而且有的图书馆发展成拥有几个分馆,上述问题越来越严重。这一方面严重降低了图书馆的资源的利用率;另一方面,浪费了读者的时间,造成了很大麻烦。 目前,图书馆主要通过定期的人工检查发现书库中错位和丢失的图书。但是,由丁馆藏图书 多达上万,甚至几十万,而且每天又都有大量图书的借出和还入,人工检查工作量很大,单调、 重复的工作容易使工作员疲劳,检查速度比较慢,无法满足实际的需要。因此,迫切希望开发索书号自动识别系统,实现对书库中图书放置位置的自动检查,并通过索书号识别结果与电子数据库中图书信息的比较,找出已经丢失的图书。确保电子数据库中的图书状态与书库中的一致,以及书库中的图书准确排放,从而有效解决上述“用索书号找不到图书”的问题。
1.2.索书号自动识别系统 近年来,随着电子计算机技术、图像处理技术和摄像技术的迅速发展,图像中的文字信息提 取系统已经成功地应用于各个领域。因此,借助其经验,本文研究采用图像处理和识别技术 实现索书号的自动识别。 1.2.1索书号自动识别系统概述 系统的硬件由彩色CCD摄像头,8位图像采集卡和计算机组成,拍摄的图像为8位RGB彩色精品文档 随意编辑 数字图像。如图1-1所示
CCD摄像机拍摄排放在书架上的图书图像,图书的图像出索书号外还有其他内容,如出版社的标志,其他文字甚至大块的污渍等,必须从中分割出仅包含索书号的文字图像。灰度的文字图像难以直接用于识别,所以讲灰度的文字图像装换为二值图像。由于噪声和五点的干扰,以及光照不均匀的影响,二值化后的文字会发生粘连,严重改变文字的自营。字符切分成单个字符后才进行文字识别。按照上述流程,具体介绍索书号识别的整个过程。 1.2.2 索书号识别存在的问题及关键技术 索书号识别所涉及的摄像技术,无线通讯技术,电子数据库图书管理技术,AGV自动导引技术和图像处理技术都已经在其他领域有成功应用的实例。图像处理技术是索书号识别的核心技术,而与相类似的应用相比,索书号图像处理与识别又有其自身显著的特点和难点。 图书馆收集了近几十年的藏书,不同时代的索书号编写风格大不相同。本论文选取图书馆的 主要类别图书——印刷体索书号,从图书馆的书架上随即抽取样本进行研究。如图7所示,CCD 摄像头拍摄的索书号图像,由于光照不均匀、退色、污迹、噪声以及其他非索书号文字的存在,大大增加了索书号识别的困难。为了能够解决上述问题,索书号图像识别主要由以下4个模块组
CCD摄像 索书号文字图像分割 文字图像二值化 单个字符切分 索书号识别 图书排放位置判断 精品文档
随意编辑 成:索书号定位,索书号提取,索书号字符切分和索书号单字识别。 第一阶段:索书号定位是在图像中找到包含索书号的图像区域,要求该区域尽可能包含完整 的索书号,同时尽量排除非索书号的图像区域。由于该阶段是解决索书号的区域查找问题,而没 有涉及单字切分,因此图像区域的估计允许有一定误差。为了包含完整的索书号以及避免索书号 漏检,往往是定位得到的图像区域略大于索书号的真实区域。索书号定位主要存在两个问题:(1)受不均匀光照和褪色的影响,索书号的纹理特征、颜色特征以及形状特征等有较大的变化,可靠性相对较差;(2)有的索书号由1个字符串组成,有的索陆号由2个字符串组成,而在索书号的周围附近还会存在其他文字,如出版社名称和作者姓名。因此,将索书号与其他文字相区别比较困难。 第二阶段:索书号提取是在定位得到的索书号区域中,将索书号字符与周围目标和背景相 互分离。通过二值化处理,能将字符与背最相互分离。但由于定位得到的图像区域略大于真实索 书号区域,二值化后在索书号字符附近可能会存在一些非字符目标,影响后续的单字切分和识别。 所以,二值化后采用连通域滤波进一步消除索书号周围的非字符目标。索书号提取主要存在的问题:(1)不均匀光照增大了索书号图像的灰度值变化范围。(2)褪色程度的不同则降低了字符与背景的对比度。(3)污迹的影响。上述因素的存在不仅使得确定二值化过程中合理的阈值非常困难,而且会改变索书号字符的形状特征,最终影响连通域滤波的性能。 第三阶段:索书号字符切分是将索书号字符串切分成一个个字符,以提供给识别算法进行识 别。单字切分的结果如何将直接影响识别结果,而且切分好坏除字符能否正确识别之外,没有较 好的判别依据。因此,单字切分往往与字符识别紧密结合在一起。 索书号的单字切分可以分为两种情况:非粘连单字切分和粘连字符的单字切分。非粘连单字 切分比价容易解决。但质量较差索书号图像二值化处理后,相邻字符可能会发生粘连。而粘连索 书号切分存在的主要问题是(1)粘连字符的切分比较困难:(2)索书号字符发生粘连有一部分是字符 的笔画发生变形所致,如笔划宽度变粗等。即使正确的切分也不一定能够完全修正笔画的变形, 精品文档 随意编辑 即无法通过粘连切分恢复字符的原形。 第四阶段:索书号单字识别。印刷体单字识别的研究已经相当成熟,只是与其他应用领域的 文字识别相比,索书号文字的质量较差,存在字符不均匀褪色,笔划残缺以及大面积污迹等问题, 精品文档
随意编辑 2索书号文字图像分割 复杂背景图像中的文字定位和分割是从图像中获取文字信息的关键步骤,直接影响到后续文字识别的准确性,它在机器人视觉.汽车牌照自动识别,计算机文本自动输入,邮件地址自动识别,集装箱编号自动识别以及视频图像内容的检索等系统中都有广泛的应用。CCD拍摄的图书索书号图像如图2-1所示.图像中除了索书号还包含尤其他文字,红色条形框还包含有其他文字,红色条形框以及装饰景物等,为了能够正确识别该书的索书号,首先必须从图像中正确分割出索书号图像。
图2-1 图书索书号图像 但是,从图像尤其场景图像中自动定位和分割文字是比较困难的,其主要原因有以下几个方面:第一,文字嵌入在图像中,并与其它图形共存,如边框,商标,装饰物以及污点等;第二,由于文字颜色退化,文字颜色不均匀,热切背景颜色有食欲吻脖子颜色差异很小;第三,文字尺寸大小变化;第四,关照条件无法控制,广州不均匀;第五,索书号文字与其他文字。 本课题利用基于边缘点数量统计的文字图像分割方法。根据图书馆索书号的制定规则,索书号文字图像具有如下特征:第一,索书号文字采用黑色应刷;第二,索书号文字的数量至少为3个;精品文档 随意编辑 第三,索书号字符水平排列;第四,索书号贴在书脊的下半部分。它的算法流程如图2-2所示,实验结果证明,该方法具有定位精度高,准确率高,抗噪能力强,并在“索书号自动识别系统”中取得理想效果。
图2-2 索书号图像分割算法流程 2.1 HSI彩色空间转换 摄像头拍摄的彩色图片的像素点通常是采用24位RGB表示。但R,G和B3分量之间有很高
Canny算子检测 索书号边缘点彩色分割 文字图像行区域检测
HSI彩色空间转换
文字图像列区域检测 边界调整 精品文档
随意编辑 的相关性,直接利用这些分量常常不嫩得到所需的分割效果。比较接近人堆颜色视觉感知的是色度,饱和度和亮度空间。其中I表示颜色的敏感程度,H表示不同的颜色,S表示颜色的深浅,I分量与彩色信息无关,H和S与人感受彩色的方式紧密相连。 本算法中,只对边缘点进行财社分割,切自用S分量。英雌,问了减少算法的耗时,首先子转换I分量,如图2-3所示,待边缘检测出来后,再堆边缘点进行S分量计算。转换关系如下: I=(R+G+B)/3 (2-1) S=1-3/(R+G+B)*[min(R,G,B)] (2-2)
图2-2 HSI彩色空间的I分量图 2.2 Canny算子检测
Canny算子边缘检测先计算X和Y方向的梯度平方和,局部最大的梯度幅值局部变化最大的点的过程叫非极大值抑制。 Canny算子边缘检测有如下3个指标:第一,对每个边缘点有唯一的响应,得到的边缘为单像素狂;第二,错误率最低,即要少将真正的边缘点丢失也要少将非边缘点判为边缘点;第三,高位置精度,检测的边缘应在正真的边界上。为此,Canny像影帝定义了3给准函数衣表达上述指标的约束:a,信噪比函数准则;b,定位精度准这函数;c,单边缘响应准这函数。这三个准则相结合可以检测的最佳的边缘。 Canny算子中有3个参数,σ是高斯函数闻不得参数,他控制平滑程度:高阈值(TG)和低阈值(TL)。实验中σ设置为1,TL=0.4*TG。这样在Canny算子中只保留了一个参数高阈值(TG)。实际应用中,TG取值只需要满足两个条件:第一,确保尽可能地检测出索书号文字的边缘点,这粗限定了TG取值的最高上限;第二,确保加边缘尽可能少,这限定了TG取值的下限。由于文字和背