基于连通域的图像文本自动定位

基于连通域的图像文本自动定位
基于连通域的图像文本自动定位

图像定位及跟踪技术大解析

图像定位及跟踪技术大解析 在科学技术日新月异的今天,人们对机器设备的智能性、自主性要求也越来越高,希望其完全替代人的角色,把人们从繁重、危险的工作任务中解脱出来,而能否像人一样具有感知周围环境的能力已成为设备实现智能化自主化的关键。 广义的“图像跟踪”技术,是指通过某种方式(如图像识别、红外、超声波等)将摄像头中拍摄到的物体进行定位,并指挥摄像头对该物体进行跟踪,让该物体一直被保持在摄像头视野范围内。狭义的“图像跟踪”技术就是我们日常所常谈到的,通过“图像识别”的方式来进行跟踪和拍摄。 因为红外、超声波等方式,都受环境的影响,而且要专门的识别辅助设备,在实际应用中已经逐步被“图像识别”技术所替代。“图像识别”是直接利用了摄像头拍摄到的图像,进行NCAST图像差分及聚类运算,识别到目标物体的位置,并指挥摄像头对该物体进行跟踪。 图像跟踪系统采用特有的NCAST目标外形特征检测方法,被跟踪者无需任何辅助设备,只要进入跟踪区域,系统便可对目标进行锁定跟踪,使摄像机画面以锁定的目标为中心,并控制摄像机进行相应策略的缩放。系统支持多种自定义策略,支持多级特写模式,适应性强,不受强光、声音、电磁等环境影响。 目标物体的边缘检测 物体的形状特征在大多数情况下变化不多,基于目标形状轮廓的跟踪方法与基于区域的匹配方法相比,可以更精确的分割目标。 边缘是运动目标的最基本特征,表现在图像中就是指目标周围图像灰度有阶跃变化或屋顶变化的那些像素集合,它是图像中局部亮度变化最显著的部分。 边缘检测就是采用某种算法来定位灰度不连续变化的位置,从而图像中目标与背景的交界线。图像的灰度变化可以用灰度梯度来表示。

车牌图像定位与识别

专业综合实验报告----数字图像处理 专业:电子信息工程 班级: :

学号: 指导教师: 2014年7月18日 车牌图像定位与识别 一、设计目的 利用matlab实现车牌识别系统,熟悉matlab应用软件的基础知识,利用其解决数字信号处理的实际应用问题,从而加深对理论知识的掌握,巩固理论课上知识的同时,加强实践能力的提高,理论联系实践,提高自身的动手能力。同时不断的调试程序也提高了自己独立编程水平,并在实践中不断完善理论基础,有助于自身综合能力的提高。 二、设计容和要求 车牌识别系统应包含图像获取、图像处理、图像分割、字符识别、数据库管理等几个部分,能够完成复杂背景下汽车牌照的定位分割以及牌照字符的自动识别。这里,只要求对给定的彩色车牌图像变换成灰度图像,用阈值化技术进行字符与背景的分离,再提取牌照图像。 三、设计步骤 1.打开计算机,启动MATLAB程序; 2.调入给定的车牌图像,并按要求进行图像处理; 3.记录和整理设计报告 四、设计所需设备及软件

计算机一台;移动式存储器;MATLAB 软件。 五、设计过程 车辆牌照识别整个系统主要是由车牌定位和字符分割识别两部分组成,其中车牌定位又可以分为图像预处理及边缘提取模块和牌照的定位及分割模块;字符识别可以分为字符分割和单个字符识别两个模块。 (一)对图像进行图像转换、图像增强和边缘检测等 1.载入车牌图像: 2.将彩图转换为灰度图并绘制直方图: 灰度图 灰度直方图 3.用roberts 算子进行边缘检测: 图像中车辆牌照是具有比较显著特征的一块图象区域,这此特征表现在:近似水平的矩形区域;其中字符串都是按水平方向排列的;在整体图象中的位置较

二值图像连通域标记算法与代码

二值图像连通域标记算法与代码 这里列举二值图像连通域标记算法包括直接扫描标记算法和二值图像连通域标记快速算法 一、直接扫描标记算法把连续区域作同一个标记,常见的四邻域标记算法和八邻域标记算法。 1、四邻域标记算法: 1)判断此点四邻域中的最左,最上有没有点,如果都没有点,则表示一个新的区域的开始。 2)如果此点四邻域中的最左有点,最上没有点,则标记此点为最左点的值;如果此点四邻域中的最左没有点,最上有点,则标记此点为最上点的值。 3)如果此点四邻域中的最左有点,最上都有点,则标记此点为这两个中的最小的标记点,并修改大标记为小标记。 2、八邻域标记算法: 1)判断此点八邻域中的最左,左上,最上,上右点的情况。如果都没有点,则表示一个新的区域的开始。 2)如果此点八邻域中的最左有点,上右都有点,则标记此点为这两个中的最小的标记点,并修改大标记为小标记。 3)如果此点八邻域中的左上有点,上右都有点,则标记此点为这两个中的最小的标记点,并修改大标记为小标记。 4)否则按照最左,左上,最上,上右的顺序,标记此点为四个中的一个。代码实现: #include #include #include //连通区域属性结构 typedef struct tagMarkRegion { std::list MarkPointList;//点列表 RECT rect; }MarkRegion; //定义MarkMap 结构,用来存放等价对 typedef struct tagEqualMark { int MarkValue1; //标记值 int MarkValue2; //标记值 } EqualMark; //定义MarkMapping 结构,用来存放标记映射关系 typedef struct tagMarkMapping

基于深度学习的图像目标定位识别研究

基于深度学习的图像目标定位识别研究 科学技术的发展是推动人类社会进步的主要原因之一,未来社会进一步地朝着科技化、信息化、智能化的方向前进。在信息大爆炸的今天,充分利用这些信息将有助于社会的现代化建设,这其中图像信息是目前人们生活中最常见的信息。 利用这些图像信息的一种重要方法就是图像目标定位识别技术。不管是视频监控领域还是虚拟现实技术等都对图像的识别有着极大的需求。 一般的图像目标定位识别系统包括图像分割、目标关键特征提取、目标类别分类三个步骤。在研究课题相关背景和意义之后,本文对上述三个步骤涉及到的技术进行了调研。 深度学习理论由Hinton教授提出之后得到学术界的普遍关注。越来越多的学者尝试用深度学习理论去解决图像识别技术中碰到的问题。 深度学习理论包含诸多的模型,不同的模型各自的应用领域也不相同。这其中卷积神经网络(CNN)模型是最常用于图像处理的模型。 相比较传统的人工神经网络模型,卷积神经网络拥有更多的隐藏层,其特有 的卷积和池化操作对图像地处理有着较高的效率。本文在分析了CNN模型对图像特征的表达特性之后,搭建了一个CNN网络模型,该模型在传统的VGG模型的基础上加以改进,统一了图像分割、目标特征提取和目标分类三个过程,改进后的模型称为N-VGG。 本文的创新点之一是研究学习了基于估计目标网络(RPN)的图像分割技术, 提出了改进策略以提升RPN网络的性能,改进后的图像分割模块称之为IRPN。最终将IRPN网络应用到本课题构建的N-VGG模型中。 同时分析了传统的卷积神经网络模型中应用的激活函数,最终在N-VGG网络

模型中引入了新的激活函数:指数线性单元(ELU)。另外在N-VGG网络模型中引入了空间金字塔池化技术(SPP),以提升模型的识别精度。 最后利用第三方开源工具Caffe构建了N-VGG模型,并构建了一个简易的图像目标定位识别系统。最终通过该系统测试本文构建模型的识别效率。 在测试阶段,还单独训练了一个SVM分类器,以对比SVM分类器和softmax 分类器性能。最后本文对在这个课题学习设计的过程中遇到的问题和学习到的经验、方法做了总结,同时对未来在图像目标定位识别领域可以做的改进工作进行了展望。

基于VisionPro的数字图像识别与定位

基于VisionPro的数字图像识别与定位 【摘要】本文利用VisionPro视觉软件进行数字图像识别与定位研究。首先利用该软件实现了图像采集和摄像机标定,然后基于VisionPro运用VB编写人机交互界面,利用采集得到的图像进行了目标识别定位。同时利用视觉处理中常用的工具Opencv对采集的图像进行了相同的目标识别定位。对两种方法得到的识别效果和定位数据进行了对比,结果表明,基于VisionPro的视觉系统得到的识别效果更好,定位数据更准确。 【关键词】机器视觉;VisionPro;识别定位;https://www.360docs.net/doc/9e11955582.html, 1.引言 自20世纪80年代以来,机器视觉技术开始高速发展,已经从实验室走向了人们生产生活的各个方面。机器视觉系统的特点是提高生产的柔性和自动化程度。在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。而且机器视觉易于实现信息集成,是实现计算机集成制造的基础技术。现今,在机器视觉领域已经有了一些成熟的视觉开发软件,其封装了很多可靠、高效的算法和工具。本文选用美国康耐视公司的VisionPro软件,这是一套基于PC架构的视觉系统软件开发包,主要应用于各种复杂的机器视觉领域。它集成了用于定位、检测、识别和通讯等任务的工具库,可用C#、VB和VC等语言进行二次开发。本文基于VisionPro利用https://www.360docs.net/doc/9e11955582.html,语言进行视觉定位系统的软件开发[1]。 2.视觉定位系统 2.1 硬件组成 在图像处理前首先要得到清晰、有效的图像,这就需要有一套完整的硬件设备。一般主要包括照明用的光源、调节图像清晰度的镜头、将图像转换为数字信号的摄像机和进行图像处理的计算机。其中摄像机与计算机之间的接口也比很重要的,主要分为IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆网三种[2]。 本视觉系统采用的是日本FUJINON工业摄像头,德国BASLER工业像机ACA1600-20GM,GigE千兆网接口。 2.2 基于VisionPro的软件开发 本视觉定位系统利用https://www.360docs.net/doc/9e11955582.html,编写适合实验需要的界面,界面中只包含需要的操作功能和数据,使整个界面看起来更加清楚简单,操作起来更方便。 (1)图像采集

(整理)MATLAB 标注连通域.

matlab 标注连通域 clear; clc; f=imread('c:\1.jpg'); gray_level=graythresh(f); f=im2bw(f,gray_level); [l,n]=bwlabel(f,8) imshow(f) hold on for k=1:n [r,c]=find(l==k); rbar=mean(r); cbar=mean(c); plot(cbar,rbar,'Marker','o','MarkerEdgeColor','k','MarkerFaceColor','k','MarkerSize',10); plot(cbar,rbar,'Marker','*','MarkerEdgecolor','w'); end 主要概念: 1. 2.4连接 8连接 0 1 0 1 p 1 ===> 4连接,p为当前像素点。 0 1 0 1 1 1 1 p 1 ====》8连接,p为当前像素点。 1 1 1 3.bwlabel()函数 语法: [ L, num]=bwlabel(f,conn) 其中f是一副二值图像,conn用来指定期望的连接(不是4就是8),默认为8,输出L称为标记矩阵,参数num给出所找到连接分量的总数。 4.find()函数 该函数非常有用,会返回指定条件的索引值,在标记矩阵中的作用是返回对应对象的索引。 I = FIND(X) returns the linear indices corresponding to the nonzero entries of the array X. X may be a logical expression. Use IND2SUB(SIZE(X),I) to calculate multiple subscripts from the linear indices I. find(bwlabel(bw)==2)表示的意思是连通域2中的数值所在向量的位置。

遥感图像处理及其在军事目标定位中的应用

多媒体技术及其应用 本栏目责任编辑:李桂瑾 1前言 随着科技的不断进步,遥感工具的使用越来越频繁,人们能够从高空以及太空中来观察人类居住的地球,也能够利用获得的遥感图像进行一系列研究和探索。现已应用于农林业、测绘、地质勘探、水利、气象、环境保护以及军事等部门,并取得了很好的效益。 军事目标是一项特殊的研究内容,如何充分利用遥感图像资料来分析和定位军事目标是需要解决的主要问题。遥感图像资料主要来自遥感卫星以及侦察飞机拍摄的影像资料,本文主要研究利用无人侦察飞机拍摄的影像资料对军事目标进行定位的问题。 2遥感图像处理技术概论 遥感图像处理是遥感技术的一个重要环节,它直接影响到遥感信息的增强提取和分析应用效果。 遥感图像处理技术一般可以分为两大类。一是光学处理技术,它可以分为机械光学和光化学处理两种方法,机械光学又称电子光学或物理光学,主要是利用相干光光源作图像处理,譬如密度分割、位相交换、等照度变换等内容;光化学处理是依据摄影光化学原理,利用非相干光光源,即普通暗房摄影处理方法进行图像处理,它可以进行图像镶嵌、图像增强(包括反差调整、彩色 增强、比值处理、边缘增强、黑白发色等)、 图像密度分割、假彩色合成以及信息复合处理等;二是计算机数字图像处理技术,它可以精确地进行几何定位与几何校正,还可以多功能地进行图像镶 嵌、图像增强(包括线性变换、 直方图均衡、彩色增强、比值处理等等)、 图像分类、图像统计分析、多波段图像组合以及信息复合处理等。这些处理结果在地表环境要素不太复杂的情况下,完全可以定量化精确分析,应用效果比较好。这里,我们主要就数字图像处理中的几何校正等方面进行研究与分析。 除此之外,遥感图像处理技术开始进行信息复合的研究应用工作。这种处理技术主要是综合使用现有的遥感资料,挖掘遥感资料所提供的全部信息。其作用是能够进行地物信息的验证、补充与更新,提高了遥感信息的实用价值。因此可以说,信息复合处理技术实际上是建立遥感资料信息库的有效方法之一。 3目标定位方法 传统的对计划外目标定位主要依靠人工现地判定,不仅精度得不到保证,而且作业时间一般来说较长。随着科技的不断发展,越来越多的遥感卫星运用到军事中,使目标定位有了更进一步的发展。但现阶段这些高技术定位装备只能保障战略、战役目标的 定位,对一般战斗中出现的目标还不能达到及时精确的保障。因 此,利用低空无人侦察机的遥感图像信息来对作战中出现的目标进行定位,是很有研究价值的。 3.1图像信息的获取 图像信息获取过程工作原理为接收天线收到“无人机”发出的侦察图像信号后,经高频电路送下变频电路进行信息处理,输出中频信号,经调制跟踪环解调,经7M低通滤波器提纯出视频信号,经视频放大和去加重电路后送往视频分配器分为两路标准视频信号,计算机便可将得到的图像实时记录并显示。 信息接收系统设计主要采用了图像同步跟踪和存储技术。信息接收系统接收到“无人机”发射的视频图像后,利用图像采集软件通过视频信息采集卡截取“无人机”获取的战场视频图像,整个过程将采用多线程操作方式处理视频图像的采集与存储的接收事件。线程之间同步协调则以二进制形式融合将图像文件进行同步存储,以便于利用其对图像信息进行进一步的处理。 3.2“ 三点”匹配定位方法应当指出,遥感图像处理技术一般要以常规资料与人为经验结合起来,即指处理人员最好要具备丰富的专业知识,这样才能得到理想的处理结果;同时也要采用多种处理方法的综合研究,才能满足各种专题信息的研究。因此在实际工作中,对一幅遥感图像应当使用哪种方法和哪些技术手段,必须根据应用目的以及现有技术条件的可能来选择,讲究实效,使遥感图像处理技术真正为遥感应用服务。 由于图像信息是通过“无人机”的航拍而获取的,而在“无人 机”拍摄过程中,又可能会受到天气、 战场环境、拍摄区域地形状况、“ 无人机”飞行姿态等一系列因素的影响,通常会导致获取的遥感图像是发生了畸变的倾斜图像。因此,在遥感图像信息处理过程中,关键要实现对倾斜图像的匹配校正。 3.2.1匹配校正方法 在匹配校正过程(也即倾斜图像几何校正的过程)中,由于目标附近GCP信息因受战场环境的影响,获得其信息非常困难,所以匹配过程应该使用尽量少的GCP。我们通过已知目标附近的三个GCP的坐标,将倾斜图像进行几何校正。由于只使用了三个GCP,每个控制点的选取对校正结果的影响都很大,因此控制点一 般选取地面上容易确定的标志物,如交叉路口、 河流的尽头等。此外,控制点的选取应尽可能地分散,若三个GCP在共线,是不能够建立仿射坐标系的。 收稿日期:2007-08-16 作者简介:王楠(1981-),男,重庆人,解放军炮兵学院硕士研究生,研究方向:炮兵武器装备发展论证及效能分析;邓灵博(1983-),男,内蒙古自治区包头人,解放军炮兵学院硕士研究生,研究方向:炮兵武器装备发展论证及效能分析;何洪峰(1981-),男,安徽桐城人,解放军炮兵学院硕士研究生,研究方向:炮兵武器装备发展论证及效能分析。 遥感图像处理及其在军事目标定位中的应用 王楠,邓灵博,何洪峰 (中国人民解放军炮兵学院,安徽合肥230031) 摘要:对遥感图像进行了初步的介绍;提出了一种军事目标定位方法;利用实验对该目标定位方法进行了验证;对其应用前景进行了展望。 关键词:遥感图像处理;匹配校正;目标定位中图分类号:TP391文献标识码:A文章编号:1009-3044(2007)18-31713-02 TheImageofRemoteSensingImageProcessinganditsApplicationinMilitaryGoalLocation WANGNan,DENGLing-bo,HEHong-feng(CollegeofPLAartillery,Hefei230031,China) Abstract:Forremotesensing,imagehascarriedoutpreliminaryintroduction;Haveputforwardakindofmilitarygoallocationmethod;Verifyusingexperimentforthisgoallocationmethod;Foritsapplication,prospectislookedahead. Keywords:TheimageofremoteSensingImageProcessing;Matchtorectify;Goallocation 1713

CogneVisionPro软件简介及其目标识别定位功能

Cognex VisionPro 软件简介及其目标识别定位功能 1、VisionPro主要功能:图像预处理、图像拼接、图像标定、几何校 正、定位、OCV\ID、图像几何测量、结果分析等,该软件可以直接和国际大多数相机相连,包括模拟、1394、千兆网相机等,且可以直接输出检测结果,提供二次开发接口、支持点net。在其QuickBuild环境中无需任何代码编程,只需拖拉操作就可以完成检查文件的设置,检测结果输出,可进行快速开发。 QuickBuild能与用户自己编写的点net程序无缝连接,实现数据共享,用户可以使用自己的I/O板。 2、VisionPro软件与Halcon对比: 开发方式:VIsionPro可以拖拉式图形编程,非常形象,同时也可以使用API函数编程,增加灵活性。VisionPro的QuickBuild提供更加高效快速的编程界面,能够迅速融合到用户程序中。QuickBuild提供许多成熟的视觉检测工具和设置界面,使用QuickBuild做评估测试和开发的效率远高于Halcon的Hdevelop。而Halcon只能用函数编程,没有图形编程界面,开发效率低于VisonPro。 视觉工具和函数:VisonPro的PatMax定位工具和颜色识别工具优于Halcon的类似工具。特别是PatMax定位工具可在图像模糊、对比度低、目标形变严重的情况下实现更稳定的定位和目标识别功能,得到了行业内广泛的认可。 支持的相机:两种开发软件都支持大多数相机,都可以编写自定义的 驱动。编写自定义驱动,Halcon提供更好的接口。 Cognex VisionPro软件的测试版可在下载 VisionPro定位工具简介: 安装完VisionPro后,有很多演示例程可以运行,且可以进行图像仿真。 以下是其中的一小部分以及我们客户中使用到的一些。 存在透视形变情况下的定位与高度识别 PatMax定位识别功能演示,形变、模糊、强干扰都不受影响 晶元定位 强干扰图像定位 对多目标在各种对比度情况下的稳定定位 严重缺失情况下的定位 强干扰下的OCV

二值图像连通域标记算法与代码 收藏

二值图像连通域标记算法与代码收藏 10:19:42二值图像连通域标记算法与代码 这里列举二值图像连通域标记算法包括直接扫描标记算法和二值图像连通域标记快速算法 一、直接扫描标记算法把连续区域作同一个标记,常见的四邻域标记算法和八邻域标记算法。 1、四邻域标记算法: 1)判断此点四邻域中的最左,最上有没有点,如果都没有点,则表示一个新的区域的开始。 2)如果此点四邻域中的最左有点,最上没有点,则标记此点为最左点的值;如果此点四邻域中的最左没有点,最上有点,则标记此点为最上点的值。 3)如果此点四邻域中的最左有点,最上都有点,则标记此点为这两个中的最小的标记点,并修改大标记为小标记。 2、八邻域标记算法: 1)判断此点八邻域中的最左,左上,最上,上右点的情况。如果都没有点,则表示一个新的区域的开始。 2)如果此点八邻域中的最左有点,上右都有点,则标记此点为这两个中的最小的标记点,并修改大标记为小标记。 3)如果此点八邻域中的左上有点,上右都有点,则标记此点为这两个中的最小的标记点,并修改大标记为小标记。 4)否则按照最左,左上,最上,上右的顺序,标记此点为四个中的一个。 代码实现: #include #include #include //连通区域属性结构 typedef struct tagMarkRegion

{ std::list MarkPointList;//点列表 RECT rect; }MarkRegion; //定义MarkMap 结构,用来存放等价对 typedef struct tagEqualMark { int MarkValue1; //标记值 int MarkValue2; //标记值 } EqualMark; //定义MarkMapping 结构,用来存放标记映射关系typedef struct tagMarkMapping { int nOriginalMark; //第一次扫描的标记 int nMappingMark; //等价整理之后对应标记 } MarkMapping; /* 功能说明:八连通标记 参数说明:I,表示图像数据指针 ImageWidth,表示图像宽 ImageHeight,表示图像高

计算连通域的面积

计算连通域的面积 matlab函数_连通区域 1、 matlab函数bwareaopen——删除小面积对象 格式:BW2 = bwareaopen(BW,P,conn) 作用:删除二值图像BW中面积小于P的对象,默认情况下使用8邻域。 算法: (1)Determine the connected components. L = bwlabeln(BW, conn); (2)Compute the area of each component. S = regionprops(L, 'Area'); (3)Remove small objects. bw2 = ismember(L, find([S.Area] >= P)); 2、matlab函数bwarea——计算对象面积 格式:total = bwarea(BW) 作用:估计二值图像中对象的面积。 注:该面积和二值图像中对象的像素数目不一定相等。 3、matlab函数imclearborder——边界对象抑制 格式:IM2 = imclearborder(IM,conn) 作用:抑制和图像边界相连的亮对象。若IM是二值图,imclearborder将删除和图像边界相连的对象。默认情况conn=8。 注:For grayscale images, imclearborder tends to reduce the overall intensity level in addition to suppressing border structures. 算法: (1)Mask image is the input image. (2)Marker image is zero everywhere except along the border, where it equals the mask image. 4、matlab函数bwboundaries——获取对象轮廓 格式:B = bwboundaries(BW,conn)(基本格式) 作用:获取二值图中对象的轮廓,和OpenCV中cvFindContours函数功能类似。B是一个P ×1的cell数组,P为对象个数,每个cell 是Q×2的矩阵,对应于对象轮廓像素的坐标。 5、matlab函数imregionalmin——获取极小值区域 格式:BW = imregionalmin(I,conn) 作用:寻找图像I的极小值区域(regional maxima),默认情况conn=8。 Regional minima are connected components of pixels with a constant intensity value, and whose external boundary pixels all have a higher value. 6、matlab函数bwulterode——距离变换的极大值 格式:BW2 = bwulterode(BW,method,conn) 作用:终极腐蚀。寻找二值图像BW的距离变换图的区域极大值(regional maxima)。用于距离变换的距离默认为euclidean,连通性为8邻域。

二值图像连通域标记快速算法实现

二值图像连通域标记快速算法实现 算法描述 首先,在进行标记算法以前,利用硬件开辟独立的图像标记缓存和连通关系数组,接着在视频流的采集传输过程中,以流水线的方式按照视频传输顺序对图像进行逐行像素扫描,然后对每个像素的邻域分别按照逆时针方向和水平方向进行连通性检测和等价标记关系合并,检测出的结果对标记等价数组和标记缓存进行更新,在一帧图像采集传输结束后,得到图像的初步标记结果以及初步标记之间的连通关系,最后,根据标号对连通关系数组从小到大的传递过程进行标号的归并,利用归并后的连通关系数组对图像标记缓存中的标号进行替换,替换后的图像为最终标记结果,并且连通域按照扫描顺序被赋予唯一的连续自然数。 图 1 标记算法流程 本文快速二值图像连通域标记算法分为三个环节: 1.图像初步标记:为每个像素赋予临时标记,并且将临时标记的等价关系记录在等价表中 2.整理等价表:这一环节分为两个步骤: (1)将具有等价关系的临时标记全部等价为其中的最小值; (2)对连通区域以自然数顺序重新编号,得到临时标记与最终标记之间的等价关系。 3.图像代换:对图像进行逐像素代换,将临时标记代换为最终标记.经过3个环节处理后,算法输出标记后的图像,图像中连通域按照由上到下,由左至右出现的顺序被标以连续的自然数。 1 图像初始标记 标记算法符号约定:算法在逆时钟方向检测连通域时用w1,w2表示连续两行的图像数据,在紧接着的顺时钟方向连通域检测时用k0,k表示连续两行经过

逆时钟方向标记后的图像数据。其在工作窗口的位置在图2、3中分别说明;对初始逆时针方向临时标记用Z表示。Z初始标记值为1。 二值图像连通域标记算法采用8连通判断准则,通过缩小标记范围剔除了图像的边界效应。为了简化标记处理过程,使标记处理在硬件对一帧图像传输操作时间内结束,标记处理利用中间数据缓存分为连续的两种类型,其中类型1用于直接图像序列传输,硬件发起图像序列传输时,类型1采用逆时钟顺序连通域检测,对2×3工作窗口中的二值像素进行初始标记。类型2对经过类型1初始标记过的图像数据再进行水平方向的连通域检测和归并,然后把标记结果存入图像存储区。 图像初始标记类型1: 步骤1读取像素w1(2)、w1(1)、w1(0)、w0(2)、w0(1),以及相应的二值像素值。 步骤2读取像素w0(1),按照逆时针方向依次与w1(0)、w1(1)、w1(2)、w0(2)比较,若w0(1)= w1(0),则k0(1)=k(2);若w0(1)= w1(1),则k0(1)=k(1);若w0(1)= w1(2),则k0(1)=k(0);若w0(1)= w0(2),则k0(1)=k0(0);否则(即w0(1)≠(w1(2)、w1(1)、w1(0)、w0(2)),k0(1)= Z;Z ++。 步骤3写入等价关系表,以Z为地址将Z写入等价关系数组。 图 2 逆时钟方向初始标记的工作窗 图像初始标记类型2: 步骤1判断经过逆时针方向标记后,如果w0(1)= w0(2)= 1,而标记灰度k0(1)≠k0(0),则进行下一步骤。 步骤2 假设k0(1)> k0(0),判断lab(k0(1))=k0(1)或者lab(k0(1))=k0(0),则lab(k0(1))=k0(0),否则对标记数组进行追踪置换。跳转至步骤3。 步骤3 假设k0(1)< k0(0),判断lab(k0(0))=k0(0)或者lab(k0(0))=k0(1),则lab(k0(0))=k0(1),否则对标记数组进行追踪置换。 追踪置换方法:步骤2的追踪置换令t= lab(k0(0));若lab(t)≠t,则

基于连通域算法的区域测量

第8卷 第9期 2008年5月1671-1819(2008)9-2492-03  科 学 技 术 与 工 程 S c i e n c e T e c h n o l o g ya n d E n g i n e e r i n g  V o l .8 N o .9 M a y 2008 2008 S c i .T e c h .E n g n g . 基于连通域算法的区域测量 李仪芳 刘景琳 (广东技术师范学院电子与信息学院,广州510665) 摘 要 基于数字图像处理的原理,提出用八连通域算法对有多个连通区域的二值图像进行面积测量。通过逐行逐列地扫描图像,按照一定的规则标记连通区域,得到对象的个数,同时统计每个区域所含的像素,通过标尺转换可以得出区域的面积。结果表明,该算法能有效地提取八连通区域,可用于计算显微图像颗粒物的面积和粒径。关键词 区域标记 像素测量 八连通域算法中图法分类号 T P 391.77; 文献标识码 A 2008年1月21日收到 广东省第二批产业技术研究研发计划 项目(2007B 010200041)资助 第一作者简介:李仪芳(1983—),女,广东三水人,广东技术师范学院助教,硕士,研究方向:图像处理和光电技术。E -m a i l :a n g e l i -n a 2008@y a h o o .c o m .c n 二值图像中连通域的提取是图像处理和分析中的一个重要处理过程,可以用于显微图像的对象识别和测量,红外图像的目标定位等领域。灰度图像经过阈值分割后常包括多个连通的区域,需要将连通区域搜索标记出来以便测量。但常见算法是关于四连通区域的研究,其中文献[1,2]中描述或采用的是区域标号法,但文献[1]中描述的算法在实现时并不能达到预定的结果。而且区域生长法计算复杂度过高;像素标记法和行程标记法必须全部扫描完图像才能得到连通域,随着图像幅度和连通域个数的增加,计算复杂度增长。现提出用八连通域算法 [3] ,它不仅能在对图像一次扫描中标记连 通域即计算对象的个数,而且可实现边扫描边提取像素,即累计每个连通域所含像素的个数。 1 区域标记 算法实现逐行逐列扫描,对图像内每个连通的黑色区域进行标记操作,求得对象的数目。图1为6×12图像点阵,图中有三个连通区域,即三个对 象,分别用1,2,3标号。设前景点灰度取1,背景点取值为0。在算法中,定义了多个数组N (i ),其中i 代表连通区域的标号,∑N (i )表示区域内部包含的像素个数。如第1个区域,∑N (1)=7;对第2个区域,∑N (2)=6。下面以标记区域1为例,说明标记的具体算法。 图1 八连通域算法说明图 ① 初始化N (i )=0,i =0。② 从左到右,从上到下逐行扫描图像;如果没有遇到“1”,则继续扫描。若遇到“1”,如(1,1),则依次判断该像素点的

相关文档
最新文档