单目标图像的目标区域提取
基于单目视觉的无人水面艇水面目标测距方法

2021年第40卷第2期传感器与微系统(Transducer and Microsystem Technologies)47DOI : 10.13873/J. 1000-9787(2021)02-0047-04基于单目视觉的无人水面艇水面目标测距方法**收稿日期:2019-08-13*基金项目:国家自然科学基金面上资助项目(61771223)赵明绘,王建华,郑翔,张山甲,张程(上海海事大学航运技术与控制工程交通行业重点实验室,上海201306)摘要:针对单目测距时相机高度和俯仰角难以测量的问题,提出一种相机高度和俯仰角的标定方法,在 此基础上提出一种水面目标的单目测距方法,并分析影响测距精度的因素。
通过相机标定,获得与水面共 面的标定板上的网格坐标系到相机坐标系的外参,计算相机高度和俯仰角;识别出图像中水面目标所在区 域,计算该区域像素纵坐标最大值,及其对应的横坐标的平均值,将组合得到的坐标作为观测点的像素坐 标;根据相机内参、透视投影关系和刚体变换,获得观测点在无人艇附体坐标系下的三维信息,进而计算观 测点的距离。
通过实验验证了所提方法的正确性和有效性。
关键词:单目视觉;无人水面艇;相机高度;相机俯仰角;观测点;测距中图分类号:TP212.9 文献标识码:A 文章编号:1000-9787(2021)02-0047-04Monocular vision based water-surface target distance measurement method for unmanned surface vehiclesZHAO Minghui , WANG Jianhua, ZHENG Xiang, ZHANG Shanjia, ZHANG Cheng(Marine Technology & Control Engineering Key Laboratory ,Shanghai Maritime University ,Shanghai 201306,China)Abstract : Aiming at lhe problem that lhe height and pilch angle are difficult to measure during monocular ranging , a method for calibrating camera height and pitch angle is proposed , and a water-surface target ranging method based on monocular vision is proposed , and lhe factors affecting lhe ranging precision are analyzed ・ Through camera calibration , obtain the extemal coordinate of the grid coordinate system on the calibration plate that is coplanar with the waler surface to lhe camera coordinate system , calculate the camera height and the pilch angle. The area of the target on water surface in the image is identified , the maximum value of the ordinate of the pixel in the area ,and lhe average value of the corresponding horizontal coordinate are calculated ,and the combined coordinate is taken as the pixel coordinate of the observation point. According to the camera internal reference , perspective projection relationship and rigid body transformation , the three-dimensional information of the observation point in the coordinate system of the unmanned boat is obtained , and then the distance of the observation point is calculated. The correctness and effectiveness of the proposed method are verified by experiments ・Keywords : monocular vision ; unmanned surface vehicle ; camera height ; camera pitch angle ; observation point ; ranging0引言无人水面艇由于其可以执行更危险的以及不适于有人 船只执行的任务而吸引了广大研究人员⑴。
(完整版)目标检测综述

一、传统目标检测方法如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。
下面我们对这三个阶段分别进行介绍。
(1) 区域选择这一步是为了对目标的位置进行定位。
由于目标可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。
这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。
(实际上由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不能得到很好的区域)(2)特征提取由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。
然而提取特征的好坏直接影响到分类的准确性。
(这个阶段常用的特征有SIFT、HOG等)(3) 分类器主要有SVM, Adaboost等。
总结:传统目标检测存在的两个主要问题:一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。
二、基于Region Proposal的深度学习目标检测算法对于传统目标检测任务存在的两个主要问题,我们该如何解决呢?对于滑动窗口存在的问题,region proposal提供了很好的解决方案。
regionproposal(候选区域)是预先找出图中目标可能出现的位置。
但由于region proposal 利用了图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口(几千个甚至几百个)的情况下保持较高的召回率。
这大大降低了后续操作的时间复杂度,并且获取的候选窗口要比滑动窗口的质量更高(滑动窗口固定长宽比)。
比较常用的region proposal算法有selective Search和edge Boxes,如果想具体了解region proposal可以看一下PAMI2015的“What makes for effective detection proposals?”有了候选区域,剩下的工作实际就是对候选区域进行图像分类的工作(特征提取+分类)。
遥感影像处理中的特征提取方法和应用

遥感影像处理中的特征提取方法和应用遥感影像是通过无人机、卫星等载体获取的地球表面的影像数据。
特征提取是遥感影像处理中的一项重要任务,旨在从遥感影像中提取出地物的特定特征,以实现对地物的分类、识别和监测等应用。
本文将介绍遥感影像处理中常用的特征提取方法及其应用。
一、特征提取方法1. 基于像素的特征提取方法基于像素的特征提取方法是从单个像素点的信息中提取特征。
常用的方法包括:(1)颜色特征提取:利用遥感影像中的颜色信息进行特征提取。
常用的方法包括二值化、RGB分量、HSV、归一化差异植被指数(NDVI)等。
(2)纹理特征提取:利用遥感影像中的纹理信息进行特征提取。
常用的方法包括灰度共生矩阵(GLCM)、灰度值标准差、平均灰度值等。
(3)形状特征提取:利用遥感影像中的形状信息进行特征提取。
常用的方法包括链码、Hu不变矩、区域面积等。
2. 基于目标的特征提取方法基于目标的特征提取方法是在已知地物目标的前提下,根据地物目标的特定特征进行特征提取。
常用的方法包括:(1)形状特征提取:利用地物目标的形状信息进行特征提取。
常用的方法包括面积、周长、伸长率等。
(2)纹理特征提取:利用地物目标的纹理信息进行特征提取。
常用的方法包括纹理能量、纹理熵、纹理对比度等。
(3)上下文特征提取:利用地物目标的上下文信息进行特征提取。
常用的方法包括边界连接、邻居分析、局部空间关系等。
二、特征提取应用1. 地物分类特征提取在地物分类中起到了关键作用。
通过提取不同地物的特定特征,可以将遥感影像中的地物进行分类,如水体、森林、建筑等。
特征提取方法可以通过训练分类器来实现自动分类。
2. 土地利用监测特征提取可以应用于土地利用监测。
通过提取遥感影像中地物的特定特征,可以实现对土地的类型和变化进行监测,如农田的扩张、森林的退化等,为土地规划和资源管理提供支持。
3. 城市规划特征提取在城市规划中具有重要意义。
通过提取遥感影像中的建筑、道路等特定特征,可以分析城市的发展趋势和扩张方向,为城市规划和交通规划提供数据支持。
高清与标清信号的上下变换及抠像制作

高清与标清信号的上下变换及抠像制作高清与标清信号是视频中常见的两种分辨率。
高清信号是指分辨率较高、图像细腻的图像信号,标清信号则是指分辨率较低、图像相对较模糊的信号。
在视频处理中,常常需要对高清与标清信号进行上下变换和抠像制作,下面将详细介绍这两个过程。
1. 上变换上变换是将低分辨率的标清信号转换为高分辨率的高清信号。
这个过程涉及到图像插值技术,常用的插值算法有最近邻插值、双线性插值和双三次插值。
最近邻插值是最简单的插值算法,它将目标像素的值赋为最近邻像素的值。
这种方法计算速度快,但图像细节丢失较多。
双线性插值是最常用的插值算法之一,它通过线性插值计算目标像素的值,使图像光滑度较好,细节损失较少。
双三次插值是一种复杂的插值算法,它考虑了周围16个像素的值,通过三次函数进行插值计算。
这种插值算法计算量较大,但图像细节保存较好。
最大最小值采样是一种更复杂的采样方法,它取目标像素周围邻域像素的最大值和最小值作为目标像素的值,从而保留目标区域的边缘细节。
1. 抠像原理抠像是指从图像或视频中将某个目标物体提取出来,去除其它背景内容的过程。
常用的抠像技术有基于颜色的抠像、基于轮廓的抠像和基于深度的抠像等。
基于颜色的抠像是最常用的抠像技术之一,它通过选择目标物体的颜色范围进行像素级别的分割,将目标与背景区分开。
基于轮廓的抠像是通过检测目标物体的轮廓边缘来进行抠像,常用的方法有边缘检测和轮廓跟踪等。
基于深度的抠像是将图像或视频中的目标物体和背景通过深度信息进行分割,常用的方法有深度传感器和立体视觉等。
2. 抠像制作步骤(1) 预处理:对图像或视频进行去噪、平滑处理,提高抠像效果。
(2) 初始化:选择目标物体的初始区域,并计算目标物体的特征信息。
(4) 边缘平滑:对目标物体的分割边缘进行平滑处理,使得抠像结果更加自然。
医疗图像处理中的图像分割方法教程

医疗图像处理中的图像分割方法教程医疗图像处理是近年来发展迅速的领域,它利用计算机技术对医学图像进行处理和分析,为医生提供准确的诊断和治疗方案。
而图像分割作为医疗图像处理的重要组成部分,旨在将医学图像中的对象从背景中区分出来,以提供更详细、更准确的信息。
在医疗图像处理中,图像分割方法具有不可忽视的重要性。
以下将介绍一些常用的医疗图像分割方法,以帮助读者更好地理解和应用。
1. 基于阈值的分割方法基于阈值的分割方法是图像处理中最简单、最直观的一种方法。
它假设图像中的目标与背景具有明显的灰度差异,并通过设置合适的阈值来分割图像。
在医疗图像处理中,可以利用生理特征或者病灶的灰度分布来确定阈值,帮助准确地分割出病变区域。
2. 基于边缘检测的分割方法基于边缘检测的分割方法通过检测图像中的边缘来实现分割。
边缘是图像中灰度变化明显的位置,可以有效区分目标与背景。
常用的边缘检测算法包括Sobel算子、Canny算子等。
通过这些算法可以提取出图像中的边缘信息,然后将目标与背景分离。
3. 基于区域生长的分割方法基于区域生长的分割方法是一种基于灰度值相似性的分割方法。
它从种子点开始,通过逐渐生长的方式将相似灰度值的像素点合并到一个区域中,直到满足一定的停止标准。
这种方法可以有效地处理医疗图像中的噪音和弱边缘问题,得到更加准确的分割结果。
4. 基于图像统计特征的分割方法基于图像统计特征的分割方法利用图像中不同区域的统计特征来实现分割。
例如,可以利用均值、方差、纹理等特征来描述不同区域的差异,并根据这些差异进行分割。
这种方法可以克服基于灰度值的分割方法在处理复杂医学图像时的缺陷,并得到更准确的分割结果。
5. 基于机器学习的分割方法基于机器学习的分割方法利用先前已知的标记样本训练分类器,然后将分类器应用于待分割图像中。
常用的机器学习算法包括支持向量机、决策树、神经网络等。
通过这些算法可以将图像中的像素点分为不同的类别,从而实现图像的分割。
检测分割分类算法

检测分割分类算法检测分割分类算法(Detection Segmentation Classification Algorithm)是一种用于图像处理和计算机视觉领域的重要算法。
它能够对图像进行分割,并对分割后的区域进行分类和检测。
本文将介绍检测分割分类算法的原理、应用领域以及一些常见的算法模型。
一、算法原理检测分割分类算法的基本原理是通过对图像进行分割,将图像中的不同区域分割出来,并对分割后的区域进行分类和检测。
其主要步骤包括图像分割、特征提取、分类和检测。
图像分割是指将图像划分为不同的区域,使得每个区域内的像素具有相似的属性。
常用的图像分割方法包括基于阈值的方法、基于边缘的方法和基于区域的方法。
特征提取是指从分割后的图像区域中提取出与分类和检测相关的特征。
常用的特征提取方法包括颜色直方图、纹理特征和形状特征等。
分类是指将提取到的特征输入到分类器中,通过训练分类器来对图像进行分类。
常用的分类方法包括支持向量机(SVM)、人工神经网络(ANN)和决策树等。
检测是指在分类的基础上,进一步对图像中的目标进行检测。
常用的检测方法包括滑动窗口和区域提议等。
二、应用领域检测分割分类算法在图像处理和计算机视觉领域有着广泛的应用。
以下是一些常见的应用领域:1. 目标检测:将图像中的目标进行检测,如人脸检测、车辆检测等。
通过检测分割分类算法,可以准确地定位和识别图像中的目标。
2. 图像分割:将图像分割为不同的区域,可以用于图像编辑、图像增强和图像压缩等应用。
通过检测分割分类算法,可以自动地对图像进行分割,并提取出与目标相关的区域。
3. 医学图像处理:在医学图像处理中,检测分割分类算法可以用于识别疾病区域、辅助诊断和手术导航等。
通过对医学图像进行分割和分类,可以提高医学图像的分析和处理效率。
4. 视频监控:在视频监控领域,检测分割分类算法可以用于目标跟踪、行为识别和异常检测等。
通过对视频图像进行分割和分类,可以实现对目标的准确跟踪和识别。
基于计算机视觉测量技术的图像轮廓提取方法研究
基于计算机视觉测量技术的图像轮廓提取方法研究一、本文概述随着计算机视觉技术的快速发展,其在工业测量、医疗诊断、自动驾驶等众多领域的应用日益广泛。
图像轮廓提取作为计算机视觉中的一项关键技术,对于实现目标的识别、定位、跟踪等任务具有重要意义。
本文旨在研究基于计算机视觉测量技术的图像轮廓提取方法,以提高轮廓提取的准确性和效率。
本文将回顾传统的图像轮廓提取方法,如边缘检测算子、阈值分割等,并分析其优缺点。
在此基础上,本文将探讨基于现代计算机视觉测量技术的轮廓提取方法,如基于深度学习的轮廓检测算法、基于结构光的三维轮廓测量技术等。
这些新方法在轮廓提取的准确性和鲁棒性方面具有显著优势,能够更好地适应复杂多变的实际应用场景。
本文将详细介绍所研究的图像轮廓提取方法的具体实现过程,包括预处理、特征提取、轮廓检测等步骤。
本文将通过实验验证所提出方法的有效性,并与传统方法进行比较,以展示其在实际应用中的优势。
本文还将探讨基于计算机视觉测量技术的图像轮廓提取方法在未来可能的发展方向和挑战。
随着深度学习、三维重建等技术的不断进步,轮廓提取方法将在更多领域发挥重要作用,为实现更智能、更高效的图像处理和分析提供有力支持。
二、图像轮廓提取基础理论图像轮廓提取是计算机视觉测量技术中的关键步骤,其目标是识别并描绘出图像中物体的边缘或边界。
这些轮廓信息对于理解图像内容、进行物体识别、三维重建等任务至关重要。
图像轮廓提取主要基于边缘检测算法和轮廓跟踪算法。
边缘检测算法是轮廓提取的基础,它通过对图像中像素强度的突变进行检测,从而找到边缘位置。
经典的边缘检测算子包括Sobel、Prewitt、Roberts、Canny等。
这些算子通过计算图像在水平和垂直方向上的梯度强度,来判定像素是否属于边缘。
其中,Canny算子以其良好的噪声抑制能力和边缘定位精度,在实际应用中得到了广泛应用。
轮廓跟踪算法则是在边缘检测的基础上,通过连接相邻的边缘像素,形成连续的轮廓线。
halcon 取最大区域算子 -回复
halcon 取最大区域算子-回复Halcon 是一种强大的机器视觉软件,它提供了许多强大的算子,可以用于处理各种各样的图像识别和分析任务。
其中一个非常有用的算子是`取最大区域`。
本文将一步步介绍该算子的功能、用法、和在不同应用场景下的实例。
1. 算子功能:`取最大区域`算子的作用是找到图像中的最大连通区域(blob)。
连通区域指的是由相邻像素组成的图像区域,且它们具有相似的像素值或灰度值。
最大连通区域是指像素数目最多的连通区域。
通过使用`取最大区域`算子,我们可以轻松地筛选出图像中所需的物体或特征。
2. 算子用法:该算子的用法非常简单,只需将待处理的图像作为输入,并指定一些参数即可。
具体步骤如下:a. 导入HDevelop 库:pythonfrom hdevelop import *b. 加载图像并将其转换为灰度图像:pythonimage = read_image('image.png')image_gray = image_to_gray(image)c. 预处理图像,例如使用滤波算法平滑图像:pythonsmooth_image = smooth_image(image_gray, 'gauss', 5) d. 进行区域分割并提取最大区域:pythonregions = threshold(image_gray, 128, 255)max_region = select_shape(regions, 'area', 'max')e. 可选:根据需要可以对最大区域进行进一步的处理,例如计算其面积、周长、中心点坐标等:pythonarea = get_region_area(max_region)perimeter = get_region_perimeter(max_region)center = get_region_center(max_region)3. 算子应用场景:`取最大区域`算子在许多应用场景中都非常有用。
无人机遥感图像处理中的目标检测技术
无人机遥感图像处理中的目标检测技术目标检测是无人机遥感图像处理中的核心技术之一。
随着无人机技术的飞速发展,无人机遥感图像逐渐成为获取地理信息的重要手段。
目标检测技术通过对无人机遥感图像中的目标进行自动识别和定位,为各行业提供了更加全面和精确的地理信息。
目标检测在无人机遥感图像处理中的挑战包括目标尺度、遮挡、光照变化、背景复杂度等。
针对这些挑战,研究人员在目标检测技术上做了大量的努力,并取得了显著的研究进展。
一种常用的目标检测技术是基于传统的计算机视觉方法,如基于特征的检测和机器学习方法。
这种方法通过从图像中提取一些特征表示样本,然后使用分类器对样本进行分类,从而达到目标检测的目的。
其中,Haar特征、HOG特征和SURF特征等是常用的特征表示方法。
在分类器方面,常用的有SVM、AdaBoost和决策树等。
这些方法在一些特定的场景中取得了不错的效果,并广泛应用于无人机遥感图像处理中。
然而,传统的计算机视觉方法在一些复杂场景下的检测性能较差。
为了解决这个问题,研究人员开始将深度学习引入到目标检测领域。
深度学习的出现极大地推动了目标检测技术的发展。
基于深度学习的目标检测方法主要有两种,一种是基于区域的卷积神经网络方法(R-CNN),另一种是单阶段检测方法(如YOLO)。
基于区域的卷积神经网络方法将目标检测任务分为两个阶段:生成候选区域和对候选区域进行分类。
它通过提取图像中候选区域的特征,并使用分类器对这些候选区域进行分类。
R-CNN方法的优点是能够检测出较为准确的目标位置,但缺点是处理速度较慢。
为了改善速度,研究人员提出了Fast R-CNN和Faster R-CNN等方法,大大提升了目标检测的速度。
单阶段检测方法则直接通过网络输出目标的类别和位置信息,不需要生成候选区域。
这种方法的优点是速度快,适用于实时性要求较高的应用场景。
YOLO方法是其中的代表,它通过将整个图像分成网格,每个网格预测出相应的目标类别和位置。
基于目标区域和相关反馈的图像检索
关键词 : 图像检 索; 图像 分割 ; 相似度计算 ; 关反馈 ; 相 支持向量机 DO :037 /i n10 — 3 1 0 81.5 文章编号 :0 2 8 3 ( 0 8 1 — 1 10 文献标识码 : 中图 分类号 :P 9 I 1 . 8 .s.0 2 8 3 . 0 .6 2 7 js 2 0 10 — 3 1 20 )6 07 — 3 A r 31 r 近年来 , 随着 多媒体和 网络技术的迅速 发展 , 人们越来越
a d Ap l a o s 2 0 。 4 1 ) 1 1 7 . n pi t n 。 0 8 4 ( 6 :7 -1 3 ci
Ab ta t A s r c : n v l ma e e r v meh d a e o r g o a d ee a c f e b c i r p s d n h s a e . f s ,l o e i g r t e a i l to b s d n e i n n r lv n e e d a k s p o o e i t i p p r At i tt e r 1
l s r lv n e e d a k at a e e a c fe b c me h n s b s d n u p r v co ma h n s s n o e t mp o e h r t e a p r r n eT e c a im, a e o s p o t e tr c i e i iv k d o i r v t e er v l ef ma c . h i o
p p s d a p a h e ly i rv d K- a a d f l n u e v s e me tt n a g rt m o d vd ma e n o r go s a d o r o e p r c mp o s a mp e me n n ul u s p r ie s g n ai l o h t iiห้องสมุดไป่ตู้e i g s i t e in , n o o y d o i
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西安理工大学
研究生课程论文
课程名称: 数字图像分析
课程代号:
任课教师:
论文题目: 单目标图像的目标区域提取
完成日期: 2015 年 1 月 13 日
学 科:
姓 名:
1
单目标图像的目标区域提取
摘 要:
图像分割的目的是将图像划分为不同的区域,区域增长是一种根据事
先定义的准则将像素或子区域聚合成为更大的区域的过程,分裂合并是根据一致
性准则处理目标和背景之间灰度渐变图像的典型算法。本文以单目标图像为对
象,通过区域增长和分裂合并的方法实现了对目标区域的提取,并对实验结果进
行了分析。
关键字:
图像分割;区域增长;分裂合并;二值化
Abstract:
The purpose of image segmentation is to divide the image into different
areas, regional growth is a kind of according to predefined criteria will become more
pixels or subdomain polymerization process of large area, split the merger is
processed according to the consistency criterion between target and background gray
gradient image of typical algorithm. Based on the single target image as the object,
through regional growth and division merge method to extract the target area is
achieved, and the experiment results are analyzed.
Key words:
Image segmentation;Regional growth;Split the merger;binarization
1引言
数字图像处理的目的之一是图像识别, 而图像分割与测量是图像识别工作
的基础。图像分割是将图像分成一些有意义的区域, 然后对这些区域进行描述,
相当于提取出某些目标区域图像的特征, 判断图像中是否有感兴趣的目标。图像
分割是图像处理到图像分析的关键步骤,在图像工程中占据重要的位置。一方面,
它是目标表达的基础,对特征测量有重要的影响。另一方面,因为图像分割及其基
于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形
式,使得更高层的图像分析和理解成为可能。
2技术分析
2.1图像分割
图像分割就是将待处理的图像表示为物理上有意义的连通区域的集合,一般
是通过对图像的不同特征如纹理、颜色、边缘、亮度等特征的分析,来达到图像
2
分割的目的。图像分割通常是为了进一步对图像进行分析、理解、识别、处理、
跟踪等,分割的准确性直接影响到后续任务的有效性,因此分割在图像处理中具
有十分重要的意义。
图像分割可以依据图像中每个像素的颜色、灰度、纹理信息和几何性质等特
征,将图像中具有某些特殊含义的不同区域区分开,分割后所形成的这些区域是
互不重叠的,并且每个区域都满足特定区域的一致性。分割出来的区域应该同时
满足]1[:
(1)分割出来的图像区域的均匀性和连通性。
(2)相邻分割区域之间针对选定的某种特征具有明显的差异。
(3)分割区域边界应该规整,同时保证边缘的空间定位精度。
根据图像分割的处理方式不同,可以将基于区域的图像分割算法分为以下三
大类:a.阈值法;b.区域生长和分裂合并法;c.基于统计学的算法。常见的经典
的图像分割技术有:并行边界分割技术、串行边界分割技术、并行区域分割技术
和串行区域分割技术。串行区域分割技术指采用串行处理的策略通过对目标区域
的直接检测来实现图像分割的技术, 它的特点是将整个处理过程分解为顺序的
多个步骤逐次进行, 对后继步骤的处理要对前面已完成步骤的处理结果进行判
断而确定。这里的判定要根据一定的准则, 一般来说如果准则是基于图像灰度特
性的, 则这个方法可以用于灰度图像分割。基于区域的串行分割技术有两种基本
的形式, 一是从单个象素出发, 渐渐合并以形成所需的分割区域, 二是从整个
图出发, 分裂切割至所需要的分割区域, 第一种方法的典型技术就是区域增长。
本文主要讨论的就是区域增长算法和分裂合并算法。
2.2区域增长算法
基于区域生长的算法的基本思想是把具有相似性质的像素归并在同一个区
域内。像素的相似性判定包括图像的纹理信息、灰度值、颜色等其他像素特性。
该算法首先对需要分割的每个区域选取一个种子像素,作为区域生长的起点位
置,然后将种子像素与周围邻域内的像素进行相似性比较,如果满足约定好的相
似性准则或生长准则,就把当前比较的像素合并到种子像素所在的区域。再利用
新合并进去的像素作为种子点,与它周围的像素进行相似性比较,直到没有满足
条件的像素可以被合并进来就表示完成了一个区域的生长过程。
下图中给出了一个已知种子点进行区域生长的示例。图 2-1(a)表示需要分
割的图像,设已知有两个种子像素(用下划线标注),现进行区域生长。这里选
3
取的合并准则是:如果种子像素的灰度值与邻域像素的灰度值之差小于等于门限
值 T,则将当前比较的像素归并到种子像素所在的区域。图 2-1(b)给出了 T=3
时的结果,图像被分割为两个区域。图 2-1(c)给出的是 T=1 时的结果,从图中
可以看出分割结果中存在着较小的区域,产生了过分割现象。图 2-1(d)给出的
是当 T=6 时的分割结果,该图显示图像中的所有像素都在一个区域内,没有达
到分割图像的目的。因此可见,门限值的选取对于分割结果的好坏起着决定性的
作用]3[。
(a)原图 (b)T=3
(c)T=1 (d)T=6
图2-1原图像和 T 取不同值的区域生长结果
算法的好坏取决于三个要素:(1)如何选择一组能够正确代表所选区域的
种子像素;(2)如何确定在生长过程中能将相邻像素合并进来的准则;(3)如
何确定生长终止的条件或规则。其优点是当区域的相似性准则和生长终止的条件
比较容易找到时,可以取得较好的分割效果。但是,该算法在生长过程中考虑的
只是当前种子点像素与周围邻域像素的相似性也即仅考虑了图像的局部信息,没
有考虑生长的过程,对于变化特征比较缓慢的图像不能得到较好的分割效果。另
外,种子像素点的选取和生长准则的确定直接影响到分割的效果图,如果选取不
当则可能造成过分割或不能有效分割的问题(如图 2-1(c)和图2-1(d)所示)。
区域增长的关键是相似性准则也即区域生长准则的选取,相似性准则依赖于
图像的灰度、纹理等信息。使用不同的增长准则会影响到图像的最终分割结果。
1 0 4 7 5
1 0 4 7 7
0 1 4 5 5
2 0 6 5 4
1 2 5 4 6
1 1 5 5 5
1 1 5 5 5
1 1 5 5 5
1 1 5 5 5
1 1 5 5 5
1 1 4 7 5
1 1 4 7 7
1 1 4 5 5
2 1 5 5 5
2 2 5 5 6
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1