第三章 二值图像分析
(完整word版)二值图像分析

第三章 二值图像分析一幅数字图像是一个二维阵列,阵列元素值称为灰度值或强度值.实际上,图像在量化成数字图像前是一个连续强度函数的集合,场景信息就包含在这些强度值中.图像强度通常被量化成256个不同灰度级,对某些应用来说,也常有32、64、128或512个灰度级的情况,在医疗领域里甚至使用高达4096(12bits)个灰度级.很明显,灰度级越高,图像质量越好,但所需的内存也越大.在机器视觉研究的早期,由于内存和计算能力非常有限,而且十分昂贵,因此视觉研究人员把精力主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上.人们注意到,人类视觉在理解仅由两个灰度级组成的线条、轮廓影像或其它图像时没有任何困难,而且应用场合很多,这一点对研究二值视觉系统的研究人员是一个极大的鼓舞.随着计算机计算能力的不断增强和计算成本的不断下降,人们普遍开始研究基于灰度图像、彩色图像和深度图像的视觉系统.尽管如此,二值视觉系统还是十分有用的,其原因如下:⑴ 计算二值图像特性的算法非常简单,容易理解和实现,并且计算速度很快.⑵ 二值视觉所需的内存小,对计算设备要求低.工作在256个灰度级的视觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八倍.如若利用游程长度编码等技术(见3.4节)还可使所需内存进一步减少.由于二值图像中的许多运算是逻辑运算而不是算术运算,所以所需的处理时间很短.(3)许多二值视觉系统技术也可以用于灰度图像视觉系统上.在灰度或彩色图像中,表示一个目标或物体的一种简易方法就是使用物体模板(mask),物体模板就是一幅二值图像,其中1表示目标上的点,0表示其它点.在物体从背景中分离出来后,为了进行决策,还需要求取物体的几何和拓扑特性,这些特性可以从它的二值图像计算出来.因此,尽管我们是在二值图像上讨论这些方法,但它们的应用并不限于二值图像.一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地控制时,二值视觉系统是非常有用的.当使用特殊的照明技术和背景并且场景中只有少数物体时,物体可以很容易地从背景中分离出来,并可得到较好的轮廓,比如,许多工业场合都属于这种情况.二值视觉系统的输入一般是灰度图像,通常使用阈值法首先将图像变成二值图像,以便把物体从背景中分离出来,其中的阈值取决于照明条件和物体的反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性,在许多应用中,这种特性对识别物体来说是足够的.二值视觉系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用.在下面的讨论中,假定二值图像大小为n m ⨯,其中物体像素值为1,背景像素值为0.3.1 阈值视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割,即把图像],[j i F 划分成区域k p p p ,,,21⋅⋅⋅,使得每一个区域对应一个候选的物体.下面给出分割的严格定义.定义 分割是把像素聚合成区域的过程,使得:● ==i k i P 1 整幅图像 (}{i P 是一个完备分割 ). ● j i P P j i ≠∅=, ,(}{i P 是一个完备分割).● 每个区域i P 满足一个谓词,即区域内的所有点有某种共同的性质.● 不同区域的图像,不满足这一谓词.正如上面所表明的,分割满足一个谓词,这一谓词可能是简单的,如分割灰度图像时用的均匀灰度分布、相同纹理等谓词,但在大多数应用场合,谓词十分复杂.在图像理解过程中,分割是一个非常重要的步骤. 二值图像可以通过适当地分割灰度图像得到.如果物体的灰度值落在某一区间内,并且背景的灰度值在这一区间之外,则可以通过阈值运算得到物体的二值图像,即把区间内的点置成1,区间外的点置成0.对于二值视觉,分割和阈值化是同义的.阈值化可以通过软件来实现,也可以通过硬件直接完成.通过阈值运算是否可以有效地进行图像分割,取决于物体和背景之间是否有足够的对比度.设一幅灰度图像],[j i F 中物体的灰度分布在区间],[21T T 内,经过阈值运算后的图像为二值图像],[j i F T ,即:⎩⎨⎧≤≤=其它如果0],[ 1],[21T j i F T j i F T (3.1) 如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为: ⎩⎨⎧∈=其它如果0],[ 1],[Z j i F j i F T (3.2) 其中Z 是组成物体各部分灰度值的集合.图3.1是对一幅灰度图像使用不同阈值得到的二值图像输出结果. 阈值算法与应用领域密切相关.事实上,某一阈值运算常常是为某一应用专门设计的,在其它应用领域可能无法工作.阈值选择常常是基于在某一应用领域获取的先验知识,因此在某些场合下,前几轮运算通常采用交互式方式来分析图像,以便确定合适的阈值.但是,在机器视觉系统中,由于视觉系统的自主性能(autonomy )要求,必须进行自动阈值选择.现在已经研究出许多利用图像灰度分布和有关的物体知识来自动选择适当阈值的技术.其中的一些方法将在3.2节介绍.图3.1 一幅灰度图像和使用不同阈值得到的二值图像结果.上左:原始灰度图像,上右:阈值T=100;左下:T=128.右下:T1=100|T2=128. 3.2 几何特性通过阈值化方法从图像中检测出物体后,下一步就要对物体进行识别和定位.在大多数工业应用中,摄像机的位置和环境是已知的,因此通过简单的几何知识就可以从物体的二维图像确定出物体的三维位置.在大多数应用中,物体的数量不是很多,如果物体的尺寸和形状完全不同,则可以利用尺度和形状特征来识别这些物体.实际上在许多工业应用中,经常使用区域的一些简单特征,如大小、位置和方向,来确定物体的位置并识别它们.3.2.1 尺寸和位置一幅二值图像区域的面积(或零阶矩)由下式给出:∑∑-=-==1010],[n i m j j i B A (3.3)在许多应用中,物体的位置起着十分重要的作用.工业应用中,物体通常出现在已知表面(如工作台面)上,而且摄像机相对台面的位置也是已知的.在这种情况下,图像中的物体位置决定了它的空间位置.确定物体位置的方法有许多,比如用物体的外接矩形、物体矩心(区域中心)等来表示物体的位置.区域中心是通过对图像进行“全局”运算得到的一个点,因此它对图像中的噪声相对来说是不敏感的.对于二值图像,物体的中心位置与物体的质心相同,因此可以使用下式求物体的中心位置:∑∑∑∑∑∑∑∑-=-=-=-=-=-=-=-=-==1010101010101010],[],[],[],[n i n i m j m j n i m j n i m j j i iB j i B y j i jB j i B x (3.4)其中x 和y 是区域相对于左上角图像的中心坐标.物体的位置为:Aj i iB y A j i jB x n i m j n i m j ∑∑∑∑-=-=-=-=-==10101010],[],[ (3.5)这些是一阶矩.注意,由于约定y 轴向上,因此方程3.4和3.5的第二个式子的等号右边加了负号.3.2.2 方向计算物体的方向比计算它的位置稍微复杂一点.某些形状(如圆)的方向不是唯一的,为了定义唯一的方向,一般假定物体是长形的,其长轴方向被定义为物体的方向.通常,二维平面上与最小惯量轴同方向的最小二阶矩轴被定为长轴.图像中物体的二阶矩轴是这样一条线,物体上的全部点到该线的距离平方和最小.给出一幅二值图像],[j i B ,计算物体点到直线的最小二乘方拟合,使所有物体点到直线的距离平方和最小:χ220101==-=-∑∑r B i j ij j m i n [,] (3.6)其中r ij 是物体点],[j i 到直线的距离.为了避免直线处于近似垂直时所出现的数值病态问题,人们一般把直线表示成极坐标形式:θθρsin cos y x += (3.7)如图3.2所示,θ是直线的法线与x 轴的夹角,ρ是直线到原点的距离.把点),(j i 坐标代入直线的极坐标方程得出距离r :22)sin cos (ρθθ-+=y x r (3.8)图3.2 直线的极坐标表示将方程3.8代入方程3.6并求极小化问题,可以确定参数ρ和θ:∑∑-=-=-+=101022],[)sin cos (n i m j ij ij j i B y x ρθθχ (3.9) 令2χ对ρ的导数等于零求解ρ得:)sin cos (θθρy x += (3.10) 它说明回归直线通过物体中心),(y x .用这一ρ值代入上面的2χ,则极小化问题变为:θθθθχ222sin cos sin cos c b a ++= (3.11)其中的参数:],[)(],[))((2],[)(10210101010102j i B y y c j i B y y x x b j i B x x a n i m j ij n i m j ij ij n i m j ij ∑∑∑∑∑∑-=-=-=-=-=-=-=--=-= (3.12)是二阶矩.表达式2χ可重写为:θθχ2sin 212cos )(21)(212b c a c a +-++=(3.13) 对2χ微分,并置微分结果为零,求解 值:ca b -=θ2tan (3.14) 因此,惯性轴的方向由下式给出: 2222)(2cos )(2sin c a b ca c ab b -+-±=-+±=θθ (3.15) 所以由2χ的最小值可以确定方向轴.注意,如果c a b ==,0,那么物体就不会只有唯一的方向轴.物体的伸长率E 是2χ的最大值与最小值之比:m inm ax χχ=E (3.16) 3.2.3 密集度和体态比区域的密集度(compact )可用下面的式子来度量:2pA C = (3.17) 其中,p 和A 分别为图形的周长和面积.根据这一衡量标准,圆是最密集的图形,其密集密度为最大值π4/1,其它一些图形的比值要小一些.让我们来看一下圆,当圆后仰时,形状成了一椭圆,面积减小了而周长却不象面积减小的那么快,因此密集度降低了.在后仰到极限角时,椭圆被压缩成了一条无限长直线,椭圆的周长为无穷大,故密集度变成了零.对于数字图像, 2p A 是指物体尺寸(像素点数量)除以边界长度的平方.这是一种很好的散布性或密集性度量方法.这一比值在许多应用中被用作为区域的一个特征.密集度的另一层意义是:在给定周长的条件下,密集度越高,围成的面积就越大.注意在等周长的情况下,正方形密集度大于长方形密集度.体态比定义为区域的最小外接矩形的长与宽之比,正方形和圆的体态比等于1,细长形物体的体态比大于1.图3.3所示的是几种形状的外接矩形.图3。
遥感数字图像处理知到章节答案智慧树2023年西北师范大学

遥感数字图像处理知到章节测试答案智慧树2023年最新西北师范大学第一章测试1.数字图像本质上就是一个存储数字的矩阵,是你肉眼直接看不见的。
()参考答案:对2.在同等水平条件下,模拟图像的成像效果比数字图像更好。
()参考答案:对3.采样就是指电磁辐射能量的离散化。
()参考答案:错4.按照数字图像的光谱特性可以将图像分为彩色图像和黑白图像。
()参考答案:错5.任何一幅图像都有自己对应的直方图,但相同的直方图可能对应于不同的图像。
()参考答案:对6.图像显示时的屏幕分辨率等同于图像空间分辨率。
()参考答案:错7.时间分辨率是指对同一区域进行重复观测的最小时间间隔,也称为重访周期。
()参考答案:对8.数字图像的灰度分辨率越高,可展现在屏幕上的灰度级越多,说明图像显示的灰度层次越丰富。
()参考答案:对9.为了使同一波段的像素保证存储在一块,从而保持了像素空间的连续性。
应该选择()存储方式.参考答案:BSQ10.遥感影像灰度直方图反映的是一幅图像中各灰度级像素出现的()。
参考答案:频率11.已知一幅数字图像的辐射量化等级是4 bit,则这幅图像所存储的灰度值范围是()。
参考答案:0-1512.一台显示器的屏幕在水平方向显示800个像元,在垂直方向显示600个像元,则表示该显示器的分辨率为()dpi。
参考答案:80060013.从连续图像到数字图像需要()。
参考答案:采样和量化14.下面哪些特征参数直接影响数字图像的信息含量?()参考答案:光谱分辨率;时间分辨率15.下列图像中属于单波段图像的是()。
参考答案:二值图像;伪彩色图像16.遥感数字图像直方图的作用有()。
参考答案:计算图像的信息量;辅助计算图像中物体的面积;辅助图像分割时的边界阈值选择;辅助判断图像数字化量化是否恰当17.遥感数字图像的质量可用以下哪些分辨率来衡量?()参考答案:空间分辨率;时间分辨率;光谱分辨率;辐射分辨率;温度分辨率18.常用的颜色空间模型有()。
(北师大版)七年级数学下册:第三章变量之间的关系3.3用图像表示的变量的关系第2课时 折线型图象备课素材

素材一新课导入设计情景导入置疑导入归纳导入复习导入类比导入悬念激趣情景导入图3-3-13抱犊崮,海拔584米,与龟龙湖交融一体,山水相连,壮观巍峨,为天下第一崮.恰值清明假期,小强一家前去踏春,兴之所至,小强用学过的变量的知识绘了一幅图(如图3-3-13)来表示他们当天的行程.其中横轴表示当时的时刻t(时),纵轴表示他们与家的距离s(千米).图3-3-14设疑:同学们,你能想象出他们一天的情境吗?说明:引导学生在欣赏抱犊崮秀丽的美景中,自然引入有趣的变量知识,既培养了学生从图象中获取信息的能力,又锻炼了学生的语言表达能力.建议:学生欣赏抱犊崮的美景,简单了解抱犊崮的有关知识.然后观察小强绘制的图象,从中获取两个变量之间关系的信息,叙述一天情境时,学生还是存在困惑,教师不要急着提示,进而指出这就是本节课要继续学习的内容——用图象表示的变量间关系.复习导入图3-3-15问题1:我们已经学习了哪几种表示变量之间关系的方法?问题2:某种西瓜子每千克2元,小明购买西瓜子的总价y元与购买的数量x千克之间有什么关系?(1)用表格的形式表示总价y与数量x的关系:(2)试写出y与x的关系式__y=2x__;(3)在下面的图象中能够正确表示总价y与数量x关系的图象是(C)图3-3-16说明:让学生通过表格、关系式、图象三种方式来表示西瓜子的总价与购买的数量之间的关系,旨在复习三种表示变量间关系的方法,并初步感受三种方法各自的优越性,为本节课的学习做好铺垫.建议:三种表示变量之间关系的方法可让学生快速回答,然后学生独立完成问题2中的三个题目,教师出示答案,及时纠正.教材母题挖掘74页随堂练习第2题一辆公共汽车从车站开出,加速行驶一段后开始匀速行驶.过了一段时间,汽车到达下一个车站.乘客上、下车后汽车开始加速,一段时间后又开始匀速行驶.下面的哪一幅图可以近似地刻画出汽车在这段时间内的速度变化情况?图3-3-17【模型建立】分析变量图形时要明确自变量和因变量,更要清楚每一个点对应的变量和它表示的实际意义以及整个图象变化的趋势,其中比较特殊的是当图象与横轴平行时,说明在对应的自变量的范围内因变量不发生变化.【变式变形】1.如图3-3-18,在直径为AB 的半圆O 上有一动点P 从点A 出发,按顺时针方向绕半圆匀速运动到点B ,然后再以相同的速度沿着直径回到点A 停止,线段OP 的长度d 与运动时间t 之间的函数关系用图象描述大致是(A )图3-3-18图3-3-19.如图3-3-19,爸爸从家(点O)出发,沿着扇形AOB 上OA →AB ︵→BO 的路径去匀速散步.设爸爸距家(点O)的距离为s ,散步的时间为t ,则下列各图中,能大致刻画s 与t 之间函数关系的图象是(C )图3-3-20图3-3-21.万州某运输公司的一艘轮船在长江上航行,往返于万州、朝天门两地.假设轮船在静水中的速度不变,长江的水流速度不变,该轮船从万州出发,逆水航行到朝天门,停留一段时间(卸货、装货、加燃料等)又顺水航行返回万州,若该轮船从万州出发后所用的时间为x(时),轮船距万州的距离为y(千米),则下列各图中,能反映y 与x 之间函数关系的大致图象是(C )图3-3-214.2013年“中国好声音”全国巡演重庆站在奥体中心举行.童童从家出发前往观看,先匀速步行至轻轨车站,等了一会儿,童童搭乘轻轨至奥体中心观看演出,演出结束后,童童搭乘邻居刘叔叔的车顺利到家.其中x表示童童从家出发后所用的时间,y表示童童离家的距离.下图能反映y与x的函数关系式的大致图象是(A)图3-3-22图3-3-235.甲、乙两人在一次百米赛跑中,路程s(米)与赛跑时间t(秒)的关系如图3-3-23所示,则下列说法正确的是(B)A.甲、乙两人的速度相同B.甲先到达终点C.乙用的时间短D.乙比甲跑的路程多6.小红的爷爷每天坚持体育锻炼,某天他慢步行走到离家较远的公园,打了一会儿太极拳,然后沿原路跑步到家里,下面能够反映当天小红爷爷离家的距离y(米)与时间x(分)之间的关系的大致图象是(C)图3-3-24图3-3-257.某城市为了节约用水,采用分段收费标准,若某用户居民每月应交水费y(元)与用水量x(吨)之间的关系如图3-3-25所示,根据图象回答:(1)该市自来水收费时,每户用水不足5吨时,每吨收费多少元?超过5吨时,超过的部分每吨收费多少元?(2)若某用户居民某月用水3.5吨,应交水费多少元?若某月交水费17元,该用户用水多少吨?解:(1)由图象可知:当x =5时,y =10,所以用水不足5吨时,每吨交费105=2(元);当x =8时,y =20.5,故超过5吨部分每吨交水费20.5-108-5=3.5(元).(2)因为x =3.5<5,所以y =3.5×2=7(元);若交17元水费,则用水5+17-103.5=7(吨).考情考向分析利用图象分析、体现变量变化的趋势结合图象中每个点对应的自变量和因变量,可以得到变量变化的趋势,一般是随着自变量的变大(图象从左向右),图象对应的因变量的值的变化情况(上升为变大,下降为变小).如课本第79页复习题第11题.例1 某人匀速跑步到公园,在公园里某处停留了一段时间,再沿原路匀速步行回家,此人离家的距离y 与时间x 的关系的大致图象是(B )图3-3-26例2 图3-3-27中所反映的过程是:张强从家跑步去体图3-3-27育场,在那里锻炼了一阵后,又去早餐店吃早餐,然后散步走回家,其中x 表示时间,y 表示张强离家的距离.根据图象提供的信息,以下四个说法错误的是(C )A .体育场离张强家2.5千米B .张强在体育场锻炼了15分钟C .体育场离早餐店4千米D .张强从早餐店回家的平均速度是3千米/时 利用图象给出的信息计算用图象表示变量之间的关系时,每一个点都有一定的实际意义,过图象上一点向横轴作垂线,垂足对应的数就是自变量,向纵轴作垂线,垂足对应的数就是对应的因变量.图3-3-28例王大爷带了若干千克自产的土豆进城出售,为了方便,他带了一些零钱备用,按市场价出售一些后,又降价出售,售出土豆的千克数x与他手中持有的钱数y(含备用零钱)的关系如图3-3-28所示.根据图象回答下列问题:(1)王大爷自带的零钱是多少?(2)降价前他每千克土豆出售的价格是多少?(3)降价后他按每千克0.4元将剩余土豆售完,这时他手中的钱(含备用零钱)是26元,问他一共带了多少千克土豆?解:(1)根据图象可知王大爷自带的零钱是5元.(2)降价前,每千克土豆的价格是(20-5)÷30=0.5(元).(3)降价前,他一共卖了30千克土豆,手中的钱有20元;降价后,他卖完剩余的土豆,手中的钱有26元,降价后他收入了26-20=6(元),按每千克0.4元卖出,他卖出了6÷0.4=15(千克)土豆,他一共带的土豆有30+15=45(千克).素材四教材习题答案P74随堂练习1.柿子熟了,从树上落下来,下面的哪一幅图可以大致刻画出柿子下落过程中(即落地前)的速度变化情况?解:(3).2.一辆公共汽车从车站开出,加速行驶一段后开始匀速行驶. 过了一段时间,汽车到达下一个车站.乘客上、下车后汽车开始加速,一段时间后又开始匀速行驶.下面的哪一幅图可以近似地刻画出汽车在这段时间内的速度变化情况?解:(2).P74习题3.41.根据图3-7填写下面的表格:解:2.亮亮今天发烧了,早晨他烧得很厉害,吃过药后感觉好多了,中午时亮亮的体温基本正常.但是下午他的体温又开始上升,直到夜里亮亮才感觉身上不那么发烫了.下面哪一幅图能较好地刻画出亮亮今天体温的变化情况?解:(3).3.下面的图表示小明放学回家途中骑车速度与时间的关系,你能想象出他回家路上的情境吗?解:小亮刚出校门时加速行驶一段后改成匀速行驶,在离家不远处减速行驶,到家后停下.4.小明站在离家不远的公共汽车站等车.图中哪一个图能最好地刻画等车这段时间离家距离与时间的关系?解:(3).图书增值练习专题一曲线型图象1.温度的变化是人们经常谈论的话题.请你根据图象,讨论某地某天温度变化的情况如图所示:(1)上午10时的温度是度,14时的温度是度;(2)这一天最高温度是度,是在时达到的;最低温度是度,是在时达到的;(3)这一天从最低温度到最高温度经过了小时;(4)温度上升的时间范围为,温度下降的时间范围为;(5)你预测次日凌晨1时的温度是.2.如图,水以恒速(即单位时间内注入水的体积相同)注入下面四种底面积相同的容器中.(1)请分别找出与各容器对应的水的高度h和时间t的变化关系的图象,用直线段连接起来;(2)当容器中的水恰好达到一半高度时,请在关系图的t轴上标出此时t值对应点T的位置.专题二折线型图象1.如图,表现了一辆汽车在行驶途中的速度随时间的变化情况.(1)A、B两点分别表示汽车是什么状态?(2)请你分段描写汽车在第0分钟到第19分钟的行驶状况.(3)司机休息5分钟后继续上路,加速1分钟后开始以60 km/h的速度匀速行驶,5分钟后减速,用了2分钟汽车停止,请在原图上画出这段时间内汽车的速度与时间的关系图.【知识要点】图象法:用图象来表示两个变量之间的关系的方法叫做图象法.在用图象法表示变量之间的关系时,通常用水平方向的数轴(称为横轴)上的点表示自变量,用竖直方向的数轴(称为纵轴)上的点表示因变量,图象上每个点都表示自变量和因变量之间的相互关系.【温馨提示】图象法能直观、形象地描述两个变量之间的关系,但只是反映两个变量之间的关系的一部分,而不是整体,且由图象确定的数值往往是近似的.【方法技巧】1.借助图象,过某点分别向横轴、纵轴作垂线可以知道自变量取某个值时,因变量取什么值.1.借助图象可判断因变量的变化趋势:图象自左向右是上升的,则说明因变量随着自变量的增大而增大,图象自左向右是上升下降的,则说明因变量随着自变量的增大而增大减小,图象自左向右是与横轴平行的,则说明因变量在自变量的增大的过程中保持不变.答案:1.(1)4 10(2)10 14 -2 4(3)12(4)4 h~14 h 0 h~4 h和14 h~24 h(5)1℃2.解:(1)对应关系连接如下:(2)当容器中的水恰好达到一半高度时,关系图上T的位置如上图.3.解:(1)A点表示匀速运动,B点表示停止;(2)0到3分钟加速,3到12分钟匀速,速度为90 km/h,12到15分钟减速,减到约每小时20千米,后再匀速到18分钟开始减速,19分钟运动停止.(3)司机休息5分钟后的运动情况如图所示.素材六数学素养提升情景中图象信息题将实际生活中蕴涵的变量关系,用图形的方式呈现出来,图文并茂,富有生活气息,不仅提高我们从图形中获取信息的能力,而且是数形结合思想应用的重要体现,请看举例..例1商店里把塑料凳整齐地叠放在一起,据图1的信息,解答下列问题(1)当有10张塑料凳整齐地叠放在一起时的高度是多少?(2)求叠放塑料凳的个数x(个)与叠放的高度y(cm)之间的变量关系?图1分析:本题是一道图形信息试题,从图形观察可知:三个塑料凳的叠放在一起的高度是29cm,此时的29cm 包括凳子腿的高度和三个凳子面的厚度;五个塑料凳叠放在一起的高度为35cm,此时的35cm包括凳子腿的高度和5个塑料凳面的厚度.由此可知两个凳子面的厚度为35-29=6cm.所以一个凳子面的厚度为3cm,三个凳子叠放在一起高度减去三个凳子面的厚度,即可29-3×3=20为凳子腿的高度.这样可以求解(1),(2)两问.解:(1)观察图形,可得一个凳子面的厚度为3cm,凳子腿的高度为20cm.所以叠放10个凳子的高度为10×3+20=50cm;(2)y与x之间的关系为y=3x+20.评注:解决本题需要仔细观察图形中的数据信息以及塑料凳叠放的特征,根据这些特征确定一个凳子面的厚度以及凳子腿的高度 .例2请根据图2中给出的信息,解答下列问题:图2(1)放入一个小球量筒中水面升高 cm;(2)求放入小球后量筒中水面的高度y(cm)与小球个数x(个)之间的关系式;(3)量筒中至少放入几个小球时有水溢出?分析:本题是图形信息问题,解决问题需要从图形中正确得到解题信息,从前两个量筒可以观察到,当放入三个球时,水面增加6cm,这样可得到放入一个球水上升的高度,由此可得到放x个球时,水面高度y与x之间的关系式.解: (1)(36-30)÷3=2; 即放入一个小球量筒中水面升高2cm.(2) 放入小球后量筒中水面的高度y(cm)与小球个数x(个)之间的一次函数关系式y=30+2x(3) 当y=49时,30+2x=49,x=9.5, 所以至少放入10个小球时有水溢出.评注:解决图形信息问题,其关键是认真观察图形中的信息,从图形中发现存在的数量关系.。
视觉检测技术-习题参考答案

视觉检测技术-习题答案1-1 何为计算机视觉?能够解释图像,实现类似人类视觉系统理解外部世界的机器系统称为计算机视觉或机器视觉。
1-2计算机视觉能够完成的四种基本任务是什么?尺寸和表面特征的检测;目标的识别和定位。
1-3制约计算机视觉技术应用水平的两大基础是什么?1)包括数字图像处理的视觉理论和算法;2)微电子技术1-4计算机视觉和视觉检测是什么关系?(无标准答案,根据自己的理解进行归纳、概括即可。
)以检测为目的的计算机视觉应用称为视觉检测。
视觉检测是计算机视觉内容的一部分。
第二章习题(人类视觉)2-1 做一个简单实验。
将视轴与观测书页的法线平行,给出高清晰观察区域的尺度范围。
2-2 人类视觉系统由几部分组成?各部分的功能是什么?三个部分:眼球、神经传输系统及大脑的视觉中枢;各部分作用是:光学成像、影象摄取或采集、影象信号的传输、影象信号、信息处理。
2-3 分别举出一个证明视觉空间分辨率和时间分辨率的实例。
并解释视觉区域时间分辨率不同的生理机制(生物物理原因)。
2-4 两种感受野的什么特性有利于检测影像的边缘?2-5 何为马赫带?其形成的生物学基础是什么?2-6 在夜间观赏烟火时,观察到得什么现象可以用视觉动态响应特性进行解释。
2-7 一粉笔沿轴向快速从眼前掠过留下的是什么影像,为什么?第三章习题(图象的基本知识)3-1 物体表面上某一点(小区域)的灰度(或亮度)与那些因素或分量有关?是什么关系?-语言陈述,列写公式3-2 伪彩色图象处理的目的是什么?为什么该处理方法可以实现这样一个目的?-从人类视觉对灰度和彩色的分辩能力谈起――。
3-3 假彩色图像处理的目的和任务是什么?概括:1)降低人类对对彩色区域的分辩难度;2)开展人类视觉的光谱范围。
3-4 请给出灰度直方图的两种应用。
①用于判断图像量化是否恰当。
②用于确定图像二值化的阈值。
③用于区域分割和面积计算。
3-5 黑白图像、普通灰度图像的灰度取值范围是多少?彩色图像中一个象素的颜色需要用多少个bit来表示?――每两个F表示一种基色,――24位,-3-6 结合三相CCD电荷包转移过程图,补充画出在满足t2<t2.5<t3的t2.5时刻的电荷转移示意图。
数字图像处理及应用智慧树知到答案章节测试2023年长安大学

绪论单元测试1.数字图像处理泛指通过计算机对数字图像进行处理,涉及图像增强、图像复原、图像分割等内容。
()A:错B:对答案:B2.数字图像处理的优点包括()。
A:处理效果可控B:数据量小C:容易存储D:可重现性好答案:ACD3.数字图像处理系统包含()。
A:图像处理和分析B:图像存储C:图像传输D:图像输入E:图像输出答案:ABCDE4.人眼感受到的明亮程度,称作亮度,是一种主观感受。
()A:对B:错答案:A5.数字图像处理的研究内容中,()的目的是根据二维平面图像数据构造出物体的三维图像。
A:图像重建B:图像分割C:图像增强D:图像复原答案:A第一章测试1.一幅256X256的图像,若灰度级数为16,则存储它所需的比特数是( )。
A:1MB:512KC:2MD:256K答案:D2.图像中虚假轮廓的出现就其本质而言是由于( )。
A:图像的空间分辨率过高造成B:图像的空间分辨率不够高造成C:图像的灰度级数不够多造成的D:图像的灰度级数过多造成的答案:C3.m邻接可以消除由8邻接引起的像素间通路的二义性。
()A:对B:错答案:A4.常用的插值算法有()。
A:均匀插值B:最近邻插值C:双线性插值D:双三次插值答案:BCD5.对单幅图像进行处理,仅改变像素空间位置的运算是()。
A:几何运算B:算术运算C:逻辑运算D:集合运算答案:A第二章测试1.下列算法中属于点运算的是()。
A:傅里叶变换B:梯度锐化C:二值化D:直方图均衡答案:CD2.直方图均衡的目的是将图像的直方图变换为均匀分布的直方图。
()A:错B:对答案:B3.一幅图像的直方图均值较小而方差较大,意味着()。
A:图像较暗,对比度较大B:图像较暗,对比度较小C:图像较亮,对比度较小D:图像较亮,对比度较大答案:A4.下列算法中属于平滑运算的是()。
A:Laplacian增强B:中值滤波C:直方图均衡D:梯度锐化答案:B5.()可以较好地去除椒盐噪声。
数字图像处理试题集(终版)剖析

第一章引言一.填空题1. 数字图像是用一个数字阵列来表示的图像。
数字阵列中的每个数字,表示数字图像的一个最小单位,称为_像素_。
2. 数字图像处理可以理解为两个方面的操作:一是从图像到图像的处理,如图像增强等;二是_从图像到非图像的一种表示_,如图像测量等。
3. 数字图像处理可以理解为两个方面的操作:一是_从图像到图像的处理_,如图像增强等;二是从图像到非图像的一种表示,如图像测量等。
4. 图像可以分为物理图像和虚拟图像两种。
其中,采用数学的方法,将由概念形成的物体进行表示的图像是虚拟图像_。
5. 数字图像处理包含很多方面的研究内容。
其中,_图像重建_的目的是根据二维平面图像数据构造出三维物体的图像。
二.简答题1. 数字图像处理的主要研究内容包含很多方面,请列出并简述其中的5种。
①图像数字化:将一幅图像以数字的形式表示。
主要包括采样和量化两个过程。
②图像增强:将一幅图像中的有用信息进行增强,同时对其无用信息进行抑制,提高图像的可观察性。
③图像的几何变换:改变图像的大小或形状。
④图像变换:通过数学映射的方法,将空域的图像信息转换到频域、时频域等空间上进行分析。
⑤图像识别与理解:通过对图像中各种不同的物体特征进行定量化描述后,将其所期望获得的目标物进行提取,并且对所提取的目标物进行一定的定量分析。
2. 什么是图像识别与理解?图像识别与理解是指通过对图像中各种不同的物体特征进行定量化描述后,将其所期望获得的目标物进行提取,并且对所提取的目标物进行一定的定量分析。
比如要从一幅照片上确定是否包含某个犯罪分子的人脸信息,就需要先将照片上的人脸检测出来,进而将检测出来的人脸区域进行分析,确定其是否是该犯罪分子。
4. 简述数字图像处理的至少5种应用。
①在遥感中,比如土地测绘、气象监测、资源调查、环境污染监测等方面。
②在医学中,比如B超、CT机等方面。
③在通信中,比如可视电话、会议电视、传真等方面。
④在工业生产的质量检测中,比如对食品包装出厂前的质量检查、对机械制品质量的监控和筛选等方面。
第三章第2节第4课时酸碱中和滴定+课件22人教版(2019版)高中化学反应原理(选择性必修1)

人教版(2019版) 化学化学反应原理第三章 水溶液中的离子反应与平衡第一节 电离平衡第1课时 强、弱电解质及其电离(1)概念依据 ,用 的酸(或碱)来测定 的碱(或酸)的方法。
(2)原理在中和反应中,酸提供的H +与碱提供的OH -的 相等,即:已知浓度中和反应未知浓度物质的量【学习任务一】概念和原理(1)仪器:滴定管,铁架台,滴定管夹, , 。
仪器a是 ,仪器b是_____ 。
精确度: mL。
锥形瓶烧杯酸式滴定管碱式滴定管0.012.主要仪器及使用用0.01 mol·L -1硫酸滴定0.01 mol·L -1 NaOH 溶液,中和后加水至100 mL 。
若滴定时终点判断有误差:①多加了1滴硫酸;②少加了1滴硫酸(设1滴为0.05 mL)。
则①和②中pH 相差________。
4一、指示剂的选择指示剂变色范围(颜色与pH 的关系)石蕊<5.0 色 5.0~8.0紫色>8.0 色酚酞<8.2 色8.2~10.0浅红色>10.0 色甲基橙<3.1 色 3.1~4.4橙色>4.4色酸碱指示剂法(只能测定溶液的pH范围)(1)当滴定终点为碱性时,选择酚酞;(2)当滴定终点为酸性时,选择甲基橙;(3)。
红蓝无红红黄常见酸碱指示剂的变色范围:控制活塞锥形瓶内溶液颜色变化摇动锥形瓶①滴速:先快后慢,当接近终点时,改为滴加半滴标准溶液(利用锥形瓶内壁承接尖嘴处悬挂的半滴溶液)。
②终点的判断:滴入最后半滴标准液,指示剂变色,且在30s内不变色,视为滴定终点。
(1)锥形瓶在水洗后,要用待测液润洗2~3次( )(2)酸碱中和滴定实验一般不用石蕊作指示剂,是因为石蕊变色不明显( )(3)滴定实验中左手控制滴定管的活塞,右手摇动锥形瓶( )(4)当观察到锥形瓶中颜色发生变化,立即停止滴定并记下滴定管液面读数( )(5)量取20.00 mL待测液时可用量筒量取( )×√√×正误判断×三、中和滴定误差分析分析依据见黑板步骤操作V标准c待测洗涤酸式滴定管未用标准溶液润洗__________碱式滴定管未用标准溶液润洗__________锥形瓶用待测溶液润洗__________锥形瓶洗净后还留有蒸馏水____________取液放出碱液的滴定管开始有气泡,放出液体后气泡消失__________常见的误差分析以用标准盐酸滴定待测氢氧化钠溶液为例:变大偏高变小偏低变大偏高不变无影响变小偏低滴定酸式滴定管滴定前有气泡,滴定终点时气泡消失__________振荡锥形瓶时部分液体溅出__________部分酸液滴出锥形瓶外__________溶液颜色较浅时滴入酸液过快,停止滴定后再加一滴NaOH溶液无变化__________读数滴定前读数正确,滴定后俯视读数(或前仰后俯)__________滴定前读数正确,滴定后仰视读数(或前俯后仰)__________变大偏高变小偏低变大偏高变大偏高变小偏低变大偏高(1)称量固体NaOH时,未调节天平的零点( )1.称取一定质量的NaOH来测定未知浓度的盐酸时(NaOH放在锥形瓶内,盐酸放在滴定管中)。
数字图像处理第三章二值图像

图 3.13a 4邻点 中轴变换举例 中轴可作为物体的一种简洁表示.
图3.13b表明少量噪声会使中轴变换结果产 生显著的差异.
图 3.13b 中轴变换举例
3.5.7 细化
细化是把区域缩成线条、逼近中心线(骨架或核线)的一种图 像处理。细化的目的是减少图像成份,直到只留下区域的最基 本信息,以便进一步分析和识别.虽然细化可以用在包含任何 区域形状的二值图像,但它主要对细长形(而不是凸圆形或水滴 状)区域有效.细化一般用于文本分析预处理阶段,以便将文本 图像中线条图画或字符笔画表示成单像素线条.
d=i-j+m-1
二值图像及其对 角线上的投影图
3.4游程长度编码 (run-length encoding)
用图像像素值连续为1的个数来描述图像,有两种方法: (1)用1的起始位置和1的游程长度; (2)仅仅使用游程长度,0:表示从0象素开始 ; 例:
1的游程:(2,2)(6,3)(13,6)(20,1) (4,6)(11,10) (1,5 )(11,1)(17,4)
洞
`S
(7) 边界
S的边界是S中与`S中有4连通关系的像素集合S '
(8) 内部
S中不属于它的边界的像素集合. S的内部等于S - S '
(9) 包围
如果从S中任意一点到图像边界的4路径必须与区域T相 交,则区域 T 包围区域 S(或S在T内)
S `S
边界
内部 包围
例:一幅二值图像
图像 边界
3.5.2 连通成分标记算法
(2) 路径
列:
[路i0径,j0 :]从[像,i1,素j1][i0 ,, j,0[]in 到,j像n]素,[[iikn
,
,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章二值图像分析一幅数字图像是一个二维阵列,阵列元素值称为灰度值或强度值.实际上,图像在量化成数字图像前是一个连续强度函数的集合,场景信息就包含在这些强度值中.图像强度通常被量化成256个不同灰度级,对某些应用来说,也常有32、64、128或512个灰度级的情况,在医疗领域里甚至使用高达4096(12bits)个灰度级.很明显,灰度级越高,图像质量越好,但所需的内存也越大.在机器视觉研究的早期,由于内存和计算能力非常有限,而且十分昂贵,因此视觉研究人员把精力主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上.人们注意到,人类视觉在理解仅由两个灰度级组成的线条、轮廓影像或其它图像时没有任何困难,而且应用场合很多,这一点对研究二值视觉系统的研究人员是一个极大的鼓舞.随着计算机计算能力的不断增强和计算成本的不断下降,人们普遍开始研究基于灰度图像、彩色图像和深度图像的视觉系统.尽管如此,二值视觉系统还是十分有用的,其原因如下:⑴计算二值图像特性的算法非常简单,容易理解和实现,并且计算速度很快.⑵二值视觉所需的内存小,对计算设备要求低.工作在256个灰度级的视觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八倍.如若利用游程长度编码等技术(见3.4节)还可使所需内存进一步减少.由于二值图像中的许多运算是逻辑运算而不是算术运算,所以所需的处理时间很短.(3)许多二值视觉系统技术也可以用于灰度图像视觉系统上.在灰度或彩色图像中,表示一个目标或物体的一种简易方法就是使用物体模板(mask),物体模板就是一幅二值图像,其中1表示目标上的点,0表示其它点.在物体从背景中分离出来后,为了进行决策,还需要求取物体的几何和拓扑特性,这些特性可以从它的二值图像计算出来.因此,尽管我们是在二值图像上讨论这些方法,但它们的应用并不限于二值图像.一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地控制时,二值视觉系统是非常有用的.当使用特殊的照明技术和背景并且场景中只有少数物体时,物体可以很容易地从背景中分离出来,并可得到较好的轮廓,比如,许多工业场合都属于这种情况.二值视觉系统的输入一般是灰度图像,通常使用阈值法首先将图像变成二值图像,以便把物体从背景中分离出来,其中的阈值取决于照明条件和物体的反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性,在许多应用中,这种特性对识别物体来说是足够的.二值视觉系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用. 在下面的讨论中,假定二值图像大小为n m ⨯,其中物体像素值为1,背景像素值为0.3.1 阈值视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割,即把图像],[j i F 划分成区域k p p p ,,,21⋅⋅⋅,使得每一个区域对应一个候选的物体.下面给出分割的严格定义.定义 分割是把像素聚合成区域的过程,使得:● ==i ki P 1 整幅图像 (}{i P 是一个完备分割 ).● j i P P j i ≠∅=, ,(}{i P 是一个完备分割).● 每个区域i P 满足一个谓词,即区域内的所有点有某种共同的性质.● 不同区域的图像,不满足这一谓词.正如上面所表明的,分割满足一个谓词,这一谓词可能是简单的,如分割灰度图像时用的均匀灰度分布、相同纹理等谓词,但在大多数应用场合,谓词十分复杂.在图像理解过程中,分割是一个非常重要的步骤.二值图像可以通过适当地分割灰度图像得到.如果物体的灰度值落在某一区间内,并且背景的灰度值在这一区间之外,则可以通过阈值运算得到物体的二值图像,即把区间内的点置成1,区间外的点置成0.对于二值视觉,分割和阈值化是同义的.阈值化可以通过软件来实现,也可以通过硬件直接完成.通过阈值运算是否可以有效地进行图像分割,取决于物体和背景之间是否有足够的对比度.设一幅灰度图像],[j i F 中物体的灰度分布在区间],[21T T 内,经过阈值运算后的图像为二值图像],[j i F T ,即:⎩⎨⎧≤≤=其它如果0],[ 1],[21T j i F T j i F T(3.1)如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为:⎩⎨⎧∈=其它如果0],[ 1],[Z j i F j i F T(3.2)其中Z 是组成物体各部分灰度值的集合.图3.1是对一幅灰度图像使用不同阈值得到的二值图像输出结果.阈值算法与应用领域密切相关.事实上,某一阈值运算常常是为某一应用专门设计的,在其它应用领域可能无法工作.阈值选择常常是基于在某一应用领域获取的先验知识,因此在某些场合下,前几轮运算通常采用交互式方式来分析图像,以便确定合适的阈值.但是,在机器视觉系统中,由于视觉系统的自主性能(autonomy )要求,必须进行自动阈值选择.现在已经研究出许多利用图像灰度分布和有关的物体知识来自动选择适当阈值的技术.其中的一些方法将在3.2节介绍.图3.1 一幅灰度图像和使用不同阈值得到的二值图像结果.上左:原始灰度图像,上右:阈值T=100;左下:T=128.右下:T1=100|T2=128.3.2 几何特性 通过阈值化方法从图像中检测出物体后,下一步就要对物体进行识别和定位.在大多数工业应用中,摄像机的位置和环境是已知的,因此通过简单的几何知识就可以从物体的二维图像确定出物体的三维位置.在大多数应用中,物体的数量不是很多,如果物体的尺寸和形状完全不同,则可以利用尺度和形状特征来识别这些物体.实际上在许多工业应用中,经常使用区域的一些简单特征,如大小、位置和方向,来确定物体的位置并识别它们.3.2.1 尺寸和位置一幅二值图像区域的面积(或零阶矩)由下式给出:∑∑-=-==1010],[n i m j j i B A (3.3)在许多应用中,物体的位置起着十分重要的作用.工业应用中,物体通常出现在已知表面(如工作台面)上,而且摄像机相对台面的位置也是已知的.在这种情况下,图像中的物体位置决定了它的空间位置.确定物体位置的方法有许多,比如用物体的外接矩形、物体矩心(区域中心)等来表示物体的位置.区域中心是通过对图像进行“全局”运算得到的一个点,因此它对图像中的噪声相对来说是不敏感的.对于二值图像,物体的中心位置与物体的质心相同,因此可以使用下式求物体的中心位置:∑∑∑∑∑∑∑∑-=-=-=-=-=-=-=-=-==1010101010101010],[],[],[],[n i n i m j m j n i m j n i m j j i iB j i B y j i jB j i B x (3.4)其中x 和y 是区域相对于左上角图像的中心坐标.物体的位置为:Aj i iB y Aj i jB x n i m j n i m j ∑∑∑∑-=-=-=-=-==10101010],[],[ (3.5)这些是一阶矩.注意,由于约定y 轴向上,因此方程3.4和3.5的第二个式子的等号右边加了负号.3.2.2 方向 计算物体的方向比计算它的位置稍微复杂一点.某些形状(如圆)的方向不是唯一的,为了定义唯一的方向,一般假定物体是长形的,其长轴方向被定义为物体的方向.通常,二维平面上与最小惯量轴同方向的最小二阶矩轴被定为长轴.图像中物体的二阶矩轴是这样一条线,物体上的全部点到该线的距离平方和最小.给出一幅二值图像],[j i B ,计算物体点到直线的最小二乘方拟合,使所有物体点到直线的距离平方和最小:χ220101==-=-∑∑r B i j ij j m i n [,] (3.6)其中r ij 是物体点],[j i 到直线的距离.为了避免直线处于近似垂直时所出现的数值病态问题,人们一般把直线表示成极坐标形式:θθρsin cos y x +=(3.7)如图3.2所示,θ是直线的法线与x 轴的夹角,ρ是直线到原点的距离.把点),(j i 坐标代入直线的极坐标方程得出距离r :22)sin cos (ρθθ-+=y x r(3.8)图3.2 直线的极坐标表示将方程3.8代入方程3.6并求极小化问题,可以确定参数ρ和θ:∑∑-=-=-+=101022],[)sin cos (n i m j ij ij j i B y x ρθθχ (3.9)令2χ对ρ的导数等于零求解ρ得:)sin cos (θθρy x += (3.10) 它说明回归直线通过物体中心),(y x .用这一ρ值代入上面的2χ,则极小化问题变为:θθθθχ222sin cos sin cos c b a ++= (3.11) 其中的参数:],[)(],[))((2],[)(10210101010102j i B y y c j i B y y x x b j i B x x a n i m j ij n i m j ij ij n i m j ij ∑∑∑∑∑∑-=-=-=-=-=-=-=--=-=(3.12)是二阶矩.表达式2χ可重写为:θθχ2sin 212cos )(21)(212b c a c a +-++= (3.13) 对2χ微分,并置微分结果为零,求解θ 值:c a b -=θ2tan (3.14) 因此,惯性轴的方向由下式给出: 2222)(2cos )(2sin c a b ca c ab b-+-±=-+±=θθ (3.15)所以由2χ的最小值可以确定方向轴.注意,如果c a b ==,0,那么物体就不会只有唯一的方向轴.物体的伸长率E 是2χ的最大值与最小值之比: minmax χχ=E (3.16) 3.2.3 密集度和体态比区域的密集度(compact )可用下面的式子来度量:2p AC =(3.17)其中,p 和A 分别为图形的周长和面积.根据这一衡量标准,圆是最密集的图形,其密集密度为最大值π4/1,其它一些图形的比值要小一些.让我们来看一下圆,当圆后仰时,形状成了一椭圆,面积减小了而周长却不象面积减小的那么快,因此密集度降低了.在后仰到极限角时,椭圆用中被用作为区域的一个特征.密集度的另一层意义是:在给定周长的条件下,密集度越高,围成的面积就越大.注意在等周长的情况下,正方形密集度大于长方形密集度.体态比定义为区域的最小外接矩形的长与宽之比,正方形和圆的体态比等于1,细长形物体的体态比大于1.图3.3所示的是几种形状的外接矩形.图3.3 几种外接矩形示意图3.3 投影给定一条直线,用垂直该直线的一簇等间距直线将一幅二值图像分割成若干条,每一条内像素值为1的像素个数为该条二值图像在给定直线上的投影(projection).当给定直线为水平或垂直直线时,计算二值图像每一列或每一行上像素值为1的像素数量,就得到了二值图像的水平和垂直投影,如图3.4所示.由于投影包含了图像的许多信息,所以投影是二值图像的一种简洁表示方式.显然,投影不是唯一的,同样的投影可能对应不同的图像.图3.4 一幅二值图像及其水平投影图在某些应用中,投影可以作为物体识别的一个特征.投影既是一种简洁的图像表示,又可以实现快速算法.下面介绍对角线投影的求解方法.对角线投影的关键是计算当前行和列对应的投影分布图位置标号.设行和列的标号分别用i和j表示.若图像矩阵为n行m列,则i和j 的范围分别为0到1-m.假设对角线的标号d用行和列的仿n和0到1-射变换(线性组合加上常数)计算,即:d+=+cbjai(3.18) 对角线投影共对应1-n个条,其中仿射变换把右上角像素映射成+m对角线投影的第一个位置,把左下角像素映射成最后一个位置,如图3.5所示,则当前行列对应的标号d的公式为:jid(3.19)=m--+1图3.5 二值图像及其对角线上的投影图3.4 游程长度编码游程长度编码(run-length encoding)是另一种二值图像的简洁表示方法,它是用图像像素值连续为1的个数(像素1的长度)来描述图像.这种编码已被用于图像传输.另外,图像的某些性质,如物体区域面积,也可以从游程长度编码直接计算出来.在游程长度编码中经常运用两种方法,一种是使用1的起始位置和1的游程长度,另一种是仅仅使用游程长度,但须从1的游程长度开始描述,如图3.6所示.1的游程(2,2)(6,3)(13,6)(20,1)(4,6)(11,10)(1,5 )(11,1)(17,4)1和0的游程长度:0,2,2,3,4,6,1,10,3,6,1,105,5,1,5,4图3.6 一幅简单二值图像的游程长度编码.如果用第二种方法来表示图像每行的游程长度,并用k i r ,代表图像第i 行的第k 个游程长度,则全部1的游程长度之和就是所求物体的面积. ∑∑-=⎥⎦⎤⎢⎣⎡-=+=1021012,n i m k k i i r A (3.20)其中i m 是第i 行游程个数,2/)1(-i m 取整,表示1的游程个数.由游程长度编码能很容易地计算水平投影而无需变成原来的图像.使用更巧妙的方法也能从游程长度编码计算出垂直和对角线投影.3.5 二值图像算法 从背景中分离出物体是一个困难的问题,在此将不讨论这个问题.这里假设物体可以从背景中分离,并且使用某一谓词,可以对图像中属于物体的点进行标记.因此,问题就变为如何将一幅图像中所有被标记的点组合成物体图像.这里还假设物体点在空间上是非常接近的.利用空间接近概念可以严格定义,利用此定义研究的算法可以把空间上非常接近的点聚合在一起,构成图像的一个成分(component ).下面首先引进一些定义,然后讨论有关算法.3.5.1 定义(1) 近邻 在数字图像中,一个像素在空间上可能非常接近其它一些像素.在用方格表示的数字图像中,一个像素与其它四个像素有公共边界,并与另外四个像素共享顶角.如果两个像素有公共边界,则把它们称为4-近邻(4-neighbors).同样,如果两个像素至少共享一个顶角,则称它们为8-近邻.例如,位于],[j i 的像素有四个4-近邻:],1[j i -,],1[j i +,]1,[-j i ,]1,[+j i .它的8-近邻包括这四个4-近邻,再加上]1,1[--j i ,]1,1[-+j i ,]1,1[+-j i ,]1,1[++j i[i-1, j ][i, j-1] [i, j ] [i, j+1][i+1, j ]连通(4-connected)关系,与它的8-近邻是8-连通关系(如图3.7).图3.7 矩形像素网格的4-近邻和8-近邻示意图.像素],[j i 位于图的中心.(2) 路径从像素],[00j i 到像素],[n n j i 的路径(path)是指一个像素序列],[00j i ,],[11j i ,..., ],[n n j i ,其中像素],[k k j i 是像素],[11++k k j i 的近邻像素,10-≤≤n k .如果近邻关系是4-连通的,则路径是4-路径;如果是8-连通的,则称为8-路径.图3.8即为路径的两个简单例子.图3.8 4-路径和8—路径示意图(3) 前景图像中值为1的全部像素的集合称为前景(foreground),用S 表示. (4) 连通性已知像素S q p ∈,,如果存在一条从p 到q 的路径,且路径上的全部像素都包含在S 中,则称p 与q 是连通的.注意,连通性(connectivity)是等价关系.对属于S 的任意三个像素p 、q 和r ,有下列性质:1. 像素p 与p 本身连通(自反性).2. 如果p 与q 连通,则q 与p 连通(互换性).3. 如果p 与q 连通且q 与r 连通,则p 与r 连通(传递性).(5) 连通成份一个像素集合,如果集合内的每一个像素与集合内其它像素连通,则称该集合为一个连通成份(connected component).(6) 背景⎺S(S的补集)中包含图像边界点的所有连通成份的集合称为背景(background).⎺S中所有其它元称为洞.考虑下面的两个图像.首先看左图中有几个洞和几个物体.如果从前景和背景来考虑4-连通,有四个大小为-个像素的物体和一个洞.如果考虑8-连通,那么有一个物体而没有洞.直观地,在这两种情况下出现了不确定性情况.右图为另一个类似的不确定问题.其中如果1是连通的,那么0就应该是不连通的.为了避免这种难以处理的情况,对物体和背景应使用不同的连通.如果我们对S使用8-连通,那么对⎺S就应使用4-连通.(7) 边界S的边界(boundary)是S中与⎺S中有4-连通关系的像素集合.边界通常记为S'.(8) 内部内部(interior)是S中不属于它的边界的像素集合.S的内部等于S-S'.(9) 包围如果从S中任意一点到图像边界的4-路径必须与区域T相交,则区域T包围(surrounds)区域S(或S在T内).图3.9即为一幅简单二值图像和它的边界、内部、包围示意图.图3.9 ,3.5.2连通成份标记在一幅图像中找出连通成份是机器视觉中最常见的运算之一.连通区域内的点构成表示物体的候选区域.机器视觉中的大多数物体都有表面,显然,物体表面点投影到图像平面上会形成空间上密集的点集.这里应该指出,连通成份算法常常会在二值视觉系统中形成瓶颈效应,原因是连通成份运算是一个全局性的运算,这种算法在本质上是序贯的.如果图像中仅有一个物体,那么找连通成份就没有必要;如果图像中有许多物体,且需要求出物体的特性与位置,则必须确定连通成份.连通标记算法可以找到图像中的所有连通成份,并对同一连通成份中的所有点分配同一标记.图3.10表示的是一幅图像和已标记的连通成份.在很多应用中,要求在标记连通成份的同时算出连通成份的特征,如尺寸、位置、方向和外接矩形.下面介绍两种连通成份标记算法:递归算法和序贯算法[Jain 1995].图3.10 一副图像及其连通成分图像(1)递归算法递归算法在串行处理器上的计算效率是很低的,因此,这一算法主要用于并行机上.算法3.1连通成份递归算法1.扫描图像,找到没有标记的1点,给它分配一个新的标记L.3.递归分配标记L给1点的邻点.3.如果不存在没标记的点,则停止.4.返回第一步.(2)序贯算法序贯算法通常要求对图像进行二次处理.由于这一算法一次仅运算图像的两行,因此当图像以文件形式存贮且空间不允许把整幅图像载入内存时也能使用这一算法.这一算法(见算法3.2)可以查看某一点的邻点,并且可以给像素值为1的邻点分配一个已经使用过的标记.如果图像的邻点有两种不同的标记,则用一个等价表(equivalent table)来记录所有的等价标记.在第二次处理过程中,使用这一等价表来给某一连通成份中所有像素点分配唯一的标记.本算法在从左到右、从上到下扫描图像时,算法仅能查询到某一像素点的4-近邻中的两个近邻点,即上点与左点.设算法已经查到了该像素的这两个近邻点,此时出现三种情况:(1) 如果这两个近邻点中没有一点为1,则该像素点需要一个新的标记.(2) 如果这两个近邻点中只有一点为1,且分配了标记L,那么该像素点的标记也为L.(3) 如果这两个邻点都为1,且已分配了标记L,则该像素点的标记还是L;但是当近邻点被分配了不同标记M与N,则这两个标记被用于了同一组元,应该把它们合并.在这种情况下,应把其中的一个标记(一般选用最小的那个标记)分配给该像素点,并在等价表中登记为等价标记.等价表包含了给每一连通成份分配唯一标记的信息.在第一次扫描中,所有属于同一连通成份的标记被视为是等价的.在第二次扫描中,从一个等价集(equivalent set)中选择一个标记并分配给连通成份中所有像素点.通常将最小的标记分配给一个连通成份.第二次扫描将给每一连通成份分配唯一的标记.在找到所有的连通成份后,应该统计等价表,以便删除其中的空格;然后将等价表作为查找表对图像重新进行扫描,以便重新统计图像中的标记.计算每一连通成份的面积、一阶矩、二阶矩是序贯连通成份算法的一个部分.当然,必须使用分离变量来累加每一区域的矩信息.当区域合并后,每一区域的矩累计值也应加到一起.算法3.24-连通序贯连通成份算法1.从左至右、从上到下扫描图像.2.如果像素点为1,则:(a) 如果上面点和左面点有一个标记,则复制这一标记.(b) 如果两点有相同的标记,复制这一标记.(c) 如果两点有不同的标记,则复制上点的标记且将两个标记输入等价表中作为等价标记.(d) 否则给这一个像素点分配一新的标记并将这一标记输入等价表.3.如果需考虑更多的点,则回到第二步.4.在等价表的每一等价集中找到最低的标记.5.扫描图像,用等价表中的最低标记取代每一标记.3.5.3 欧拉数在许多应用中,亏格数(genus)或欧拉数可作为识别物体的特征.亏格数定义为连通成份数减去空洞数,=(3.21)E-HC其中,E,C和H分别是欧拉数、连通成份数与空洞数.这个式子给出了一个简单的拓朴特征,这种拓扑特征具有平稳、旋转和比例不变特性.图3.11给出了一些例子及其对应的欧拉数.=EE2==E1-图3.11 字母“A”、“B”、“i”及它们的欧拉数.注意前景用了8-连通,而背景用了4-连通.3.5.4 区域边界连通成份S的边界是那些属于S且与⎺S邻接的点集.使用简单的局部运算就可找到边界点.在大多数应用中,我们都想用一特定的顺序跟踪边界点.一般的算法是按顺时针方向跟踪区域的所有点.此处讨论一个简单的边界跟踪算法.假定物体边界不在图像的边界上(即物体完全在图像内部),边界跟踪算法先选择一起始点Ss∈,然后跟踪边界直到回到起始点.这种算法概括在算法3.3中.这种算法对尺寸大于1个象素的所有区域都是有效的.用这种算法求区域8-邻点的边界如图3.12(a)所示.为了得到平滑的图像边界,可以在检测和跟踪图像边界后,利用边界点的方向信息来平滑边界。