深度图像的二值化

合集下载

图像位深度的名词解释

图像位深度的名词解释

图像位深度的名词解释图像是我们生活中常见的一种表现形式,它可以帮助我们记录和回顾美好的记忆,同时也成为许多专业领域中不可或缺的工具。

在数字图像处理中,图像位深度是一个重要的概念。

本文将对图像位深度进行详细解释,并探讨其在图像处理中的应用。

一、图像位深度的定义图像位深度,又称色彩深度或像素深度,用于描述一幅数字图像中每个像素所占的位数。

它反映了图像在色彩或灰度方面的表现能力。

通常用n位来表示一个像素的深度,其中n代表每个像素可以存储的不同值的数量。

位深度越高,图像能够表示的色彩或灰度级别也越多,图像的细节和质量就越高。

二、位深度的影响因素1. 像素色彩空间位深度的不同取决于像素颜色空间的选择。

在RGB色彩模式下,图像的每个像素可以由红、绿、蓝三原色组合而成,因此对于RGB图像,每个像素的位深度可以分别设定。

而在灰度图像中,像素只有一个通道,其位深度则是统一设定的。

2. 存储方式位深度还受到存储方式的限制。

在计算机中,图像可以以不同的格式进行存储,如位图、矢量图等。

每种存储方式都有其特定的表示规则和位深度设定。

三、常见的位深度常见的图像位深度有1位、8位、16位和32位等。

每种位深度都有其特定的应用领域和优劣势。

1. 1位位深度1位深度的图像仅能表达二值信息,即黑与白两种颜色。

由于其色彩表现能力极低,1位深度图像一般用于特定的领域,如二值化图像处理、印刷行业的制版等。

2. 8位位深度8位深度的图像可以表达256种不同的颜色或灰度级别。

这种位深度常用于网页图片、电子文档中的图片、个人摄影作品等。

由于其储存空间相对较小,8位图像在传输和保存时更为便捷。

3. 16位位深度16位深度的图像能够表现更多的细节和色彩层次,其色彩过渡更加平滑自然。

这使得16位图像在专业摄影、医学图像处理、计算机图形学等领域得到广泛应用。

4. 32位位深度32位深度的图像可以表达更多的色彩和图像信息,包括透明度、颜色饱和度等。

这种位深度常用于计算机生成图像、动画制作、特效合成等专业领域。

可微分二值化

可微分二值化

可微分二值化可微分二值化在很多计算机视觉领域的应用中,图像的二值化处理是一个至关重要的步骤。

而在深度学习的图像处理任务中,常常需要对真实图片进行二值化处理,以便更好地进行区分和分析。

可微分二值化是一种新的方法,用于将图像转换为黑白像素值为0和1,同时保留更多的信息,有助于提高图像处理的效率和准确性。

可微分二值化通过使用可微分的激活函数,将图像的灰度数据转换为二值化的数据形式。

与传统的阈值法相比,可微分二值化具有更好的可控性和鲁棒性。

它不仅可以通过调整阈值来灵活地控制图像的二值化效果,更可以根据实际任务需要,选择不同的激活函数来实现更好的结果。

可微分二值化的其中一个重要优势是,它能够在训练过程中自适应地学习最佳的阈值,并进行高效的优化。

传统的阈值法通常需要手动设置阈值,若选择的阈值有误,会直接导致图像处理结果的失真。

而可微分二值化通过计算出最小化训练误差的阈值,可以更加准确地进行二值化处理,大大降低了处理结果的误差和失真。

除了适用于普通的二值化任务之外,可微分二值化还可以广泛应用于其他图像处理及计算机视觉领域,例如文本检测、物体检测以及人脸识别等。

在文本检测任务中,将文本区域从背景区域中准确地分离出来是一个很困难的任务。

可微分二值化通过对文本图像的二值化处理,提取出文本的轮廓信息,有助于后期的文本检测及识别。

在物体检测任务中,通过将图像二值化来获取目标的轮廓信息,并进行特征提取和分类,能够实现高效的物体检测。

在实际应用中,可微分二值化可以解决传统方法中出现的过拟合和欠拟合等问题,具有更好的泛化能力和鲁棒性。

总的来说,可微分二值化是一种非常有用的图像处理方法,可以在不失精度的情况下,提高图像处理的效率和准确性。

它在许多计算机视觉领域中有着广泛的应用前景,未来将会有更多的研究和应用将其发展壮大。

opencv自适应二值化原理

opencv自适应二值化原理

opencv自适应二值化原理自适应二值化是指可以动态调整阈值的二值化方法。

与传统的全局固定阈值二值化方法不同,自适应二值化方法可以更好地处理图像中不同区域灰度值变化不同的情况。

在实际应用中,自适应二值化方法被广泛应用于数字图像处理、计算机视觉和机器学习等领域。

OpenCV是一个流行的计算机视觉库,其提供了自适应二值化的实现。

下面将介绍OpenCV自适应二值化的原理和使用方法。

1. 原理自适应二值化的原理就是在图像中划分若干个局部区域,对每个局部区域内像素灰度进行统计和分析,利用局部区域内像素灰度的均值或者中值来作为此区域的阈值进行二值化。

即对于同一幅图像的不同区域可以采用不同的二值化阈值。

自适应二值化的具体实现方法有两种:基于均值的方法和基于中值的方法。

两种方法都需要指定一个邻域大小,该大小通常为奇数,表示局部区域的大小。

2. OpenCV实现在OpenCV中,它提供了cv::adaptiveThreshold函数来实现自适应阈值二值化。

其函数原型如下:cv::adaptiveThreshold(InputArray src, OutputArray dst, double maxValue, int adaptiveMethod, int thresholdType, int blockSize, double C);函数说明:src: 输入图像,必须是单通道8位或32位浮点数。

dst: 输出图像,与源图像具有相同的大小和深度。

maxValue: 阈值的最大值,通常为255。

adaptiveMethod: 使用的自适应方法。

取值为:cv::ADAPTIVE_THRESH_MEAN_C:基于均值的方法。

cv::ADAPTIVE_THRESH_GAUSSIAN_C:基于高斯加权平均的方法。

thresholdType: 阈值的类型。

取值为:cv::THRESH_BINARY:二值化。

cv::THRESH_BINARY_INV:反二值化。

cv2.threshold 用法

cv2.threshold 用法

文章标题:深度解析cv2.threshold的用法在图像处理和计算机视觉的领域中,cv2.threshold是一个非常重要的函数,它经常被用来进行图像的二值化处理。

在本文中,我们将从简单的用法开始,逐步探讨cv2.threshold在图像处理中的广泛应用和深层次的原理。

1. cv2.threshold的基本用法在图像处理中,我们经常需要将一幅灰度图像转换为二值图像,以便于后续处理和分析。

cv2.threshold函数能够帮助我们实现这一目的。

它的基本用法非常简单:```pythonret, binary_image = cv2.threshold(gray_image, threshold_value, max_value, threshold_type)```其中,gray_image是输入的灰度图像,threshold_value是设定的阈值,max_value是输出的最大值,threshold_type是阈值化的类型。

2. cv2.threshold的参数解释和实际应用接下来,我们将深入解释每个参数的含义和实际应用场景。

首先是threshold_value,它代表了设定的阈值。

这个阈值的选择对于图像的二值化效果至关重要。

如果选择的阈值过高或过低,可能会导致图像细节丢失或噪声过多。

在实际应用中,我们通常需要根据图像的特点和需求来选择合适的阈值。

3. cv2.threshold的应用举例以下是一个实际的应用举例:假设我们需要对一张印刷体的黑白照片进行二值化处理,以便于后续文字识别。

我们可以使用cv2.threshold 函数,根据图像的灰度分布特点,选择合适的阈值进行二值化处理。

4. cv2.threshold的深层次原理除了基本的二值化处理外,cv2.threshold还可以根据不同的threshold_type参数实现各种不同的阈值化效果,比如大津法、自适应阈值等。

这些深层次的原理需要我们深入理解图像处理和统计学知识,以便在实际应用中选择合适的阈值类型。

阈值抖动算法

阈值抖动算法

阈值抖动算法阈值抖动算法是一种常用的图像处理算法,用于将一个较高的色彩深度图像转换为较低的色彩深度图像。

其原理是通过比较每一个像素的灰度值与一个预先设定的阈值,并根据比较结果将像素值转换为黑色或白色,从而实现图像的二值化。

阈值抖动算法的主要目的是在保留图像主要特征的同时,通过将灰度值分布范围较广的像素进行抖动处理,来近似表示较高色彩深度图像。

该算法常用于黑白打印或传真等情况下,可以有效减少颜色信息量,从而节省传输和存储空间。

阈值抖动算法的核心思想是将像素值与阈值进行比较,并根据比较结果决定像素值的最终结果。

具体操作步骤如下:1.像素灰度值获取:对于一个输入图像的每个像素,计算其灰度值。

灰度值的计算方式可以是简单的求和计算,也可以使用更复杂的颜色通道加权平均等方式。

2.阈值设定:设定一个阈值,该值可以是固定的常数,也可以是根据输入图像的特点进行动态调整。

阈值的设定直接影响到最终二值化图像的质量。

3.像素值比较:将每个像素的灰度值与阈值进行比较。

若灰度值大于等于阈值,则将像素值设为白色,否则设为黑色。

这一步实际上是将图像的连续灰度值映射为只有两种离散颜色,即黑色和白色。

4.误差传播:在将像素值设定为黑色或白色后,可以根据当前像素值与理论值之间的差异,将误差传播到周围的像素。

该过程有助于更好地保留原始图像的细节并减小抖动引起的伪影。

5.输出结果:将经过阈值比较和误差传播处理后的像素值输出为最终的二值化图像。

该图像只包含黑色和白色两种像素值,可用于后续处理或展示。

需要注意的是,阈值抖动算法的效果取决于阈值的选取以及误差传播的方式。

不同的阈值和传播方式会导致不同的图像质量和细节保留程度。

因此,在实际应用中,需要通过试验和评估来选择最适合的参数组合。

总结起来,阈值抖动算法是一种将高色彩深度图像转换为低色彩深度图像的图像处理算法。

其基本原理是通过设定阈值并比较像素灰度值,将图像像素转换为黑色或白色,并通过误差传播来减少抖动带来的伪影。

ocr识别的原理

ocr识别的原理

ocr识别的原理OCR(Optical Character Recognition)是一种通过光学设备将印刷或手写文本转换为可编辑和可搜索的电子文件的技术。

该技术通过图像处理和模式识别算法,将图像中的文字提取出来,并转化为计算机可识别的字符编码。

OCR识别的原理是通过对图像进行预处理、分割和识别等步骤,最终将文字转化为计算机可处理的文本。

OCR识别的第一步是图像预处理。

在这一步骤中,图像会经过一系列的处理操作,包括灰度化、二值化、去噪等。

灰度化将彩色图像转化为灰度图像,使得后续处理更加简化。

二值化将灰度图像转化为二值图像,即将图像中的文字部分变为黑色,背景部分变为白色。

去噪操作则是为了消除图像中的噪声,使得文字区域更加清晰。

接下来,OCR识别的第二步是文本分割。

在这一步骤中,识别系统会将二值图像中的文字区域与背景区域进行分离,以便后续的文字识别操作。

文本分割是OCR识别中的关键步骤之一,其准确性直接影响到文字识别的结果。

常用的文本分割方法包括投影法、边缘检测法、连通域法等。

通过这些方法,系统能够有效地将文字区域与背景区域进行分离。

然后,OCR识别的第三步是文字识别。

在这一步骤中,识别系统会将分割后的文字区域进行识别,将其转化为计算机可处理的字符编码。

文字识别是OCR识别的核心步骤,其准确性和效率对整个系统的性能有着重要影响。

常用的文字识别方法包括基于模板匹配的方法、基于统计模型的方法和基于深度学习的方法等。

这些方法通过对文字的形状、结构和上下文信息进行分析和学习,实现对文字的准确识别。

OCR识别的最后一步是后处理。

在这一步骤中,识别系统会对识别结果进行校正和修正,以提高整体的识别准确性。

后处理操作包括拼写检查、语法纠错、格式修正等。

通过这些操作,系统能够对识别结果进行进一步的优化和改进,提高文字识别的准确率和可靠性。

OCR识别的原理是通过图像处理和模式识别算法,将图像中的文字提取出来,并转化为计算机可识别的字符编码。

图像处理面试题

图像处理面试题

图像处理面试题在图像处理领域,面试官通常会问到一些基础知识和技术实践相关的问题。

以下是一些常见的图像处理面试题及其答案,供您参考。

1. 图像处理的定义是什么?图像处理是指对数字图像进行一系列的处理操作,以改善或增强图像的质量、提取感兴趣的信息、实现图像的压缩等目的。

图像处理可以应用于医学影像、数字摄影、计算机视觉等领域。

2. 什么是图像的灰度?图像的灰度是指每个像素点的亮度级别,也可以理解为图像的黑白程度。

在灰度图像中,亮度值通常从0(黑色)到255(白色)。

3. 图像处理中的直方图是什么?直方图是一种统计图表,用来表示图像中每个亮度级别的像素数量。

通过分析图像的直方图,可以了解图像的亮度分布情况,进而进行亮度调整、对比度增强等操作。

4. 图像的平滑处理是什么?图像的平滑处理是指通过一定的滤波方法,减少图像中的噪声并使图像变得更加光滑。

常用的平滑滤波器包括均值滤波器和高斯滤波器。

5. 图像的边缘检测是什么?图像的边缘检测是指通过一定的算法,找到图像中亮度变化较大的区域,即物体的边界。

常用的边缘检测算法包括Sobel、Canny等。

6. 什么是图像的二值化?图像的二值化是将图像转换为只有两个亮度值的图像,通常为黑色和白色。

二值化可以根据像素的亮度值进行阈值划分,对图像进行分割,常用于图像分割、目标提取等领域。

7. 什么是图像的缩放?图像的缩放是指改变图像的尺寸大小,包括放大和缩小。

缩放可以通过插值算法实现,常用的插值算法有最近邻插值、双线性插值等。

8. 图像的旋转是什么?图像的旋转是指改变图像的角度,使图像在平面内进行旋转变换。

旋转可以通过旋转矩阵实现,通过矩阵运算将原始图像的像素点映射到旋转后的位置。

9. 图像的特征提取是什么?图像的特征提取是指从图像中提取出具有代表性的特征,用于图像分类、目标识别等任务。

常用的图像特征包括颜色直方图、纹理特征、形状特征等。

10. 什么是卷积神经网络(CNN)?卷积神经网络是一种基于深度学习的图像处理算法,通过多层卷积和池化层进行图像特征提取和分类。

mmsegmentation 阈值

mmsegmentation 阈值

mmsegmentation 阈值【原创版】目录1.阈值的概念2.MMsegmentation 的概述3.MMsegmentation 中阈值的作用4.如何选择合适的阈值5.阈值对 MMsegmentation 效果的影响6.结论正文1.阈值的概念在图像处理领域,阈值是指一个数值,将图像中的像素点分为两个或多个区域。

这些区域通常具有不同的特征,如颜色、纹理等。

阈值处理是图像分割的一种方法,可以将图像中具有相似特征的像素点归为一类。

2.MMsegmentation 的概述MMsegmentation(多模态图像分割)是一种基于深度学习的图像分割方法。

它通过结合不同模态的图像信息(如 RGB、深度、纹理等),实现对图像的高精度分割。

相较于传统的图像分割方法,MMsegmentation 具有更好的性能和鲁棒性。

3.MMsegmentation 中阈值的作用在 MMsegmentation 中,阈值主要用于对图像特征进行二值化处理,以便更好地进行像素级别的分割。

通过调整阈值,可以控制分割的精度和速度。

合适的阈值能够提高分割效果,而不合适的阈值可能导致过拟合或欠拟合问题。

4.如何选择合适的阈值选择合适的阈值是 MMsegmentation 中的关键步骤。

一般而言,可以选择以下几种方法:(1)经验阈值:根据实际需求和经验,直接设定一个阈值。

(2)Otsu"s 方法:根据图像的灰度分布,自动计算最优阈值。

(3)基于模型的方法:通过训练一个模型,如深度学习模型,自动学习合适的阈值。

5.阈值对 MMsegmentation 效果的影响阈值对 MMsegmentation 效果具有重要影响。

合适的阈值可以使分割结果更加精确,而不合适的阈值可能导致以下问题:(1)过拟合:当阈值设置过高时,可能导致分割结果过于复杂,无法反映实际场景。

(2)欠拟合:当阈值设置过低时,可能导致分割结果过于简单,无法捕捉到图像的细节信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

深度图像的二值化————————————————————————————————作者: ————————————————————————————————日期:3.2 深度图像二值化图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。

在颗粒分析、模式识别技术、光学字符识别(OCR)、医学数据可视化中的切片配准等应用中,图像二值化是它们进行数据预处理的重要技术。

由于图像二值化过程将会损失原图像的许多有用信息,因此在进行二值化预处理过程中,能否保留原图的主要特征非常关键。

在不同的应用中,图像二值化时阈值的选择是不同的。

因此,自适应图像阈值的选取方法非常值得研究。

研究者对图像二值化方法进行了讨论,在此基础上提出了一个新的图像二值化算法。

该算法基于数学形态学理论,较好地保留了图像二值化时原图的边缘特征。

本文主要研究二值化及灰度图像二值化方法。

3.2.1.灰度图像与二值图像数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。

在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。

因此,数字图像实际上就是被量化的二维采样数组。

一幅数字图像都是由若干个数据点组成的,每个数据点称为像素(pixel)。

比如一幅256×400,就是指该图像是由水平方向上256列像素和垂直方向上400行像素组成的矩形图。

每一个像素具有自己的属性,如颜色(color)、灰度(grayscale)等,颜色和灰度是决定一幅图像表现里的关键因素。

数字图像又可分为彩色图像、灰度图像、二值图像。

3.2.1.1彩色图像彩色图像是多光谱图像的一种特殊情况,对应于人类视觉的三基色即红(R)、绿(G)、蓝(B)三个波段,是对人眼的光谱量化性质的近似。

彩色图像中的每个像素的颜色有R、G、B三个分量决定,而每个分量有255种值可取,这样一个像素点可以有1600多万的颜色的变化范围。

而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,一个像素点的变化范围为255种。

图1-1为彩色图像。

图1-13.2.1.2灰度图像灰度图像是指只含亮度信息,不含色彩信息的图像。

单纯的看,灰度图也是黑白的,就像黑白电视显示的图像一样,但是点与点之间黑的程度是不一样的、这就是深度。

如果称不同深度的颜色为一色的话,灰度图像就不止只有黑色和白色两种颜色,一般使用的灰度图为256级灰度图,就是说图像由256种不同灰度级的颜色组成。

图像灰度化的效果如图1-2。

图1-2灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为255种。

YUV是编译颜色空间的种类,“Y”表示明亮度“U”表示色度“V”表示浓度,根据YUV的颜色空间,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B(1-1)以这个亮度值表达图像的灰度值。

3.2.1.3二值图像二值图像就是指只有两个灰度级的图像,二值图像具有存储空间小,处理速度快,可以方便地对图像进行布尔逻辑运算等特点。

更重要的是,在二值图像的基础上,还可以进一步对图像处理,获得该图像的一些几何特征或者其他更多特征。

在图像相关方面,用二值图像进行相关比用灰度级图像进行相关有更好的相关性能和去噪作用。

在用硬件实现时可避免乘法运算,从而提高硬件系统的速度和降低成本。

在图像的符号匹配方面,二值图像比灰度级图像更适合于用符号来表达。

二值图既保留了原始图像的主要特征,又使信息量得到了极大的压缩。

图1-3为二值图像。

图1-33.2.2 灰度图像二值化方法研究图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。

图像的预处理在进行图像二值化操作前要对图像进行预处理,包括彩色图像灰化和增强。

由于选取阈值需要参照直方图,因此在图像进行处理后,我们再获取图像的直方图以帮助选取阈值。

整个流程如下所示:读取图像→灰度图像→图像增强→图像直方图→二值化处理图像二值化是图像数据预处理的重要技术,如果二值化过程中阈值选取不当会损失原图像的许多有用信息。

图像二值化处理的方法包括全局阈值法、局部阈值法。

3.2.2.1全局阈值法3.2.2.2全局阈值法的概念全局阈值法是指在二值化过程中只使用一个全局阈值T的方法。

它将图像的每个像素的灰度值与T进行比较,若大于T,则取为前景色(白色);否则,取为背景色。

根据文本图像的直方图或灰度空间分布确定一个阈值,以此实现灰度文本图像到二值图像的转化,其中全局阈值法又可分为基于点的阈值法和基于区域的阈值法。

阈值分割法的结果很大程度上依赖于对阈值的选择,因此该方法的关键是如何选择合适的阈值。

选择不同的初始灰度也会产生不一样的二值化图像,图2—1 所示3幅图像则是分别采取T=109,T=127,T=155三种初始值对Lena 进行基本全局门限二值化后的图像。

可以看出效果都不一样。

因此要获得最佳效果,必须要考虑选择一个好的初始T 值。

另外使用迭代法虽然能得到很精确的阈值,但是也占用了大量的时间,即时间复杂度比较高,效率较其他算法低。

图2—13.2.2.3全局阈值法的方法典型的全局阈值法包括Otsu方法、最大熵方法等。

全局阈值法算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对于由于光照不均匀、噪声干扰较大等原因使直方图分布不呈双峰的图像,二值化效果明显变差。

下面重点介绍Otsu方法:Otsu方法是一种全局化的动态二值化方法,又叫大津法,还称为最大类间差发,是基于整幅图像的统计征,实现阈值的自动选取。

其原理是把图像直方图用某一灰度值分割成两类,分别计算这两类的像素点数和灰度平均值,然后计算它们的类间方差。

当被分割成的两类间方差最大时,此灰度值就作为图像二值化处理的阈值。

大津法的使用范围比较广,不论图像的直方图有无明显的双峰,都能得到较满意的结果,在很多领域得到了应用和发展。

对图像Imag e,记t 为目标与背景的分割阈值,目标像素数占图像比例为0ω,平均灰度为0μ;背景像素数占图像比例为1ω,平均灰度为1μ。

图像的总平均灰度为:)()()()(1100t t t t μωμωμ+=。

从最小灰度值到最大灰度值遍历t ,当t 使得值211200)()(μμωμμω-+-=g 最大时t 即为分割的最佳阈值。

对大津法可作如下理解:该式实际上就是类间方差值,阈值t 分割出的目标和背景两部分构成了整幅图像,而目标取值0μ,概率为 0ω,背景取值1μ,概率为1ω,总均值为μ,根据方差的定义即得该式。

因方差是灰度分布均匀性的一种度量,方差值越大说明构成图像的两部分差别越大,当部分目标点错分为背景或部分背景点错分为目标点都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。

记),(j i f 为M N ⨯图像),(j i 点处的灰度值,灰度级为μ,不妨假设),(j i f 取值]1,0[-m 。

记)(k p 为灰度值为k的频率,则有:∑==k j i f MN k p ),(11)( ﻩ(2-1)假设用灰度值t为阈值分割出的目标与背景分别为:}),({t j i f ≤和}),({t j i f >,于是目标部分比例:∑≤≤=t i i p t 00)()(ω,(2-2) 目标部分点数:∑≤≤=t i i p MN t N 00)( )( (2-3)背景部分比例:∑-≤<=11)()(m i t i p t ω(2-4) 背景部分点数:∑-≤<=11)()(m i t i P MN t N(2-5) 目标均值:∑≤≤=ti t i ip t 000)(/)()(ωμ (2-6) 背景均值:∑-≤<=111)(/)()(m i t t i ip t ωμ (2-7)总均值:)()()()(1100t t t t μωμωμ+= (2-8)大津法指出求图像最佳阈值g的公式为:]))(()())(()([ 2112001-m t 0μμωμμω-+-=≤≤t t t t Max Arg g (2-9) 该式右边括号内实际上就是类间方差值,阈值g分割出的目标和背景两部分构成了整幅图像,而目标值)(0t μ,概率为)(1t ω,背景取值)(1t μ,概率为)(0t ω,总均值为μ,根据方差的定义即得该式。

因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小,这便是大津法的真正含义。

其实,换一种思想也能很好的理解大津方法。

)(0t μ和)(1t μ,可以分别代表目标和背景的中心灰度,μ则代表整幅图像的中心灰度,要使目标和背景得到最好的分割,当然希望分割出的目标尽量远离图像中心,即20))((μμ-t 或|)(|0μμ-t 尽量大,背景也尽量远离中心,即21))((μμ-t 或|)(|1μμ-t 尽量大,由于希望两者都大,于是有:(1) 两者之加权和最大:]))(()())(()([ 2112001-m t 0μμωμμω-+-=≤≤t t t t Max Arg g (2-10) (2) 两者之积最大:]))(())(([ 21201-m t 0μμμμ--=≤≤t t Max Arg g (2-11)注意到有)()()()(1100t t t t μωμωμ+=,且)()(10t t μμμ≤≤,因此有:2120211200))(())(())(()())(()(μμμμμμωμμω--=-+-t t t t t t 。

可见是二者等价的。

图2-2为灰度图像由Otsu 方法得到的二值图像。

原图 Ot su 方法得到的二值图像图2-23.2.2.4 全局阈值法的优缺点介绍及阈值选取全局阈值方法依然存在一些不足,主要表现在:若目标与背景之间灰度差不明显,可能出现大块黑色区域,甚至丢失整幅图像的信息;仅利用一维灰度直方图分布,没有结合图像的空间相关信息,处理效果不好;当图像中有断裂现象或者背景有一定噪声时,无法得到预期效果。

为了满足图像处理应用系统自动化及实时性要求,图像二值化的阈值的选择最好由计算机自动来完成。

下面列举几个阈值的自动选择算法;(1)平均灰度值法以图像中所有像素灰度值的平均值为阈值。

(2)大津法:又称最大类间差发,和上文中的Otsu 方法相同。

(3) 边缘算子法;采用L ap lac e算子、Rober t算子、Sob er算子等对像素点进行灰度级增强或减弱的变换。

对于灰度均匀分布的区域内的像素点,这些算子对其进行灰度减弱;对于在边缘附近的像素点,这些算子对其进行灰度增强。

相关文档
最新文档