A_threshold_selection_method_from_gray-level_histograms翻译_中文版
otsu算法——图像分割

背景比例:
像素点总数:
前景和背景概率之和:
平均灰度值:
类间方差:
将公式(4)和(5)带入(6)可以得到等价公式:
核心代码:Histogram[data[i*srcimage.step + j]]++;//step指向每行的字节总量,date访问每个像素的值for (int i = 1; i < 255 ;i++)//从1开始遍历,寻找最合适的值{//每次遍历前需要初始化各变量w0 = 0; u0 = 0; w1 = 0; u1 = 0;for (int j = 0; j <= i; j++)//背景部分各值计算 { w0 += Histogram[j]; //背景部分像素点总数 u0 += j*Histogram[j]; //背景部分像素总灰度和 } u0 = u0 / w0; //背景像素平均灰度 w0 = w0 / number; //背景部分像素点所占比例}double varValueI = w1*w2*(u1 - u2)*(u1 - u2); //类间方差计算
算法过程:(1)设K(x,y)=f(x,y)/g(x,y)为像素点的 斜率,其中f(x,y)为点(x,y)的灰度值, g(x,y)为点(x,y)周围点的平均值。 (2)设阈值t1,t2将二维直方图分为A、B、 C三个区域。其中B区域代表前景和背 景像素点部分,而A、C代表边界点和 噪声点部分。
算法过程:(1)对于图像I(x,y),将前景与背景的分割阈值设为T。(2)将属于前景的像素点的个数占整个图像的比例设为w0,其平均灰度设为u0。(3)将属于背景的像素点的个数占整个图像的比例设为w1,其平均灰度设为u1。(4)图像的总平均灰度设为u,类间方差设为S。 假设图片的大小为M*N,图像中像素灰度值小于阈值T的像素个数记为N0,像素灰度大于阈值T的像素个数记为N1。则它们之间的关系如下。
大津二值化算法

大津二值化算法大津二值化算法(Otsu's method)是一种自适应二值化算法,它是由日本学者大津展之于1979年在日本出版的论文《A Threshold Selection Method from Gray-Level Histograms》中提出的。
算法原理是通过计算图像直方图,尝试找到一个阈值,使得将图像分成前景和背景两部分后,前景和背景之间的方差最小。
找到这个阈值后,将灰度值大于该阈值的像素设为前景,灰度值小于该阈值的像素设为背景。
具体的实现步骤是:1. 统计图像的灰度直方图,即将图像中每个灰度级别的像素的数量记录下来,得到一个长度为256的数组hist。
2. 计算累计直方图函数cumSum,其中cumSum[i]表示灰度值小于等于i的像素的数量之和。
3. 计算每个灰度级别i的像素在前景和背景两个类别中的像素数目分别为n1[i]和n2[i]:n1[i] = cumSum[i]n2[i] = sum(hist) - cumSum[i]4. 计算前景和背景的平均灰度值分别为mean1[i]和mean2[i]:mean1[i] = (cumSum[i]*i)/n1[i]mean2[i] = ((sum(hist)-cumSum[i])*i)/n2[i]5. 计算前景和背景之间的方差(类间方差):variance[i] = (n1[i]*n2[i])*(mean1[i]-mean2[i])*(mean1[i]-mean2[i])6. 找到使得类间方差最小的阈值,即variance数组中的最大值对应的灰度级别就是最佳阈值。
7. 根据最佳阈值,将灰度值大于该阈值的像素设为前景,灰度值小于该阈值的像素设为背景,得到二值化图像。
优点:自适应性很强,可以适用于各种不同光照下的图像。
缺点:如果图像中的前景和背景类别分布非常不均衡,则可能找不到合适的阈值,导致二值化效果不理想。
大津法原理(otsu)

最大类间方差法(大津法,OTSU)最大类间方差法是由日本学者大津(Nobuyuki Otsu)于1979年提出的,是一种自适应的阈值确定的方法,又叫大津法,简称OTSU 。
它是按图像的灰度特性,将图像分成背景和目标2部分。
背景和目标之间的类间方差越大,说明构成图像的2部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致2部分差别变小。
因此,使类间方差最大的分割意味着错分概率最小。
对于图像I(x,y),前景(即目标)和背景的分割阈值记作T ,属于前景的像素点数占整幅图像的比例记为1ω,其平均灰度1μ;背景像素点数占整幅图像的比例为2ω,其平均灰度为2μ。
图像的总平均灰度记为μ,类间方差记为g 。
假设图像的背景较暗,并且图像的大小为M N ⨯,图像中像素的灰度值小于阈值T 的像素个数记作1N ,像素灰度大于阈值T 的像素个数记作2N ,则有:11N M N ω=⨯ (1.1)22N M N ω=⨯ (1.2)12N N M N +=⨯ (1.3)121ωω+= (1.4)1122μμωμω=⨯+⨯ (1.5) 221122()()g ωμμωμμ=⨯-+⨯-(1.6) 将式(1.5)代入式(1.6),得到等价公式:21212()g ωωμμ=⨯⨯- (1.7) 采用遍历的方法得到使类间方差最大的阈值T ,即为所求。
OpenCV 代码:int myOtsu(const IplImage *frame) //大津法求阈值{#define GrayScale 256 //frame 灰度级int width = frame->width;int height = frame->height;int pixelCount[GrayScale]={0};float pixelPro[GrayScale]={0};int i, j, pixelSum = width * height, threshold = 0;uchar* data = (uchar*)frame->imageData;//统计每个灰度级中像素的个数for(i = 0; i < height; i++){for(j = 0;j < width;j++){pixelCount[(int)data[i * width + j]]++;}}//计算每个灰度级的像素数目占整幅图像的比例for(i = 0; i < GrayScale; i++){pixelPro[i] = (float)pixelCount[i] / pixelSum;}//遍历灰度级[0,255],寻找合适的thresholdfloat w0, w1, u0tmp, u1tmp, u0, u1, deltaTmp, deltaMax = 0;for(i = 0; i < GrayScale; i++){w0 = w1 = u0tmp = u1tmp = u0 = u1 = deltaTmp = 0;for(j = 0; j < GrayScale; j++){if(j <= i) //背景部分{w0 += pixelPro[j];u0tmp += j * pixelPro[j];}else //前景部分{w1 += pixelPro[j];u1tmp += j * pixelPro[j];}}u0 = u0tmp / w0;u1 = u1tmp / w1;deltaTmp = (float)(w0 *w1* pow((u0 - u1), 2)) ;if(deltaTmp > deltaMax){deltaMax = deltaTmp;threshold = i;}}return threshold;}参考文献:Nobuyuki Otsu发表的原文"A Threshold Selection Method from Gray-Level Histograms," Systems, Man and Cybernetics, IEEE Transactions on , vol.9, no.1, pp.62-66, Jan. 1979。
A Threshold Selection Method from Gray-Level Histograms图像分割经典论文翻译(部分)

A Threshold Selection Method from Gray-Level Histograms[1][1]Otsu N, A threshold selection method from gray-level histogram. IEEE Transactions on System,Man,and Cybemetics,SMC-8,1978:62-66.一种由灰度直方图选取阈值的方法摘要介绍了一种对于画面分割自动阈值选择的非参数和无监督的方法。
最佳阈值由判别标准选择,即最大化通过灰度级所得到的类的方差。
这个过程很简单,是利用了灰度直方图0阶和第1阶的累积。
这是简单的方法扩展到多阈值的问题。
几种实验结果呈现也支持了方法的有效性。
一.简介选择灰度充分的阈值,从图片的背景中提取对象对于图像处理非常重要。
在这方面已经提出了多种技术。
在理想的情况下,直方图具有分别表示对象和背景的能力,两个峰之间有很深的明显的谷,使得阈值可以选择这个谷底。
然而,对于大多数实际图片,它常常难以精确地检测谷底,特别是在这种情况下,当谷是平的和广泛的,具有噪声充满时,或者当两个峰是在高度极其不等,通常不产生可追踪的谷。
已经出现了,为了克服这些困难,提出的一些技术。
它们是,例如,谷锐化技术[2],这个技术限制了直方图与(拉普拉斯或梯度)的衍生物大于绝对值的像素,并且描述了绘制差分直方图方法[3],选择灰度级的阈值与差的最大值。
这些利用在原始图象有关的信息的相邻像素(或边缘),修改直方图以便使其成为阈值是有用的。
另一类方法与参数方法的灰度直方图直接相关。
例如,该直方图在最小二乘意义上与高斯分布的总和近似,应用了统计决策程序 [4]。
然而,这种方法需要相当繁琐,有时不稳定的计算。
此外,在许多情况下,高斯分布与真实模型的近似值较小。
在任何情况下,没有一个阈值的评估标准能够对大多数的迄今所提出的方法进行评价。
这意味着,它可能是派生的最佳阈值方法来建立一个适当的标准,从更全面的角度评估阈值的“好与坏”的正确方法。
计算机图形学中凸多边形窗口的线裁剪算法研究

图(a)
图(b)
图(c)
图(d)
图(e)
3.2.3 算法分析,见图(g)
图(f)
参考文献 [1]单会秋.计算机图形学中的二维裁剪算法研究[D].辽宁师范大 学; 2005 年 [2]孙家广等.计算机图形学[M].北京:清华大学出版社,第 3 版, 1998 [3]韩明峰,李传林.基于一般多边形窗口的线裁剪算法[J].计算机 工程与科学,1999,21(3) [4]吴章文,勾成俊,杨代伦,罗正明.有共线边的多边形窗口的线裁 剪算法[J].计算机辅助设计与图形学报,2004,16(2) [5]R orers Prodedural Elements for Computer Graphics[M].Beijing: S- cience Press,2003(in Chinese() [美]David F.R ogers.计算机图形学的算 法基础(第二版[) M].石教英,彭群生等著.北京:机械工业出版社,2002 [6]刘永奎,刘桂芳.一般多边形窗口的线裁剪[J].计算机辅助设计 与图形学学报,1993,5(4)
若不是,则执行以下的过程:
(1)如果线段的两个端点 P1、P2,只有一个位于包围盒外,则设该点 坐标为(x,y)。分别求过点(x,y)与凸多边形各个顶点 Qi 的直线的斜率 ki, 公式如下:
ki=(y- yi)/(x- xi) 如果 k<min{k}i 或 k>max{k}i 则线段 P1P2 与多边形没有交点,为完 全不可见线段,舍去;
法、基于硬件实现的中点分割算法、通过法向点积进行判别的 cyrus- Beck
裁剪算法、梁友栋 - Barsky 线裁剪算法以及 Nieholl- Lee- Nieholl 算法。
3.1 求交技术
二值化可信度模型

二值化可信度模型1. 简介二值化可信度模型是一种用于将连续值转换为二值的模型,在许多应用领域中都有广泛的应用。
例如,在图像处理中,可以使用二值化可信度模型将图像中的灰度值转换为黑白像素,以便进行后续的分析和处理。
在自然语言处理中,可以使用二值化可信度模型将文本中的情感倾向转换为正面或负面情感。
本文将介绍二值化可信度模型的原理、应用场景和常用方法,并提供一些实际案例进行说明。
2. 原理二值化可信度模型的原理是将连续值映射为二值。
在实际应用中,通常是将连续值与一个阈值进行比较,大于等于阈值的被映射为1,小于阈值的被映射为0。
对于不同的应用场景,可以根据需求选择不同的阈值。
例如,在图像处理中,可以根据灰度值的分布情况选择一个合适的阈值,使得图像中的目标物体能够清晰地与背景分离。
在情感分析中,可以根据训练数据的标签分布情况选择一个合适的阈值,使得情感倾向可以准确地被二值化。
3. 应用场景二值化可信度模型在许多领域中都有广泛的应用。
以下是一些常见的应用场景:3.1 图像处理在图像处理中,二值化可信度模型可以将灰度图像转换为黑白图像。
通过选择合适的阈值,可以将图像中的目标物体与背景分离出来,便于后续的目标检测和分析。
3.2 情感分析在情感分析中,二值化可信度模型可以将文本中的情感倾向转换为正面或负面情感。
通过选择合适的阈值,可以将情感分数映射为二值,便于进行情感分类和情感倾向分析。
3.3 信号处理在信号处理中,二值化可信度模型可以将连续信号转换为二进制信号。
通过选择合适的阈值,可以将信号的强度映射为0或1,便于进行数字信号处理和通信系统设计。
4. 常用方法在实际应用中,有多种方法可以实现二值化可信度模型。
以下是一些常用的方法:4.1 固定阈值法固定阈值法是最简单常用的二值化方法之一。
它使用一个固定的阈值将连续值转换为二值。
大于等于阈值的被映射为1,小于阈值的被映射为0。
4.2 自适应阈值法自适应阈值法是一种根据局部像素值的分布情况动态选择阈值的方法。
基于图像的红外镜头焦距快速检测方法研究

xtarget
精度的参数有探测器像元的水平尺寸,平行光管焦 ) (5)
2 (q p) fcol
距、矩形靶标的物理尺寸和靶标在图像中所占的水
2 实验结果及分析
平像素。其中,探测器像元的水平尺寸,平行光管 焦距、矩形靶标的物理尺寸受到机加件加工精度的
本文选用的靶标为刀口靶,半径为 16 mm,平 行光管焦距为 260 mm,探测器为非制冷探测器,分 辨率为 640×512,像元间距为 17 m,且红外镜头 理论焦距为 54 mm。图 2(a)为红外镜头处于聚焦状 态下,刀口靶经光学成像系统后的输出图像,图 2(b) 为图像经二值化后目标边缘提取结果,图 2(c)为目 标经仿射变换后的输出结果。由图 2(b)可得,本文 方法可准确提取刀口靶标的边缘轮廓。
cos( ) sin( ) 0 sin( ) cos( ) 0
1.4 焦距计算公式推导 矩形靶标经光学成像系统的示意图如图 1 所示。
其中 x_target 为矩形靶标的物理宽度,y_target 为矩形 靶标的物理高度,单位均为 mm。矩形靶标经光学系 统成像后输出的图像尺寸为 m×n,且靶标在图像中 所占像素大小为 q-p 和 s-r,单位均为像素。利用 光学成像系统的三角关系,可得如下关系式:
口靶图像的焦距快速检测方法。该方法先采集红外镜头聚焦状态下的刀口靶图像,再进行刀口靶图
像的二值化处理;通过提取目标的边缘轮廓,获得最小外接矩形的顶点坐标信息,从而估算出红外
镜头对应焦距。实验结果证实:该检测方法可快速、准确地测量出镜头的焦距,且测量的平均绝对
误差百分比小于 1.48。该方法为红外镜头重要参数的快速检测奠定基础。
0 引言
镜头焦距(focal length)是指镜头光学后主点到 焦点的距离,是镜头的重要性能指标。镜头焦距的长 短决定着拍摄的成像大小,视场角大小,景深大小和 画面的透视强弱[1],因此如何准确检测红外镜头的焦 距是红外镜头参数检测的一项重要研究内容。
盲人导航系统设计说明书

Guidance System Based on Image ProcessingDahai Yu and Manman ShenSchool of electrical information of Changchun Guanghua University, Changchun, China, 130031 Abstract—To solve the problem of blind travel, a guidesystem based on image processing is designed. The visualinformation collected by a CCD camera. The voice information isused to communicate with the user. The overall design of thissystem is given. Recognize the zebra line by the bipolar systemvalue. Recognize the blind road using saturation histogram andGaussian function.Keywords—blind identification; zebra crossing recognition;image processing; guideI I NTRODUCTIONAccording to the World Health Organization (WHO)statistics in 2010, the total number of people in the world with vision impairment is estimated to be 285 million. 39 million arewhole blind. While China has the most people, the number of blind people is also the most. There is about 5 million blindpeople in China. Due to the physiological defects and the increasingly complex living environment, it brings manyinconveniences to the blind people's life. In view of theinconvenience of blind people, guide dog and guide stick gradually become tools to help blind people travel. However, the guide dog is not easy to train and the cost is high, so the detection range of the blind guide rod is limited.H Wang has designed an interactive guide robot. The robot is composed of haptic device and human-computer interaction system. Analyze the 2D information through the haptic system and transmits the information to the user. But the robot can only detect the surrounding obstacles, not the main effective identification the traffic signs. Zhang Ying designed a guide robot based on embedded technology to identify obstacles and traffic signs. But the robot will not receive the voice message to the blind, which caused a lot of inconvenience to the blind. Han Xuefeng designed an interactive guide robot, through the sensor detection of the external environment, and transfer in the form of voice for the blind. But the robot of traffic sign recognition effect is poor, which can’t meet the actual needs of the blind. Zhang Zhimei et al designed a crawler type guide robot. Use ultrasonic sensor to track the trajectory of black ground preset to avoid obstacles. But it can’t work in no-black environment.In view of the deficiency of the blind guiding technology atpresent, the design of intelligent guide system has greatpractical significance.II S TRUCTURE OF GUIDANCE SYSTEM According to the restriction of the activity of the blind, the function of the guide robot is confirmed, and the overall scheme of the guide system is worked out. As shown in Figure I.FIGURE I.O VERALL SCHEME DESIGNA camera is used to collect the image information of the environment. The data are transferred to DSP. GPS module is used to position the user. Voice module is used to receive or play voices for users. The data are also transferred to DSP. Do some calculate in DSP including traffic signal recognition, Blind identification, zebra crossing recognition and so on.III Z EBRA LINE RECOGNITIONThe zebra belt consists of a group of parallel strips with alternate black and white intervals. The difference of color between black and white stripes is very obvious. Gray contrast is very strong. The rule of black and white alternating is strong. So we can use the bipolar coefficient of the image to characterize and quantify the intensity of the intensity contrast of the zebra line region. Analyze and judge the region with strong gray contrast in the road image by the bipolar system value. If the test area is in the zebra line region, the value of the bipolar system is very high. Otherwise, if the region to be inspected i s not a zebra region, its gray value is basically the same, and the value of the bipolar system is small.First we can use a threshold to segment the image.(a) O RIGIN IMAGE(b) T HRESHOLD SEGMENTATIONFIGURE II.I MAGE SEGMENTATIONThen suppose (μ1,σ1)is the average value of density distribution function of black pixels. (μ2,σ2)is the average2018 International Conference on Advanced Control, Automation and Artificial Intelligence (ACAAI 2018)value of density di stribution function of whith pixels. n1,n2 presents the pixel number of black and white.α=n1n1+n2(1)σ02=ασ12+(1−α)σ22+a(1−α)(μ1−μ2)2(2) The bipolar coefficient γisγ=1σ02[α(1−α)(μ1−μ2)2](3)γ is a value between 0 and 1. When γis 0 , the image is not zebra area. And when γis 1, the image must be zebra area.Then search the edge of the zebra. When there are parallel lines in the image. It could be recognized as zebra lines.(a) T HRESHOLD SEGMENTATION(b) R EGIONS USING BIPOLARITYFIGURE III. R ESULT OF BIPOLAR COEFFICIENT At the end, use the edge of the zebra line. Then we can get the zebra lines info rmation.FIGURE IV. R ESULT OF ZEBRA CROSSING RECOGNITIONIV B LIND ROAD RECOGNITIONThe color of b lind road is usually very bright. So the colors can be used to detect the characteristics of the blind road. This paper gets the blind area using image segmentation. Extract the edge of blind road. First, convert the image from RGB to HSI color space. HSI has three color components. Use the saturation histogram to segment image.(a)O RIGINAL IMAGE(b)H ISTOGRAM OF SATURATION(c) THE SEGMENT IMAGEFIGURE V. R ESULT OF IMAGE SEGMENTATION However, sometimes the color histogram will appear "jagged" shape. It is difficult to divide the image through the peaks and troughs in the histogram. So in order to determine the segmentation point, first use the Gauss smoothing filter to smooth the original color histogram. Suppose S L(x)is the histogram of saturation. The processed color histogram function is:F(x,σ)=S L(x)∗G(x,σ)(4) Here, G(x,σ)is the Gauss function. * presents convolution.This operation not only reduces noise, but also eliminates some tiny saw teeth.FIGURE VI. R ESULT OF BLIND ROAD RECOGNITIONV GPS RECOGNITIONThe remote positioning function can send the blind people to the blind's relatives and friends in real time, strengthen the connection between the blind and relatives and friends, and ensure the safety of the blind. Using SIM808 module and SIM telephone card to realize GPS remote positioning. Through the GPRS flow data of SIM808 GPS upload module programming through the SIM card to the China Mobile networking platform, open platform (OneNET) by computer through the GPS data from the OneNET platform and processed, displayed on the map to achieve GPS remote location positioning module.VI C ONCLUSIONSAiming at the needs of the blind, a guide system is designed. According to the confirmation of the blind activities restrict the function of the system and established the general scheme of the robot; then the realization of recognition, such as the zebra and blind important traffic signs. However, the system needs to be further improved, then to realize traffic lights recognition, intelligent guide system development.R EFERENCES[1]Meng Xiangwei, Yan Xijun, Ouyang, stars, et al. Design of guide barbased on ultrasonic sensors [J]. electronic design engineering, 2012, 20(17): 11-14.[2]Zhang Zhimei, C heng Liying, Zhao Yiheng, et al. Study of guide rob otbased on fuzzy PID control alg orithm [J]. Journal of Shenyang Normal University (NATURAL SCIENCE EDITION), 2015, 33 (1): 81-85. [3]Tang Zhichao, Su Lin, He Chao, et al. Research on traffic sign visualrecognition technology of guide rob ot [J]. compu ter technology and development, 2014 (9): 23-27.[4]Yang Wanhai. Multisensor data fusion and its application [M].Northwest University of Electronic Science and Technology Press, 2004. [5]Xu Yan, Wei Zhen Yu. An improved traffic sign image recognitionalgorithm [J]. laser and Optoelectronics Progress, 2017 (2): 118-125. [6]Khatib O. Real-Time Obstacle Avoidance for Manipulators and MobileRobots[C]// IEEE International C onference on Rob otics and Automation.Proceedings. IEEE, 1986:500-505.[7]Huang Yanbiao, Lu o Guangyue, ho ho. Application of B P neuralnetwork in multisensor data fusion of patrol rob ot [J]. Journal of sensing technology, 2016, 29 (12): 1936-1940.[8]Otsu N. A Threshold Selection Method from Gray-Level Histograms [J].IEEE Transactions on Systems Man & Cybernetics, 2007, 9(1):62-66.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从灰度直方图的一个Tlreshold选择方法自动摘要,非参数和非监督方法阈值选取的图像分割相结合。
一个最佳阈值是由选定的判别准则,即以便最大化所得到的类中灰色的可分水平。
该过程是很简单的,仅利用零级和的灰度级直方图的一阶累计瞬间。
这是直白地扩展到多阈值问题的方法。
几种实验结果也列于支持该方法的有效性。
(一)引言重要的是在图像处理以选择一个适当的阈值的灰度级从他们的背景中提取的对象。
一各种技术已经被提出在这方面。
在一个理想的情况下,直方图两者之间的深刻和尖锐的山谷表示对象和背景峰,分别使该阈值可以在这个山谷的底部选择[1]。
然而,对于大多数实际图片,它往往是难以检测的谷底精确,尤其是在这种情况下,如当谷在平坦宽阔,充满了噪声时,或者当两个峰在高度极为不平等的,通常不产生可追溯山谷。
已经出现了,为了克服提出了一些技术这些困难。
它们是,例如,谷锐化技术[2],制约了直方图的像素衍生工具(或拉普拉斯梯度)的大型绝对值和的差值直方图方法[3],它选择在阈的灰度级与差的最大金额。
这些利用在原来的关于相邻像素(或边缘)的信息图像修改的直方图,以使有用的阈值。
另一个类的方法直接处理的通过参数化技术的灰度直方图。
例如,本直方图是由之和近似在最小二乘意义高斯分布,统计决策程序应用[4]。
然而,这种方法需要相当乏味有时不稳定的计算。
此外,在许多情况下,高斯分布变成是微薄的逼近的真实模式。
在任何情况下,门槛不“善”在已评估大多数的方法,到目前为止提出的。
这意味着,它可以得出一个最优阈值法的正确方法建立一个适当的标准,用于评估“善”从更一般的角度来看阈值。
在这种对应关系,我们的讨论将局限在阈值选择的基本情况,其中只有灰度级直方图足够了而没有其他的先验知识。
它不仅重要的,因为一个标准技术在图像处理中,但也在模式识别无人监督的决策问题是必不可少的。
一种新方法是从判别的角度,提出了分析;它直接评估方法的可行性,门槛的“善”,并自动选择最佳门槛。
(二)配方让一个给定图像的像素L中的灰度级来表示[1,2,...,L]。
像素在水平的编号i被表示为Ni和总像素数由N = N1 + N2 + nL的*为了简化讨论,将灰度级直方图被归一化并且被视为一个概率分布:PI = nilN,PI> 0,Z PI-1(1)现在假设我们二分的像素分为两类,CO和C 1(背景和物体,或者反之亦然)由一个阈值在k层; CO表示具有水平像素[1,k]的和C1表示像素水平[K + 1,...,L]。
那么类的概率发生与类平均水平,分别由下式给出wo = Pr (Co)= E Pi= (k) (2)i=1Lw01 = Pr (Ci)= E pi = 1-@(k)i =k+ Iandk kPo = i Pr (i Co)- E ipi Io = p(k)/w(k)L L ItT P(k)i=kk+l=I k+ co(k)whereko(k) = piandp(k)= I ipiare the zeroth- and the first-order cumulative moments of the histogram up to the kth level, respectively, andLPT P- (L) = Z ipii =1and the optimal threshold k* is(8)is the total mean level of the original picture. We can easily verify the following relation for any choice of k:OP00 +O+IU1=P T, (Oo+Ui I = (9)The class variances are given byk k2 E (i - P0)2 Pr (i C0)= Z (i - po)2pi/o (10)ii= =iL LI2= E (i _ pl)2 Pr (i IC,) = (i - p)2p Wi, (11)这些都需要二阶矩累计(统计)。
为了评估门槛的“善”(在第k层),我们将介绍以下判别标准措施在判别使用(或类可分性的措施)分析[5]:A = a22 K = (T2/a2WK ==/2/a2where2 2 2 UW = 6oJoU + 0J1ff12 = o(po PT) + 1G(i1 PT)= iOO(Y1-PTo)T(due to (9)) andLJ2T = E (i -p2)p pi=1是类内方差,类间方差和水平,总方差分别。
那么我们的问题是减少到一个优化问题来搜索一个阈Ķ最大化其中一个目标函数(标准的措施)。
这个观点是由一个猜想wellthresholded动机类将被分离的灰度级,反之,阈值给出的类以灰色最佳分离水平将是最好的阈值。
判别标准最大化的A,K,和q分别对于k,但是,彼此相等;例如,K = I +1和=)/(2 + 1)中的2而言,由于以下几个基本关系始终认为:a12w ++ a T2 =B52 (16)值得注意的是U2和U2是阈值等级k的函数,但CT是k无关。
它还要指出的是CR2,则基于该二阶统计量(方差类),而(T2是基于(4)一阶统计(类的意思)。
因此,q是最简单的衡量对k。
因此,我们采用Q头像的衡量标准评估门槛的“善”(或分离性)在(5)k层。
最佳阈值的k *最大化吨,或等价A2最大化在以下顺序查找选定6使用简单的累积量(6)和(7),或者显式地(6)用(2)- (5):是的第零和第一阶累积矩直方图到第k个水平,分别与从这个问题,k的范围超过其最大值为寻求可以被限制为SF = {K表; (loow = W(K)[I-((K)]> 0,或0 <0(K)<1}。
我们称它的有效范围的灰度直方图。
从(14)中,该标准度量的定义I'(或q)取零这样的k设作科s最小值- S * = {K表; (O(K)= 0或1}(即,使所有像素或Cl或CO,这是,当然,不我们关注),并采取对科是一个积极的和有界值*。
它因此,明显的是,最大始终存在。
(三)讨论和备注A.分析offurther重要方面在上述提出的方法能提供进一步的手段分析不是选择最优的其他重要方面阈值。
对于选定的阈值的k *,类概率(2)和(3)中,分别表示由占领的地区的部分类中的图片,以便阈值处理。
类装置(4)和(5)作为平均水平的类中的原始估算灰度级图象。
最大值钛(K *),简单地通过1 *表示的,可以作为评估类(或易于阈值的)的可分性的度量对于原始图象或直方图的双峰。
这是一个显著的措施,因为它是在仿射不变灰度级规模的转换(即对任意转移和扩张,G'= AGJ + B),它是唯一的范围内确定0 <Q <1。
下界(零)是可以实现的通过,并只由,图片具有单一恒定灰度级别,和上限(单位)是达到通过,并只由,二值图像。
B.扩展到Multithresholding该方法的扩展multihresholding问题是简单的凭借的判别标准。
例如,在三阈值的情况下,我们假设两个阈值:1 <K1 <K2 <分离三类,CO为[1,***,KL],C,为[K1 + 1,...,K 2],和C2为[K2 + 1,- ,L]。
标准测量或(也q)为两个变量的K然后一个函数,和k2,并且选择通过最大化的阈值KT和KT最优集R7:A2(き,,KT)=最大O2(KI,K2)- 1!KL <K2 <L应当注意到,所选择的阈值通常变得不那么可信,以分开的班级数目增加这是因为标准度量(E2),在定义一维(灰度级)尺度,可能逐渐失去意义作为类的数量增加。
U2和表达最大化的过程也变得越来越复杂。
然而,它们对于M = 2和3非常简单,这几乎涵盖了所有的实际应用,从而使一种特殊的方法来减少搜索过程几乎需要。
它应该是表示,在本发明的方法所需要的参数M-阈值是M - 1离散阈值本身,而的参数的方法,其中所述灰度级直方图近似由高斯分布的总和,需要3M - 1连续参数。
C.实验结果一些实例示于图1-3。
纵观这些数字中,(a)(如也(E))是一个原始的灰度级图片; (B)(及(f))是阈值的结果; (三)(及(g))是一个组的灰度级直方图的(标记为在选定的阈值)的和标准的措施Q1(K)与此有关的;以及(d)(以及(h))是由分析的结果而获得的。
原来的灰度图片都是64×64的尺寸,和灰度级的数字是16图。
1,在图64上。
2,在图32中。
图3(a)和图256。
3(e)所示。
(他们都由符号通过叠加在了16级灰度等于输出理由代表性,因此,他们可能会略有欠缺精确的细节中的灰度级)。
图1示出了应用程序的结果,以一个相同的字符“A”打字的方式不同,一个是新的色带(一)而另一个与旧的(E),分别。
在图2,结果示的纹理,其中,直方图通常显示的一个宽阔平坦的山谷(C)和单峰峰值疑难案件(克)。
为了适当地说明threethresholding的情况下,该方法也被应用到细胞图像成功的结果,示于图。
3,在那里CO表示的背景下,C1为细胞质中,和C2为细胞核。
他们是(b)中所示以及(f)由(),(=)和(*),分别为。
各种迄今为止获得的一些实验结果实例表明,从理论上得出本发明的方法是令人满意的实际使用。
D.该目标函数单峰目标函数52(k)时,或等价地,标准度量1(k)时,始终是光滑和单峰的,因为所用的实验可以看出结果图。
1-2。
它可以证明的优势建议标准,也可能暗示的稳定性方法。
的单峰性的严格证明尚未获得的。
然而,它可以与从我们的角度来分配关于唯一的最大值。
(四)结论从一个灰度级自动选择阈值的方法直方图是来自于判别式的观点来看分析。
这与评估的问题直接涉及的善良的阈值。
一个最佳阈值(或设定阈值)被选中的判断标准;即,通过最大化判别度量Q(或可分离的量度由此产生类灰度等级)。
所提出的方法的特征在于它的非参数和无人监管阈值选择的性质,并具有以下可取的优点。
1)手续非常简单;只有零级和第一的灰度级直方图的命令累积的时刻是利用。
2)直接扩展到multithresholding问题是可行借助于在其上的方法是基于标准的。
3)一个最佳阈值(或设定阈值),则自动选择和稳定,而不是基于所述分化(即本地属性如谷),但对集成(即,全局直方图的属性)。
4)另外重要的方面,也可以分析(例如,估计类的意思水平,一流的可分性等的评价)。
5)该方法是相当普遍的:它涵盖的无监督范围广泛决策程序。
其应用的范围并不限于仅在阈值灰度图像,如在具体描述的上述情况,但它也可覆盖的无监督的其他情况分类中,一些特性(或功能)的直方图判别为对象进行分类是可用的。