[VIP专享]基于空间分布的最大类间方差二值化算法

[VIP专享]基于空间分布的最大类间方差二值化算法
[VIP专享]基于空间分布的最大类间方差二值化算法

基于空间分布的最大类间方差二值化算法.txt不怕偷儿带工具,就怕偷儿懂科技!1品味生活,完善人性。存在就是机会,思考才能提高。人需要不断打碎自己,更应该重新组装自己。第35卷第3期

2001年5月

浙江大学学报 (工学版)

Journal of Zhejiang University (Engineering Science)Vol.35№.3May 2001

收稿日期:1999-07-20.

作者简介:张引(1970-),女,甘肃永登人,浙江大学讲师,从事图形图像、多媒体信息处理和人工智能研究.

基于空间分布的最大类间方差牌照

图像二值化算法

张引

(浙江大学CAD&CG国家重点实验室,浙江杭州310027)

(浙江大学人工智能研究所,浙江杭州310027)

摘要:车辆牌照识别VLPR(Vehicle License Plate Recognition)是智能交通系统ITS(Intelligent

Transportation System)的重要部分,有着巨大的社会和经济效益.车辆牌照图像二值化方法的研究是

VLPR中的关键技术,通常都采用经典的Bernsen算法和Otsu算法.但由于光照不均、摄像机畸变、曝

光不足、动态范围太窄和车辆牌照被污染等原因,车辆牌照图像的质量往往不佳,常存在严重伪影和字

符边缘模糊,极大地影响了牌照图像二值化效果,Bernsen算法和Otsu算法也不能很好地克

服上述问

题.为此,提出了一种新的牌照图像二值化算法CASDA(Cluster Algorithm Based on Spatial Distribu-

tion Analysis),把牌照图像空间分布特性与最大类间方差的统计特性有机结合,大大加快了最大类间方

差模式分类速度.与Bernsen、Otsu、LEVBB等算法比较,CASDA具有速度快,能消除不均匀光照引起

的伪影,极少出现笔划断裂等优点,二值化效果好.

关键词:二值化;模式分类;牌照识别

中图分类号:TP391.4;U491.116 文献标识码:A 文章编号:1008-973X(2001)03-0272-04

VLPR有着广泛的实际应用前景,如交通控制与诱导、小区车辆管理、闯红灯等违章车辆监控、

不停车自动收费、道口检查站车辆监控、公共停车场安全防盗管理等.同OCR相比,它识别的是场

景字符;同目标识别相比,牌照中的字符以一定的规则排列,有其空间分布的特殊性.此外, VLPR

要求具有很高的识别率和实时性,能处理汽车在高速行驶时造成的牌照图像模糊、扭曲、变

形和适

应准全天候.因此,VLPR是计算机视觉与模式识别技术在智能交通领域应用的重要研究课题

之一.

中国汽车牌照主要分黄底黑字、蓝底白字、黑底白字等三种,其灰度图像则为白底黑字、黑

底白

字两大类.由于光照不均匀影响、摄像机畸变、曝光不足和动态范围太窄等原因,导致牌照图像存在

严重的伪影;并且由于图像灰度分布不均匀、对比度不足,以及牌照上的灰尘、脏污等,使得

牌照的

字符图像边缘模糊,细节分辨不清.严重影响到牌照图像二值化的效果.为此,本文提出一种结合

牌照字符空间分布和最大类间方差分类准则的全局阈值法CASDA算法,用于牌照字符识别的

值化处理,既能消除伪影,又能保持牌照字符笔划的边缘完整性,且满足VLPR的实时性要求.

后,本文将CASDA算法实验结果同最具代表性的二值化算法:Otsu算法[1]、Bernsen算法[2]以及

Bernsen算法的改进LEVBB[3]算法做了比较.

1 文本图像二值化算法概述

文本图像二值化的基本要求是二值化图像能忠实再现原来文本图像,即:(1)字符笔划不出现

空白、空心、短裂;(2)二值化后笔划基本保持原来文字特征.

Trier与A.K.Jain[4]研究了已有的文本图像二值化方法,认为下面的二值化算法是最典型的算法,包括Bernsen算法、Chow与Kanekos算法、Eikbil算法、Mardia与Hainsnorth算法、Niblack

算法、Taxt算法、Yanowitz与Bruckstein算法、White与Rohrer动态阈值算法、Park算法、White与Rohrer的集成函数算法、Trier与Taxt算法等局部自适应算法. Otsu算法、Kapur算法、Kittler

与Illingworth算法、Abutaleb算法等全局阈值算法.

在VLPR的图像二值化中,通常都采用Bernsen算法和Otsu算法.然而Bernsen算法有伪影

现象,且容易出现二值化图像笔划断裂现象.为此文献[2]给出了对Bernsen产生伪影的解决

方法:

(1)对原图做均值平滑去噪;(2)计算去噪图的边缘值(Sobel算子);(3)去除边缘值小于某阈

值Tp

的目标点.由于该方法引入了Sobel求边缘并增加阈值Tp,仍然存在选取困难,且该方法对于由背

景灰度突变形成的伪影现象仍无法消除.叶芗芸[3]对Bernsen算法作了改进并命名为LEVBB 算

法,称该算法是完全基于图像局部特征的自适应算法,对背景区域可能出现的伪影现象有较好的消

除作用,同时算法中没有固定的阈值选取困难.Otsu算法不但费时(要对每幅图像的每一级灰度进

行计算),更主要的是Otsu方法的判别准则函数可能呈双峰[5],此时,Otsu算法往往将大量

背景错

分为字符,导致无法识别,不适于VLPR的要求.

2 基于空间分布的最大类间方差二值化算法

2.1 牌照图像空间分布与图像二值化

在光照均匀、无噪声和无干扰的理想情况下,牌照图像中灰度变化平缓,可以假定字符灰度为

g1,背景灰度为g2,且0≤g1,g2≤255.假定该牌照图像中字符像素点所占比例为r1,背景像素点所

占比例为r2,则0≤r1,r2≤1,且r1+r2= 1.

该牌照灰度图像均值为

M=r1·g1+r2·g2,g1

方差计算如下:

C2=r1(g1-M)2+r2(g2-M)2. (2)

由式(1)可得

r1(g1-M) +r2(g2-M) = 0, (g2-M) =-r1r2(g1-M).

代入式(2)可得

C2=r1r2(g1-M)2.

由此导出,字符灰度为

g1=M±r2r1C,

背景灰度为

g2=M±r1r2C.

对于白底黑字牌照,为把黑字从白底中分割出来,选取粗阈值

T1=M-r1r2·C; (3)

对于黑底白字牌照,为把白字从黑底中分割出来,选取粗阈值

T1=M+r1r2·C. (4)

式(3)和式(4)中字符像素点所占比例r1未知,但根据统计规律,牌照中字符所占像素点比例r1为

0.3 ~ 0.4左右,由于经过图像分割自动定位的牌照区域基本精确在牌照的四个边框附近,标准牌

照高度与长度比RatioLP为140∶440= 0.318 2,r1恰恰与RatioLP接近,由于这里所需得到的是

粗阈值,所以r1用RatioLP近似,粗阈值T1(T2)的误差为10个像素点左右.

273 第3期张引:基于空间分布的最大类间方差牌照图像二值化算法2.2 模式分类与图像二值化

文本图像的二值化问题可以归结为两类模式(字符目标与背景)的分类问题,即对文本图像,判定其上任意一像素点是属于字符类,还是背景类,从而最终把文本图像分成字符和背景两大类.

设给定图像具有1,2,3,…,l,共l级灰度,阈值设为k,把灰度大于k和小于k的像素分为两类:

类1和类2.类1中的像素总数为W1(k),平均灰度值为M1(k),方差为σ1(k);类2中的像素总数为

W2(k),平均灰度值为M2(k),方差为σ2(k);所有图像像素平均值为Mr.则类间方差σ2B(k)和类内方

差σ2A(k)定义如下:

σ2B=W1(M1-Mr)2+W2(M2-Mr)2=W1W2(M1-Mr)2,

σ2A=W1σ21+W2σ22.

模式分类理论中,不同类别之间可分性度量有三个标准:散布矩阵、散度和Battacharyya距离[6],类间方差与类内方差的比值对应于散布矩阵,反映了各类模式在模式空间的分布情况.类间

方差越大,类内方差越小,则说明分类结果类与类之间距离大,每类自身各像素性质相似度越

大,即

模式分类结果越好.

2.3 CASDA算法

在3.1节中要对粗阈值T1(T2)作微调,得到最终的二值化阈值,一个办法是根据精确分析笔划边缘[7],然而这项工作并非易事,特别在字符粘连情况下,笔划分析很难.我们认为可以采用最大

类间方差判别准则函数σ2B/σ2A对粗阈值T1(T2)进行微调,算法通用、简单.由此把基于空间分布的

二值化方法与最大类间方差分类准则有机结合,得到一种新的牌照图像二值化算法——CASDA 算法.

CASDA算法描述:

①首先假定为白底黑字牌照,则以T1为阈值对牌照图像二值化处理;

②对以T1为阈值的二值化图像进行纹理分析,判定并分析字符笔划边缘,同时计算黑点所占比例关系,以此确定二值化图像效果及①中的假定(为白底黑字牌照)是否正确;(若为黑底白字牌

照,以T1为阈值的二值化图像鲜有笔划边缘,并且黑点比例远小于r1.)若假定正确,转④;

③说明①假定错误,应为黑底白字牌照,则以T2为阈值对牌照图像二值化;

④以T1(或T2)为初始阈值T0,在k∈[T0-10,T0+10]范围内分别计算判别准则函数S(k)

=σ2B(k)σ2A(k),其中σ2B为类间方差,σ2A为类内方差,取判别准则函数S(k)为最大值的k为最终的牌照图

像二值化阈值.

3 实验结果

我们在P133/32计算机上采用C语言编程,并把CASDA算法与Bernsen算法、Otsu算法以

及LEVBB算法进行了比较.图1中各牌照二值化时间:快速Otsu算法在0.07 s以上,Bernsen 算

法0.05 s左右,LEVBB算法在0.04 s左右,而CASDA算法为0.01 s.如图1所示,在大多数情况

下,Bernsen算法和LEVBB算法得到的二值化图像效果基本一样,都有很大的噪声干扰,不利于进

一步的单字提取和字符识别.如图1(c)的光照不均匀,Bernsen算法、Otsu算法和LEVBB算法均

无能为力,而CASDA算法得到的二值化图像清晰,无伪影. Otsu算法得到的二值化图像也有较大

的噪声,笔划粘连现象较多.如图1(d)由字符、牌照背景和保险杠残留图像三部分组成,Otsu 算法

将牌照背景亦误分割为字符,造成二值化图像模糊一片,无法进一步识别.

CASDA综合了图像的空间分布特性与最大类间方差的统计分布特性,根据空间分布特性初

步确定二值化阈值,再由最大类间方差判别准则函数σ2B/σ2A进行微调,在较小的灰度范围内搜索,

使分类算法运算量呈10倍下降,取得满意的二值化效果.实验表明CASDA无论是二值化图像效

果还是计算速度均优于Bernsen算法、Otsu算法和LEVBB算法.与Bernsen算法、Otsu算法和

LEVBB算法相比,CASDA基于全局阈值考虑,阈值选取合理,二值化效果好,能消除伪影,极少出

274浙江大学学报(工学版) 2001年图1 二值化方法比较

Fig.1 Comparison of binarization methods

现笔划断裂现象.对于有噪声干扰、非均匀光照的牌照图像有良好的适应性,且算法速度极快,满足

牌照识别实际要求. CASDA算法的二值化与采用笔划分析的方法[7]相比,效果基本一样,但

是摒

弃了笔划分析的复杂性,实现简单,具有更好的通用性.

致谢感谢导师潘云鹤院士、王潮博士对本文工作的大力支持.

参考文献:

[1] Otsu N. A Threshold selection method from gray-level histograms[J]. IEEE Trans Systems, Man and Cy-

bernetics, 1979, 9(1): 62-66.

[2] Bernsen J. Dynamic thresholding of gray-level images[A]. Proc. 8th Int. Conf. on Pattern Recognition[C].

LOS Angeles: IEEE Computer Society Press, 1986. 1251-1255.

[3] 叶芗芸.文本图像的快速二值化方法[J].红外与毫米波学报,1997,16(5):344-350.

Ye Xiang-yun. Fast binarization alogorithm for document image[J]. Journal of Infrared and Millimeter

Waves, 1997,16(5):344-350.

[4] Trier, Jain A K. Goal-directed evaluation of binarization methods[J]. IEEE Trans Pattern Analysis and Ma-

chine Intelligence, 1995, 17(12): 1191-1201.

[5] Sang Uk Lee, Seok Yook Chung. A comparative performance study of several global thresholding techniques

for segmentation[J]. Computer Vision, Graphics, and Image Understanding, 1990,50(2): 171-190.

[6] FuKunaga K. Introduction to statistical pattern recognition 2nd edition[M]. Boston: Academic Press, Inc,

1990.

[7] 张引,潘云鹤.面向车辆牌照字符识别的预处理算法[J].计算机应用研究,1999, 16(7):

85-87.

Zhang Yin, Pan Yun-he. Pre-processing algorithm for vehicle license plate character recognition[J]. Journal

of Application Research of Computer, 1999, 16(7):85-87.

(下转第280页)

275 第3期张引:基于空间分布的最大类间方差牌照图像二值化算法Preprocessing methods for computer images

of particle saltation

SUN Zhi-feng1, SUN Zhi-lin2, WEI Lei1

(1.Dept. of System Science and Engineering, Zhejiang Uni., Hangzhou 310027, China;

2.Dept. of Ocean Science and Engineering, Zhejiang Uni., Hangzhou 310027, China) Abstract: Particle saltation sequential images taken during a video-image experiment on the bed-

surface of non-uniform sediment can be used for determining the saltating grain trajectory and ve-

locity, which are very important for studying the mechanics of sediment transport. In order to

obtain high precision data on grain saltation, the authors resorted to computerized image process-

ing and recognition of the video images. The methods for preprocessing particle saltation single

image are described in this paper. Real color video images are first transformed into gray-level

images, whose useful parts are pre-intercepted. Then, half-neighborhood-area filter and the

cross median filter are used for moving average processing of these images. A satisfactory result

is obtained. The pre-processing of the images laid the foundation of the further processing such

as the threshold segmentation, configuration extraction and edge detection.

Key words: image processing and recognition; particle saltation; video image; nonuniform sedi-

ment

(上接第275页)

License plate binarization algorithm based on analysis of the

spatial distribution and maximum variance between clusters

ZHANG Yin

(State Key Lab of CAD&CG, Zhejiang Uni., Hangzhou 310027, China)

(Institute of AI, Zhejiang Uni., Hangzhou 310027, China)

Abstract: VLPR (Vehicle license plate recognition) is an important part of ITS (Intelligent

Transportation System), which has great social and economic values. Vehicle license plate bina-

rization algorithms comprise a critical technology in VLPR. Generally, Bernsen algorithm and

Otsu algorithm are used in vehicle license plate binarization. However, because of the deficiency

in illumination, vidicon, exposure, dynamic range and license plate pollution, the quality of vehi-

cle license plate images is always very poor, with serious false shadows and blur character edges

existing on these images. Bernsen algorithm and Otsu algorithm connet overcome these prob-

lems, so a new license plate binarization algorithm-CASDA (Cluster Algorithm Based on Spatial

Distribution Analysis) is presented based on maximum variance between clusters. CASDA algo-

rithm has the advantage of short computing time, few broken strokes, robust to subnormal illu-

mination and noise compared with the famous algorithm Bernsen, Otsu and LEVBB, has batter

performance.

Key words: binarization; pattern classification; license-plate recognition

280浙江大学学报(工学版) 2001年

阿伦方差的定义以及计算方法和物理意义

阿伦方差的定义以及计算方法和物理意义 1. 阿伦方差的定义,计算方法以及物理意义。 David AIlan于1966年提出了Allan方差,最初该方法是用于分析振荡器的相位和频率不稳定性,高稳定度振荡器的频率稳定度的时域表征目前均采用Allan方差。由于陀螺等惯性传感器本身也具有振荡器的特征,因此该方法随后被广泛应用于各种惯性传感器的随机误差辨识中。 Allan方差的基本原理如下:设系统采样周期为τ,连续采样N个数据 点.Y(i),i=1,2,3…N。对任意的时间r=mτ,m=1,2…N/2,由式(1)求改族时间内各点的均值序列Y(K),由式(2)求取差值序列D(K). KM,,1 Yi(),JK,Y(K)=1/M K=1,2…N-M+1 (1) D(K)=Y(K+M)-Y(K) K=1,2…N-2M+1 (2) 普通AlIan方差的定义如式(3)。其中<>表示取均值,σ=1,2,?, Round((N,m)-1)。 2 2(τ)=1/2(3) ,yn Allan方差反映了相邻两个采样段内平均频率差的起伏。它的最大优点在于一2,大大缩短了测量的时间。对各类噪声的幂律谱项都是收敛的;此外每组测量N 交叠式Allan方差由式(4)计算: 2,yn(τ)=1/2 P=1,2…N-2M+1 (4) 衡量陀螺精度的一个非常重要的指标是陀螺随机漂移(drift),又指偏置稳定性(bias stabil—ity)以及零偏稳定性,不同应用场合对陀螺的漂移精度提出不同的要求。MEMS的随机误差具有慢时变、非平稳的特点,因而对其的辨识更适合采

用Allan方差分析法。然而由于在相同的置信水平之下,交叠式Allan方差分析方法比普通的Allan方差具有更大的置信区间. 所谓频率稳定度是指任何一台频率源在连续运行之后,在一段时期中能产生同一频率的程度,即频率随机起伏的程度。造成频率起伏的根本原因是噪声对信号相位或频率调制的结果。这种调相或调频所引起的频率不稳定度在时域表现为频率随时间的起伏,在频域表现为信号的频谱纯度。时域频率稳定度一般用阿伦方差来表征. 频率稳定度最常用的表达式是阿伦方差(Allan variance),根据稳定度时间的长短,分为频率短期稳定度,如lms,lOms,lOOms,ls稳定度等,中长期稳定度,如ls,10s一?,10000s稳定度等。频率短期稳定度和中长期稳定度虽然它们的定义是一样的,但反映的却是信号稳定度方面不同的特性。短期稳定度表征了信号的抖动水平(fluctuation),而中长期稳定度则代表了信号频率随时问的漂移程度(drift)。时域短期频率稳定度在时测量非常困难,甚至是不可能的,但此时进行频域测量则比较容易,因此,可以将测量的频率短期稳定度即相位噪声转换为时域的阿伦方差实现对时域短稳的间接测量。相噪理论和统计学认为,频域的相位噪声和时域的阿伦方差是等效的,如果求得了彼此间的换算关系,可以进一步揭示出各表征量的物理性 2. 用阿伦方差与统计平均及均方差在误差描述方面的差异,以及各自的优缺点 (1)均方差也叫标准差,方差开根号为均方差,工程中其量纲与变量一致,应用较广. 样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。

基于熵的图像二值化算法设计二维最大熵分割

基于熵的图像二值化算法设计二维最大熵分割公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

1设计目的与要求 设计目的 (1)熟悉和掌握MATLAB程序设计方法。 (2)学习和掌握MATLAB图像处理工具箱。 (2)了解图像分割和图像二值化的原理。 (3)掌握图像二值化技术阈值的选取。 (4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。 设计要求 (1)了解图像变换的意义和手段。 (2)熟悉最大熵和二值化的基本性质。 (3)通过本实验掌握利用MATLAB编程实现数字图像处理。 (4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。

2 设计方案 图像二值化 图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。在不同的应用中,阈值的选取决定着图像特。 征信息的保留。因此,图像二值化技术的关键在于如何选取阈值。 最大熵原理 最大熵原理:最大熵原理是在1957 年由 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下,符合已知知识的概率分布可能不止一个。我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。 图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下: O :t i N N ???(0<=i<=t) () B : t i N N N - (t+1<=i<=255) () ? 其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰 度级从0~t 的像素点总和,N 为图像总像素点,t 为假定灰度阈值T 。 ) l og()(0 t i t i N N N N H ∑ -= ??? ? (0<=i<=t) ? ? ()

方差分析公式

方差分析公式 (2012-06-26 11:03:09) 转载▼ 标签: 分类:统计方法 杂谈 方差分析 方差分析(analysis of variance,简写为ANOV或ANOVA)可用于两个或两个以上样本均数的比较。应用时要求各样本是相互独立的随机样本;各样本来自正态分布总体且各总体方差相等。方差分析的基本思想是按实验设计和分析目的把全部观察值之间的总变异分为两部分或更多部分,然后再作分析。常用的设计有完全随机设计和随机区组设计的多个样本均数的比较。 一、完全随机设计的多个样本均数的比较 又称单因素方差分析。把总变异分解为组间(处理间)变异和组内变异(误差)两部分。目的是推断k个样本所分别代表的μ1,μ2,……μk是否相等,以便比较多个处理的差别有无统计学意义。其计算公式见表19-6. 表19-6 完全随机设计的多个样本均数比较的方差分析公式变异来源离均差平方和SS 自由度v 均方MS F 总ΣX2-C* N-1 组间(处理组间)k-1 SS组间/v组间MS组间/MS组间 组内(误差)SS总-SS组间N-k SS组内/v组内 *C=(ΣX)2/N=Σni,k为处理组数 表19-7 F值、P值与统计结论 αF值P值统计结论 0.05 <F0.05(v1.V2)>0.05 不拒绝H0,差别无统计学意义 0.05 ≥F0.05(v1.V2)≤0.05 拒绝H0,接受H1,差别有统计学意义 0.01 ≥F0.01(v1.V2)≤0.01 拒绝H0,接受H1,差别有高度统计学意义

方差分析计算的统计量为F,按表19-7所示关系作判断。

例19.9 某湖水不同季节氯化物含量测量值如表19-8,问不同季节氯化物含量有无差别? 表19-8 某湖水不同季节氯化物含量(mg/L)X ij 春夏秋冬 22.6 19.1 18.9 19.0 22.8 22.8 13.6 16.9 21.0 24.5 17.2 17.6 16.9 18.0 15.1 14.8 20.0 15.2 16.6 13.1 21.9 18.4 14.2 16.9 21.5 20.1 16.7 16.2 21.2 21.2 19.6 14.8 ΣX ij j 167.9 159.3 131.9 129.3 588.4(ΣX)n i8 8 8 8 32(N) X i20.99 19.91 16.49 16.16 ΣX2ijj 3548.51 3231.95 2206.27 2114.11 11100.84(ΣX2)H0:湖水四个季节氯化物含量的总体均数相等,即μ1=μ2=μ3=μ4 H1:四个总体均数不等或不全相等 α=0.05 先作表19-8下半部分的基础计算。 C= (Σx)2/N=(588.4)2/32=10819.205 SS总=Σx2-C=11100.84-10819.205=281.635 V总=N-1=31 V组间=k-1=4-1=3 SS组内=SS总-SS组间=281.635-141.107=140.465

指纹图像二值化算法的分析和比较

指纹图像二值化算法的分析和比较 1引言 指纹作为人体的重要特征,因其具有唯一性和终生不变性,已经成为生物识别领域的重要手段。它不仅应用于公安司法系统的犯罪识别,而且还广泛应用于如一些保密系统的身份验证,成为生物识别领域的新热点。在指纹自动识别系统中,图像采集设备所得到的图像是一幅含有较多噪声的灰度图,必须经过预处理,除去大量的噪声信号,得到一幅纹线清晰的点线图,才能进行指纹特征的提取和匹配。指纹图像的预处理是正确地进行特征提取、比对等操作的基础,而二值化是图像预处理中非常重要的一步,也是指纹细化并提取特征前的重要步骤。 不同的二值化经常会对后续的步骤产生极大的影响,常用的二值化方法由于仅仅利用了图像的灰度信息,没有考虑指纹图像自身的方向结构特点,对指纹图像的二值化效果不理想. 本文首先对常用的二值化算法进行了讨论,并主要通过实验比较了两种特别针对指纹图像的二值化算法。 通常认为一个好的针对指纹图像的二值化算法应满足以下几点要求[f。1]: ●保持纹线的原始走向; ●相关领域内指纹的纹线走向基本一致; ●避免造成指纹纹线的中断和粘连; ●避免生成虚假指纹纹线; ●纹线间的间距变化平稳; 2图像的二值化算法 在很多情况下,图象是由具有不同灰度的两类区域组成的。如在指纹图象中,指纹脊线和谷线就由不同的灰度构成,通常脊线要比谷线暗。所谓灰度图象的二值化就是通过设定阀值,把它变为仅用两个灰度值分别表示图象的前景和背景颜色的二值图象。图象的二值化可以根据下面的阀值来处理: 假设一幅灰度图的像素值为f(i,j)∈(r1,r2 ,…,rm),设有一阀值为T=ri ,1≤i≤m,则: 二值化的方法很多,关键在于阀值T的选取。而T的取值方法又取决于二值化的技术。T的选择有基于由点的像灰度值单独决定的、有由像素的局部特征决定的、也有基于全局像素决定的。阀值可以分为两类:全局阀值和局部阀值。 1)全局阈值 全局阈值是在整个图像中将灰度阈值的值设置为常数。如果背景的灰度值在整个图像中可以合理的看作恒定,而且所有的物体于背景都具有几乎相同的的对比度,那么只要选择了正确的阈值,使用一个全局阈值可以得到非常好的的效果。代表算法有最大类间方差法(OSTU方法)。 OSTU方法计算简单,稳定有效,是实际应用中经常采用的方法。但是它对噪声和目标大小十分敏感,仅对类间方差是单峰的图像有较好效果。当目标与背景的大小比例悬殊时,类间方差准则函数可能为双峰或多峰,此时OSTU方法就会失效。 2)自适应阈值 自适应阈值化算法也称动态局部阈值化算法。所谓动态是指根据每个像素及其邻域像素的灰度值情况动态地计算分割所需的阈值,如:Bernsen算法,它对图像上的每个点以之为中心取一个局部窗口,则该点的阈值为窗口中最大灰度和最小灰度的平均,依次对每个点根据其阈值进行二值化。 4.基于方向图的动态阈值指纹图像二值化方法

期望 方差公式的证明全集

期望与方差的相关公式的证明 -、数学期望的来由 早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目,题目是这样的:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。当比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平? 用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)*(1/2)=3/4,或者分析乙获胜的概率为(1/2)*(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。 这个故事里出现了“期望”这个词,数学期望由此而来。 定义1 若离散型随机变量ξ可能取值为i a (i =1,2,3 ,…),其分布列为i p (i =1,2,3, …),则当i i i p a ∑ ∞ =1 <∞时, 则称ξ存在数学期望,并且数学期望为E ξ=∑∞ =1 i i i p a , 如果i i i p a ∑ ∞ =1 =∞,则数学期望不存在。 [] 1 定义2 期望:若离散型随机变量ξ,当ξ=x i 的概率为P (ξ=x i )=P i (i =1,2,…,n ,…),则称E ξ=∑x i p i 为ξ的数学期望,反映了ξ的平均值. 期望是算术平均值概念的推广,是概率意义下的平均.E ξ由ξ的分布列唯一确定. 二、数学期望的性质 (1)设C 是常数,则E(C )=C 。 (2)若k 是常数,则E (kX )=kE (X )。 (3))E(X )E(X )X E(X 2121+=+。 三、 方差的定义 前面我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量一个重要的数字特征。但是在一些场合下,仅仅知道随机变量取值的

基于熵的图像二值化算法设计-二维最大熵分割

1设计目的与要求 1.1 设计目的 (1)熟悉和掌握MATLAB程序设计方法。 (2)学习和掌握MATLAB图像处理工具箱。 (2)了解图像分割和图像二值化的原理。 (3)掌握图像二值化技术阈值的选取。 (4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。 1.2 设计要求 (1)了解图像变换的意义和手段。 (2)熟悉最大熵和二值化的基本性质。 (3)通过本实验掌握利用MATLAB编程实现数字图像处理。 (4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。

2 设计方案 2.1 图像二值化 图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。在不同的应用中,阈值的选取决定着图像特。 征信息的保留。因此,图像二值化技术的关键在于如何选取阈值。 2.2 最大熵原理 最大熵原理:最大熵原理是在1957 年由E.T.Jaynes 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下,符合已知知识的概率分布可能不止一个。我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。 图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下: O :t i N N (0<=i<=t) (3.2.1) B : t i N N N - (t+1<=i<=255) (3.2.2) 其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰度级从0~t 的像素点总和,N 为 图像总像素点,t 为假定灰度阈值T 。 ) l og()( t i t i N N N N H ∑-= (0<=i<=t) (3.2.3) ) log()( t i t i B N N N N N N H ---=∑ (t+1<=i<=255) (3.2.4)

车牌识别中二值化方法的研究与实现

车牌识别中二值化方法的研究与实现 摘要:在基于数字图像处理的车牌识别技术的研究过程中,因为车牌定位和字符分割一般都是基于车牌区域的二值化结果进行的,因此对图像的二值化是非常关键的一步。二值化最主要的是阈值的确定,文章对比了几种常规的车牌图像全局阈值二值化处理算法,发现这些方法不够理想,然后提出几种新的方法——基于图像直方图波形分析的车牌图像二值化处理算法;考虑到光照变化以及定位出的车牌周边环境和自身干扰等因素,提出了一种新的车牌二值化的方法,这种方法结合了高斯拉普拉斯算子法和迭代法;而不均匀光照下的图像二值化是数字图像处理中的另一个难题.为此,本文提出一种解决办法,首先使用同态滤波去掉车牌图像的不均匀光照的影响,然后使用改进的Bernsen算法对车牌图像进行二值化。实验表明,这三种方法在进行车牌图像二值化处理时效果比较理想。 关键词:车牌识别;二值化;高斯拉普拉斯算子;图像直方图;不均匀光线 Realize and Research on binarization method of license plate recognition Abstrac t:During the research for the license plate recognition based on the Distal Image Processing Technology,because the location and segmentation of license plate are usually based on the binarized image,the image binaryzation is a key step.The most important part of the image binaryzation is the determination of threshold.In this paper,severalmethods have been compared,and also the basic principles and computer simulation results of inter-class varimaxand maximum entropy method have been analyzed.But we have found that these methods are not optional when used to process vehicle license plate images.Therefore,a new method has been put forward,which is the arithtactic of license plate image binarization based on image histogram.Considering the changes of illumination,the surrounding environment of the license plate and the license plate itself,a new method of taking threshold value of binarization is introduced.This method combines the Gauss-Laplace method and the iteration method.It is a difficult task to binarize image under nonuniform illumination.A new method is presented as follows:at first,it enhances the plate image quality by homomorphic filtering to eliminate the bad effect of the nonuniform illumination;then,binarizes the plate image by a improved Bernsen algorithm.It has been proved that the three methods are well when used to process vehicle license plate images. Key words:Vehicle license plate recognition, binary, gaosilapulasi operator, image histogram, uneven light

方差分析公式

方差分析公式 (20PP-06-2611:03:09) 转载▼ 标签: 分类:统计方法 杂谈 方差分析 方差分析(analPsisofvarianee ,简写为ANOV或ANOV A可用于两个或两个以 上样本均数的比较。应用时要求各样本是相互独立的随机样本;各样本来自正态 分布总体且各总体方差相等。方差分析的基本思想是按实验设计和分析目的把全部观察值之间的总变异分为两部分或更多部分,然后再作分析。常用的设计有完 全随机设计和随机区组设计的多个样本均数的比较。 一、完全随机设计的多个样本均数的比较 又称单因素方差分析。把总变异分解为组间(处理间)变异和组内变异(误差)两部分。目的是推断k个样本所分别代表的卩1,卩2,……卩k是否相等,以便比较多个处理的差别有无统计学意义。其计算公式见表19-6. 表19-6完全随机设计的多个样本均数比较的方差分析公式 GC=(艺G) 2/N=艺ni , k为处理组数 方差分析计算的统计量为F,按表19-7所示关系作判断。 例19.9某湖水不同季节氯化物含量测量值如表19-8,问不同季节氯化物含量有 无差别? 表19-8某湖水不同季节氯化物含量(mg/L)

SS 加刖=丄 和 ' 10619.265^ 170 HO:湖水四个季节氯化物含量的总体均数相等,即 卩仁卩2=卩3=卩4 H1:四个总体均数不等或不全相等 a =0.05 先作表19-8下半部分的基础计算。 C=(艺 G ) 2/N= (588.4) 2/32=10819.205 SS 总=艺 G2-C=11100.84-10819.205=281.635 V 总=N-仁31 (工吋 “ 1 广_ (】6二口尸斗/」期.匸尸千 K .IT N "一 - ? r . —I b K V 组间=k-1=4-1=3 SS 组内=SS 总-SS 组间=281.635-141.107=140.465 V 组内=N-k=32-4=28 MS 组间二SS 组间 /v 组间=141.107/3=47.057

图像二值化算法研究与实现

图像二值化算法研究与实现 摘要:图像二值化是图像预处理中的一项重要技术,在模式识别、光学字符识别、医学成像等方面都有重要应用。论文介绍了图像及数字图像处理技术的一些概念和相关知识;对VC++ 软件的发展和软件在图像处理中的应用做了简要介绍;还介绍了图像二值化算法以及利用VC++软件工具进行算法的实现。论文重点实现了图像分割技术中常用灰度图像二值化算法,如Otsu算法、Bernsen算法,并对这些算法运行的实验结果进行分析与比较。 关键词:图像处理;二值化;VC++; 1.引言 1.1 图像与数字图像 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 数字图像:数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。因此,数字图像实际上就是被量化的二维采样数组。 1.2 数字图像处理技术内容与发展现状 数字图像处理就是采用一定的算法对数字图像进行处理,以获得人眼视觉或者某种接受系统所需要的图像处理过程。图像处理的基础是数字,主要任务是进行各种算法设计和算法实现。 图像处理技术的发展大致经历了初创期、发展期、普及期和实用化期4个阶段。初创期开始与20世纪60年代,当时的图像采用像素型光栅进行少秒显示,大多采用中、大型机对其处理。在这一时期,由于图像存储成本高、处理设备昂贵,其应用面很窄。进入20世纪70年代的发展期,开始大量采用中、小型机进行处理,图像处理也逐渐改用光栅扫描方式,特别是CT和卫星遥感图像的出现,对图像处理技术的发展起到了很好的推动作用。到了20世纪80年代,图像处理技术进入普及期,此时的微机已经能够担当起图形图像处理的任务。超大规模集成电路(Very Large Scale Integration, VLSI)的出现更使处理速度大大提高,设备造价也进一步降低,极大地促进了图形图像系统的普及和应用。20世纪90年代是图像处理技术的实用化时期,图像处理的信息量巨大,对处理速度的要求极高。 1.3 图像二值化原理及意义 图像二值化是指用灰度变换来研究灰度图像的一种常用方法,即设定某一阈值将灰度

方差概念及计算公式

方差概念及计算公式 一.方差的概念与计算公式 例1两人的5次测验成绩如下: X:50,100,100,60,50 E(X )=72;Y:73,70,75,72,70 E(Y )=72。 平均成绩相同,但X不稳定,对平均值的偏离大。方差描述随机变量对于数学期望的偏离程度。 单个偏离是 消除符号影响 方差即偏离平方的均值,记为D(X ): 直接计算公式分离散型和连续型,具体为: 这里是一个数。推导另一种计算公式 得到:“方差等于平方的均值减去均值的平方”,即 , 其中

分别为离散型和连续型计算公式。称为标准差或均方差,方差描述波动程度。 二.方差的性质 1.设C为常数,则D(C) = 0(常数无波动); 2.D(CX )=C2D(X ) (常数平方提取); 证: 特别地D(-X ) = D(X ), D(-2X ) = 4D(X )(方差无负值) 3.若X、Y相互独立,则 证:记 则 前面两项恰为D(X )和D(Y ),第三项展开后为 当X、Y 相互独立时, , 故第三项为零。 特别地 独立前提的逐项求和,可推广到有限项。 三.常用分布的方差 1.两点分布

2.二项分布 X ~ B( n, p ) 引入随机变量X i(第i次试验中A出现的次数,服从两点分布) , 3.泊松分布(推导略) 4.均匀分布 另一计算过程为 5.指数分布(推导略) 6.正态分布(推导略) ~ 正态分布的后一参数反映它与均值的偏离程度,即波动程度(随机波动),这与图形的特征是相符的。 例2求上节例2的方差。 解根据上节例2给出的分布律,计算得到

求均方差。均方差的公式如下:(xi为第i个元素)。 S = ((x1-x的平均值)^2 + (x2-x的平均值)^2+(x3-x的平均值)^2+...+(xn-x的平均值)^2)/n)的平方根 大数定律表表明:事件发生的频率依概率收敛于事件的概率p,这个定理以严格的数学形式表达了频率的稳定性。就是说当n很大时,事件发生的频率于概率有较大偏差的可能性很小。由实际推断原理,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。 用matlab或c语言编写求导程序 已知电容电压uc,电容值 求电流i 公式为i=c(duc/dt) 怎样用matlab或c语言求解 函数的幂级数展开式

指纹图像二值化算法的研究_祁亚萍

科技信息 SCIENCE &TECHNOLOGY INFORMATION 2011年第23期0引言 指纹识别技术是当前生物识别技术中应用最为广泛的一种。自动指纹识别的关键技术包含指纹预处理,指纹特征提取,指纹特征匹配几方面。实际得到广泛应用的指纹特征匹配多是基于指纹细节点特征。指纹细节点特征的提取通常在细化二值指纹图像上进行。图像二值化就是根据一定的规则,将一幅图像变为只用两阶灰度表示的黑白图像。二值化指纹图像中通常黑像素表示指纹的脊线,而白像素表示指纹的谷线和背景区。 1指纹图像二值化算法分析 指纹图像二值化方法主要有两种:灰度阈值分割法和邻域分析法。目前,自动指纹识别系统中应用的灰度阈值分割二值化算法根据阈值选取方式的不同可以分为全局固定阈值法和局部自适应动态阈值法。 1.1全局固定阈值法 全局固定阈值法一般根据整幅指纹图像前景区的灰度直方图分布选择一个合适的判断阈值,对整幅指纹图像进行二值化处理。该算法在指纹图像对比度较好的情况下,统计直方图的两个峰值比较明显,能够选择合适的阈值对指纹图像进行二值化处理。但该判定阈值的选择完全依赖于统计直方图,抵抗噪声干扰的能力较弱。另外,采集到的指纹图像中心区域和边缘区域的灰度分布一般难以达到一致,故全局固定阈值二值化算法并不能很好地适应实际处理的要求。1.2局部自适应动态阈值法 局部自适应动态阈值法是将整幅指纹图像分块,结合各块图像的自身特点,为每块图像分别选取不同的阈值,对各块指纹图像区域进行二值化处理。分块大小的设定和局部判决阈值的选取对指纹图像二值化效果起着关键作用。最佳的分块大小应该选取指纹图像纹线的整数倍距离,实际应用中很难精确地确定出指纹纹线距离,而且同一指纹图像的各区域纹线距离并不总是一致的。局部自适应动态阈值选取的一般依据是:对每块图像选取的阈值应尽量使该块图像内大于该阈值的像素点数和小于该阈值的像素点数大致相等。 该类算法实现的一般步骤为:首先对整幅指纹图像进行分块;然后根据某一规则确定局部灰度阈值T ;最后将方块中每个像素的灰度值与T 值比较。如果低于灰度阈值T 则视为脊线点,置为0;反之则视为谷线点,置为255。通常阈值T 取块内灰度均值较为简单,但抗噪能力较差。下面对现有的局部阈值选取方法进行分析。 文献[2]将指纹的方向信息引入到二值化处理过程中,综合考虑指纹的方向信息和自适应选择局部阈值,提出了一种结合方向信息的自适应局部阈值二值化算法。局部阈值确定采用迭代法,首先将指纹图像分成W ×W 的块,计算每块的平均灰度值;然后分别计算该区域内大于等于阈值T 的像素点个数N H 和小于阈值T 的像素点个数N L ;当|Nh-Nl|≤α(α=W ×W ×10%)时,则T 为阈值,否则循环调整T 值,直到得到满足上述不等式条件的阈值T 。根据沿指纹脊线方向上的像素灰度阶近似一致的特点,制定二值化规则。具体参见文献[2]。 文献[3]在文献[2]的基础上有所改进,计算局部阈值时综合考虑周边邻域像素的影响,采用块重叠的方式求取阈值T ,并对块内像素进行分类二值化。对二值化图像根据指纹纹理特点和方向信息进行去除粘线,消除孔洞的处理,在一定程度上提高了算法的鲁棒性和抗噪能力,但同时也增加了算法复杂度,降低了处理效率。 文献[4]指出对于一幅指纹图像,由于在脊线和谷线的分界处灰度的变化最大,不确定性最高,以脊线和谷线分界处灰度阶作为分割阈值得到的信息熵最大。文献[5]利用此结论将信息熵引入到指纹图像二值化算法中,先对指纹图像进行分块处理,提取指纹图像有效区域,然 后求取使局部信息熵最大的灰度值作为判决阈值进行二值化处理。该算法对噪声具有鲁棒性,能够有效实现对指纹图像的二值化,提高了细节特征提取结果的准确率,但灰度阈值的计算复杂度较大。1.3邻域分析法 邻域分析法充分利用指纹图像纹线的连续性和脊线谷线相间隔的特点。若指纹图像的某一点在脊线上,则与该点相邻的切线方向上的像素点也应位于脊线上,而该点纹线方向的垂直方向上的点应位于谷线上。因此,对于脊线上的点来说,沿纹线方向的灰度均值较小,沿纹线方向的垂直方向上灰度均值较大。 文献[6]基于指纹图像的这一特点给出一种基于方向信息的指纹图像自适应二值化算法。具体算法为:对于前景区域每一像素点g(x,y),以其为中心分别计算纹线方向上的m 个邻域点的加权灰度均值Gh(x,y)和纹线垂直方向上m 个点的加权灰度均值Gv(x,y);若Gh(x,y)

单因素方差分析的计算步骤

一、 单因素方差分析的计算步骤 假定实验或观察中只有一个因素(因子)A ,且A 有m 个水平,分别记为,,,21m A A A 在每一种水平下,做n 次实验,在每一次试验后可得一实验值,记做ij x 表示在第j 个水平下的第i 个试验值 m j n i ,2,1;,2,1 。结果如下表3.1: 表3.1 单因素方差分析数据结构表 为了考察因素A 对实验结果是否有显著性影响,我们把因素A 的m 个水平m A A A ,,21看成是m 个正态总体,而 m j n i x ij ,2,1;,2,1 看成是取自第j 总体的第i 个样品,因此,可设 m j n i a N x j ij ,2,1;,2,1,,~2 。 可以认为j j j a , 是因素A 的第j 个水平j A 所引起的差异。因此检验因素A 的各水平之间是否有显著的差异,就相当于检验: m a a a H 210:或者 0:210 m H 具体的分析检验步骤是: (一) 计算水平均值 令j x 表示第j 种水平的样本均值,

j n i ij j n x x j 1 式中,ij x 是第j 种水平下的第i 个观察值,j n 表示第j 种水平的观察值次数 (二)计算离差平方和 在单因素方差分析中,离差平方和有三个,它们分别是总离差平方和,组内离差平方和以及组间平方和。 首先,总离差平方和,用SST 代表,则, 2)( x x SST ij 其中,n x x ij 它反映了离差平方和的总体情况。 其次,组内离差平方和,用SSE 表示,其计算公式为: j i j ij x x SSE 2 其中j x 反映的是水平内部或组内观察值的离散状况,即反映了随机因素带来的影响。 最后,组间平方和,用SSA 表示,SSA 的计算公式为: 2 2 x x n x x SSA j j j 用各组均值减去总均值的离差的平方,乘以各组观察值个数,然后加总,即得到SSA 。可以看出,它所表现的是组间差异。其中既包括随机因素,也包括系统因素。 根据证明,SSA SSE SST ,,之间存在着一定的联系,这种联系表现在: SSA SSE SST 因为: 2 2 x x x x x x j j ij ij x x x x x x x x j j ij j j ij 22 2 在各组同为正态分布,等方差的条件下,等式右边最后一项为零,故有, 222)()()( x x x x x x j j ij ij 即 SSA SSE SST

期望-方差公式

期望与方差的相关公式 -、数学期望的来由 早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目,题目是这样的:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。当比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平? 用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)*(1/2)=3/4,或者分析乙获胜的概率为(1/2)*(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。 这个故事里出现了“期望”这个词,数学期望由此而来。 定义1 若离散型随机变量ξ可能取值为i a (i =1,2,3 ,…),其分布列为i p (i =1,2,3, …),则当i i i p a ∑∞ =1 <∞时,则称ξ存在数学期望,并且数学期望为E ξ=∑∞ =1 i i i p a , 如果i i i p a ∑∞ =1 =∞,则数学期望不存在。[]1 定义2 期望:若离散型随机变量ξ,当ξ=x i 的概率为P (ξ=x i )=P i (i =1,2,…,n ,…),则称E ξ=∑x i p i 为ξ的数学期望,反映了ξ的平均值. 期望是算术平均值概念的推广,是概率意义下的平均.E ξ由ξ的分布列唯一确定. 二、数学期望的性质 (1)设C 是常数,则E(C )=C 。 (2)若k 是常数,则E (kX )=kE (X )。 (3))E(X )E(X )X E(X 2121+=+。 三、 方差的定义 前面我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,

方差公式

一.方差的概念与计算公式 例1 两人的5次测验成绩如下: X: 50,100,100,60,50 E(X )=72; Y: 73, 70, 75,72,70 E(Y )=72。 平均成绩相同,但X 不稳定,对平均值的偏离大。 方差描述随机变量对于数学期望的偏离程度。 单个偏离是 消除符号影响 方差即偏离平方的均值,记为D(X ): 直接计算公式分离散型和连续型,具体为: 这里是一个数。推导另一种计算公式 得到:方差等于平方的均值减去均值的平方。 其中,分别为离散型和连续型计算公式。称为标准差或均方差,方差描述波动 二.方差的性质 1.设C为常数,则D(C) = 0(常数无波动); 2. D(CX )=C2 D(X ) (常数平方提取); 证: 特别地 D(-X ) = D(X ), D(-2X ) = 4D(X )(方差无负值) 3.若X 、Y 相互独立,则 证:记 则 前面两项恰为 D(X )和D(Y ),第三项展开后为 当X、Y 相互独立时, , 故第三项为零。 特别地 独立前提的逐项求和,可推广到有限项。 方差公式: 平均数:M=(x1+x2+x3++xn)/n (n表示这组数据个数,x1、x2、x3xn表示这组数据具体数值)方差公式:S=〈(M-x1)+(M-x2)+(M-x3)++(M-xn)〉╱n 三.常用分布的方差 1.两点分布 2.二项分布 X ~ B ( n, p ) 引入随机变量 Xi (第i次试验中A 出现的次数,服从两点分布) , 3.泊松分布(推导略) 4.均匀分布 另一计算过程为 5.指数分布(推导略) 6.正态分布(推导略) 7.t分布 :其中X~T(n),E(X)=0;D(X)=n/(n-2); 8.F分布:其中X~F(m,n),E(X)=n/(n-2); ~

灰度图像二值化方法matlab代码[1]

Bernsen算法代码: clc; clear all close all I=imread('****'); [m,n] = size(I); I_gray=double(I); T=zeros(m,n); M=3; N=3; for i=M+1:m-M for j=N+1:n-N max=1;min=255; for k=i-M:i+M for l=j-N:j+N if I_gray(k,l)>max max=I_gray(k,l); end if I_gray(k,l)T(i,j) I_bw(i,j)=255; else I_bw(i,j)=0; end end end subplot(121),imshow(I); subplot(122),imshow(I_bw);

改进的Bernsen算法代码:clc; clear all close all I=imread('****'); I_gray=double(I); [m,n] = size(I); a=0.3; A=0;T1=0;S=0; for i=1:m for j=1:n A=A+I_gray(i,j) ; end end A=A*0.9; while(Smax max=I_gray(k,l); end if I_gray(k,l)

相关文档
最新文档