2个Weibull分布的Pearson-χ~2距离
计量经济学(庞皓)第二版课后思考题答案3

答:多元线性回归分析中,多重可决系数是模型中解释变量个数的增函数,这给对比不同模 型的多重可决系数带来缺陷,所以需要修正。可决系数只涉及变差,没有考虑自由度。如果 用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。 联系:由方差分析可以看出,F 检验与可决系数有密切联系,二者都建立在对应变量变 差分解的基础上。F 统计量也可通过可决系数计算。对方程联合显著性检验的 F 检验,实际 F 检验有精确的分布, 上也是对可决系数的显著性检验。区别: 它可以在给定显著性水平下, 给出统计意义上严格的结论。可决系数只能提供一个模糊的推测,可决系数越大,模型对数 据的拟合程度就越好。但要大到什么程度才算模型拟合得好,并没有一个绝对的数量标准。 3.5 什么是方差分析?对被解释变量的方差分析与对模型拟合优度的度量有什么联系和区 别? 答:被解释变量 Y 观测值的总变差分解式为: TSS = ESS + RSS 。将自由度考虑进去进行 方差分析,即得如下方差分析表: 变差来源 源于回归 源于残差 总变差
Y = b1 + β 2 X 2 + β3 X 3 + β 4 X 4 + u
其中,Y 为汽车销售量,X2 为居民收入, X3 为汽车价格, X4 为汽油价格,像其他费用、 道路状况、政策环境等次要因素包含在随机误差项 u 中。 3.9 说明用 Eviews 完成多元线性回归分析的具体操作步骤。 答:1、建立工作文件,建立一个 Group 对象,输入数据。 2、点击 Quick 下拉菜单中的 Estimate Equation。 3、在对话框 Equation Specification 栏中键入 Y C X2 X3 X4 ,点击 OK,即出现回归结 果。
而当 X 2 和 X 3 相互独立时, X 2 和 X 3 的斜方差等于零,即:
最小二乘法实现威布尔分布拟合

最小二乘法实现威布尔分布拟合一、概述在统计学和概率论中,威布尔分布是一种连续概率分布,通常用于描述事件的持续时间或生存时间。
最小二乘法是一种常用的参数拟合方法,可以用于拟合威布尔分布的参数。
本文将介绍如何使用最小二乘法实现威布尔分布的拟合,从而更好地分析和解释实际数据。
二、威布尔分布的概述威布尔分布是描述正定随机变量的概率分布,其概率密度函数为:\[f(x;\lambda,k) = \frac{k}{\lambda}(\frac{x}{\lambda})^{k-1}e^{-(\frac{x}{\lambda})^k}\]其中,\(x \geq 0, \lambda > 0, k > 0\),\(\lambda\)和k分别是威布尔分布的尺度参数和形状参数。
威布尔分布可以用于描述许多自然现象的持续时间或生存时间,例如产品的寿命、设备的故障时间等。
三、最小二乘法的原理最小二乘法是一种常用的参数拟合方法,其原理是通过最小化实际观测值与拟合值之间的误差平方和来确定模型的参数。
对于威布尔分布拟合来说,最小二乘法可以用于估计分布的尺度参数和形状参数。
四、最小二乘法实现威布尔分布拟合的步骤要实现威布尔分布的拟合,可以按照以下步骤进行:1. 收集实际数据。
首先需要收集与威布尔分布相关的实际数据,例如产品的寿命数据或设备的故障时间数据。
2. 确定拟合函数。
根据威布尔分布的概率密度函数,确定拟合函数的形式,并假设其为威布尔分布的概率密度函数。
3. 构建最小二乘法的优化目标函数。
将拟合函数的参数作为优化变量,构建目标函数为实际观测值与拟合值之间的误差平方和。
4. 求解最小二乘法的优化问题。
通过数值优化算法,求解目标函数的最小值,得到威布尔分布的尺度参数和形状参数的估计值。
5. 模型检验和结果分析。
对拟合的威布尔分布模型进行检验,判断拟合结果的合理性,并进行相应的结果分析和解释。
五、实例分析下面通过一个实际的例子,演示如何使用最小二乘法实现威布尔分布的拟合。
卫生统计学题库

《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数(parameter)2. 统计量(statistic)3. 总体(population)4. 样本(sample)5. 同质(homogeneity)6. 变异(variation)7. 概率(probability) 8. 抽样误差(sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:A.这300名高血压患者B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布(normal distribution)2. 中位数(median)3. 四分位数间距(quartile interval)4. 方差(variance)5. 正偏态分布(positively skewed distribution)6. 负偏态分布(negatively skewed distribution)7. 对数正态分布(logarithmic normal distribution )8. 医学参考值范围(medical reference range)二、单选题1. μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
应用回归分析-第2章课后习题参考答案解析

2.1 一元线性回归模型有哪些基本假定?答:1. 解释变量 1x , ,2x ,p x 是非随机变量,观测值,1i x ,,2 i x ip x 是常数。
2. 等方差及不相关的假定条件为⎪⎪⎩⎪⎪⎨⎧⎪⎩⎪⎨⎧≠=====j i n j i j i n i E j i i ,0),,2,1,(,),cov(,,2,1,0)(2 σεεε 这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M 条件。
在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差2σ估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。
3. 正态分布的假定条件为⎩⎨⎧=相互独立n i ni N εεεσε,,,,,2,1),,0(~212 在此条件下便可得到关于回归系数的最小二乘估计及2σ估计的进一步结果,如它们分别是回归系数的最及2σ的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。
4. 通常为了便于数学上的处理,还要求,p n >及样本容量的个数要多于解释变量的个数。
在整个回归分析中,线性回归的统计模型最为重要。
一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进行处理。
因此,线性回归模型的理论和应用是本书研究的重点。
1. 如何根据样本),,2,1)(;,,,(21n i y x x x i ip i i =求出p ββββ,,,,210 及方差2σ的估计;2. 对回归方程及回归系数的种种假设进行检验;3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。
2.2 考虑过原点的线性回归模型 n i x y i i i ,,2,1,1 =+=εβ误差n εεε,,,21 仍满足基本假定。
求1β的最小二乘估计。
答:∑∑==-=-=ni ni i i i x y y E y Q 1121121)())(()(ββ∑∑∑===+-=--=∂∂n i n i ni i i i i i i x y x x x y Q111211122)(2βββ 令,01=∂∂βQ 即∑∑===-n i ni i i i x y x 11210β 解得,ˆ1211∑∑===ni ini ii xyx β即1ˆβ的最小二乘估计为.ˆ1211∑∑===ni ini ii xyx β2.3 证明: Q (β,β1)= ∑(y i-β0-β1x i )2因为Q (∧β0,∧β1)=min Q (β0,β1 )而Q (β0,β1) 非负且在R 2上可导,当Q 取得最小值时,有即-2∑(y i-∧β0-∧β1x i )=0 -2∑(y i-∧β0-∧β1x i ) x i =0又∵e i =y i-( ∧β0+∧β1x i )= y i-∧β0-∧β1x i ∴∑e i =0,∑e i x i =0(即残差的期望为0,残差以变量x 的加权平均值为零)2.4 解:参数β0,β1的最小二乘估计与最大似然估计在εi~N(0, 2 )10ˆˆQQββ∂∂==∂∂i=1,2,……n 的条件下等价。
二参数威布尔分布

二参数威布尔分布
二参数威布尔分布是一种常见的概率分布,也是一种可靠性分析中常用的分布。
它的概率密度函数为:
$$f(x)=frac{beta}{alpha}(frac{x-gamma}{alpha})^{beta-1}exp[ -(frac{x-gamma}{alpha})^{beta}]$$
其中,$alpha$ 和 $beta$ 分别是形状参数和尺度参数,$gamma$ 是位移参数。
二参数威布尔分布的特点是它的故障率函数是单峰的,并且可以描述一些具有逐渐加速的失效率的系统。
该分布在可靠性分析、风险评估、医学统计学等领域有广泛应用。
二参数威布尔分布的参数估计可以使用最大似然估计法或贝叶
斯估计法。
在实际应用中,我们可以使用统计软件对数据进行分析,并得到相应的分布参数,从而进行可靠性分析和风险评估。
- 1 -。
非参数统计分析

第十三章非参数统计分析统计推断方法大体上可分为两大类。
第一大类为参数统计方法。
常常在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
第二大类为非参数统计方法,着眼点不是总体参数,而是总体的分布情况或者样本所在总体分布的位置/形状。
非参数统计方法大约有8种,可被划分为两大类,处理各种不同情形的数据。
单样本情形:检验样本所在总体的位置参数或者分布是否与已知理论值相同。
①Chi-Square过程:针对二分类或者多分类资料例题1:见书P243。
检验样本分布情况是否与已知理论分布相同。
运用卡方检验过程。
②Binomial过程:针对二分类资料或者可转变为二分类问题的资料。
例题2 :见书P246。
检验某一比例是否与已知比例相等,运用二项分布过程。
练习:质量监督部门对商店里面出售的某厂家的西洋参片进行了抽查。
对于25包写明为净重100g的西洋参片的称重结果为(单位:克),数据见非参数。
Sav,人们怀疑厂家包装的西洋参片份量不足,要求进行检验。
③Runs过程:用于检验样本序列是否是随机出现的。
二分类资料和连续性资料均可。
游程检验:游程的含义:假定下面是由0和1组成的一个这种变量的样本:0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。
这个数据中有4个0组成的游程和3个1组成的游程。
一共是R=7个游程。
其中0的个数为m=15,而1的个数为n=10。
游程检验的原理判断数据序列是否是真随机序列。
该检验的原假设为数据是真随机序列,备择假设为非随机序列,在原假设成立的情况下,游程的总数不应太多也不应太少。
例题3:见书P247。
检验样本数据是否是随机出现的。
例题4:从某装瓶机出来的30盒化妆品的重量(单位克),数据见非参数.sav,为了看该装瓶机是否工作正常。
提示:实际需要验证大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。
weibull分布参数置信区间

weibull分布参数置信区间
Weibull分布是一种描述可靠性和寿命数据的概率分布,通常
用于可靠性工程和寿命测试领域。
在统计学中,我们经常需要估计Weibull分布的参数,并计算它们的置信区间。
Weibull分布有两个参数,形状参数(通常记为β)和尺度参
数(通常记为λ)。
估计这些参数的置信区间需要使用统计方法,
最常见的是最大似然估计(MLE)和贝叶斯方法。
对于最大似然估计,我们可以使用样本数据来估计Weibull分
布的参数,然后基于估计值计算置信区间。
通常使用参数估计的标
准误差来计算置信区间。
对于Weibull分布,参数估计的标准误差
可以通过Fisher信息矩阵来计算。
另一种方法是使用贝叶斯方法,它基于先验分布和样本数据来
估计参数的后验分布。
然后可以使用后验分布来计算参数的置信区间,通常是使用最高后验密度(Highest Posterior Density, HPD)区间。
无论使用哪种方法,计算Weibull分布参数的置信区间都需要
考虑样本大小、参数估计的精度和置信水平等因素。
通常情况下,我们使用95%的置信水平来计算置信区间,这意味着我们可以有95%的信心认为真实参数值落在计算的置信区间内。
总之,估计Weibull分布参数的置信区间涉及到统计方法和概率分布理论,需要考虑多个因素来确保估计的准确性和可靠性。
在实际应用中,我们需要根据具体情况选择合适的方法来计算参数的置信区间,并理解置信区间的解释和应用。
2个Weibull分布的Pearson-χ 2距离

定义 3: f x 、g x 是 随机变 量 X 、Y的密度 函数 , 设 () () 并设 f x > () 0,g x > 若 d ( ,) 2g厂 都 () 0, ,g 、d (, )
存 在 ,记
=眦 I
, g ,则称 兹(,) 密度 函数 厂 、 gx之 间 的 P asn 最 大距离 。 ( ) 厂g为 () () ero— 。
者着 重讨论 2个 We u1 布间 的 P asn 距 离 和 P asn 最 大距 离 ,并 给 出了其渐进性 结果 。 i l分 b ero . ero .
l 相 关概念 定义 1 若随机变量 的密度函数为 : (;, = - (l p ep (/ ) x 0 则称 服从参数为 : f x t a x - x( x > , c p - , ( 0 0 的 We u 分布,记作 ~ E (, , 中 为尺度参数, 为形状参数。容易发现 , > , ) p> il b1 W Ba 其
类似性 质 1 ,可 以给 出如下结 论 。
性质 2: ( 具有如 下特性 : 1 , 0 2 , 0 ) , ; ) , 的充要 条件 是 厂曲= ( 3 = 兹( ( = ( g曲; ) (
、
当 =1 ,We u1 布即为指 数分 布 。 时 i l分 b
定义 2:设 随机变量 、 】的密度 函数分别是 厂 、gx,并设 ( o , ( ( ) > ,若 f ( /(d<o,记 g x fxx +  ̄) ) o d g=g( /(d一 ,称 d(,) 2 ) f2 )fxx 1 x ) 2 g是密度函数 gx到密度 函数 fx的 Pa o— 距离。 f () ( ) er n s
Absr c :I h spa e ,we g v he e p e so so h as n t a t n t i p r i e t x r si n ft e Pe ro - d sa c n h xm u Pe s n itn e a d te ma i m a o —Z r
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定 义 2 : 设 随 机 变 量 X 、 Y 的 密 度 函 数 分 别 是 f ( x) 、 g ( x) , 并 设 f ( x) > 0 , 若 ∫ g 2 ( x) / f ( x)dx < +∞ , 记
d 2 ( f , g ) = ∫ g 2 ( x ) / f ( x )dx − 1 ,称 d 2 ( f , g ) 是密度函数 g ( x ) 到密度函数 f ( x ) 的 Pearson- χ 2 距离。
0
引言
数理统计中比较 2 个密度函数差异性的 Pearson- χ 2 距离 [1 - 2] 有着广泛的应用,近年来,人们给出了
Pearson- χ 2 距离和 Pearson- χ 2 最大距离的诸多性质 [3- 4]以及一些重要分布的 2 种距离及其渐进性质 [5- 6]。笔 者着重讨论 2 个 Weibull 分布间的 Pearson- χ 2 距离和 Pearson- χ 2 最大距离,并给出了其渐进性结果。
2 2 当 α1 / 2 <α2 <α1时 。 并 有 : 1) 当 α α α2 时 , dm ( f , g) →+∞; 3) 当 α1 →2−β α2 时 , 1→ 2 时 , dm ( f , g ) →0 ; 2 ) 当 α 1→ 2 2 dm ( f , g) →+∞。
β
β
β
β
β
β 证明: 在定理 1 和定理 2 结论的基础上, 比较 (2)式和 (3)式的大小, 由于 d 2 ( f , g ) / d 2 ( g , f ) = [α 2 (2α1β −
distance between two Weibull distributions by discussing Weibull distribution and the Pearson- χ 2 distance.
Key words: Weibull distribution; the Pearson- χ 2 distance; the maximum Pearson- χ 2 distance
XU Shou-fang
(Department of Mathematics, Xinxiang University, Xinxiang 453003, China)
Abstract: In this paper, we give the expressions of the Pearson- χ 2 distance and the maximum Pearson- χ 2
第 27 卷 第 4 期 Vol. 27 No. 4
新乡学院学报:自然科学版 Journal of Xinxiang University: Natural Science Edition
2010 年 8 月 Aug. 2010
2 个 Weibull 分布的 Pearson- χ 2 距离
许寿方
( 新乡学院 数学系,河南 新乡 453003) 要: 通过对 Weibull 分布和 Pearson- χ 2 距离等概念的讨论, 给出了 2 个 Weibull 分布的 Pearson- χ 2 距离
证明: 对双参数 Weibull 分布 WEB(α, β ) , 当 β =1时, 令 λ = α −1 , 即得其密度函数 f (x) = λexp(−λx) , 其中 λ > 0 ,
−1 即参数为 λ 的指数分布。因此,在定理1中只需取 β = 1 、 α1 = λ1−1 、 α2 = λ2 即可得到要证明的结论。
β β −1 −1 β β 2 2 2 定、 α α α1β −α2 ) ] (α1 −α2 ) ,当 α1 <α2 < 2α1 时 ; dm ( f , g) = [α1β (2α2β −α1β )]−1(α1β −α2β )2 , 1 / 2<α 2< 2 1时,有 dm ( f , g) =[α2 (2
当 f ( x ) 、 g ( x ) 都是离散随机变量的密度函数时 , 定义 2 中的积分号需换成相应的求和号。 性质 1: d 2 ( f , g ) 具有如下特性: 1) d 2 ( f , g ) ≥ 0 ; 2 ) d 2 ( f , g ) = 0 的充要条件是 f ( x ) = g ( x ) 。 性 质 1 是 容 易 验 证 的 , 容 易 看 出 定 义 2 中 的 Pearson- χ 2 距 离 不 能 满 足 距 离 公 理 的 对 称 性 , 即 : d 2 ( f , g ) ≠ d 2 ( g , f ) 。下面的定义弥补了这个缺陷,同时又保持了 Pearson- χ 2 距离自身的特性。 定义3:设 f ( x ) 、 g ( x ) 是随机变量 X 、Y 的密度函数,并设 f ( x ) > 0 , g ( x ) > 0 ,若 d 2 ( f , g ) 、 d 2 ( g , f ) 都
由定理2和定理3可得下面的结论。 推论2:设 f ( x ) 、 g ( x ) 分别是具有参数 λ1、λ2 的指数分布的密度函数,则当 λ2 < 2λ1 时,有 d 2 ( g , f ) =
−2β β β −1 β β −1 β = ∫0 α2 α1 (2α1β −α2 ) α1 α2 α β(x /α)β−1 exp(−(x /α))β dx =[α2 ( 2α1β −α2β )]−1α12β ∫0 α−1β(x / α)β−1 exp(−(x / α))β dx =[α2β ( 2α1β −α2β )]−1α12β , +∞
2
主要结论
定理1:设 f ( x ) 是 Weibull 分布 WEB (α1 , β ) 的密度函数, g ( x ) 是 Weibull 分布 WEB (α 2 , β ) 的密度函数,
当 β 确定, 且 α 2 < β 2α1 时, 有 d 2 ( f , g ) = [α 2β (2α1β − α 2β )]−1 (α1β − α 2β ) 2 , 并有以下结论:1) 当 α 2 → α1 时,d 2 ( f , g ) → 0 ;
2 2 时, d m ( f , g ) → +∞ ;当 α1 → 2− β α 2 时, d m ( f , g ) → +∞ 。
β
推论1: 设 f ( x ) 、g ( x ) 分别是具有参数 λ 1、 λ 2 的指数分布的密度函数, 则 λ 1 < 2 λ 2 时, 有 d2 ( f ,g)
= [ λ1 (2 λ2 − λ1 )]−1 ( λ1 − λ2 ) 2 ,并有: 1) 当 λ1 → λ2 时, d 2 ( f , g ) → 0 ; 2 ) 当 λ1 → 2λ2 时, d 2 ( f , g ) → +∞ 。
β β 2 2β β β −1 β 2 [α1β (2α 2 − α1β )]−1 (α1β − α 2 ) ; 当 α1 / α 2 < 1 时,α12β / α2 = (α1 / α2 )2β < 1 , 即可得 [α 2 (2α1β − α 2 )] (α1β − α 2 ) > β β 2 2 [α1β (2α 2 − α1β )]−1 (α1β − α 2 ) 。因此,可得 (4)式成立。容易验证:当 α1 → α 2 时,d m ( f , g ) → 0 ;当 α1 → 2α 2
1
相关概念
定义 1:若随机变量 X 的密度函数为: f ( x;α, β ) = α −1β (x / α )β −1 exp(−(x / α ))β ,x ≥ 0 ,则称 X 服从参数为
α 、 β (α > 0, β > 0) 的 Weibull 分布,记作 X ∼ WEB (α, β ) ,其中 α 为尺度参数, β 为形状参数。容易发现, 当 β = 1 时, Weibull 分布即为指数分布。
β
成立。易验证,当 α2 →α1 时, d ( f , g) →0 ;当 α2 → 2α1 时 d ( f , g ) →+∞ 。类似于定理 1,可以得到定理 2。 定理2:设 f ( x ) 是 Weibull 分布 WEB (α1 , β ) 的密度函数, g ( x ) 是 Weibull 分布 WEB(α2 , β ) 的密度函数,
收稿日期:2010-02-26 修回日期:2010-06-08
作者简介:许寿方(1980-),男,河南新乡人。硕士,研究方向:概率统计。E-mail: xuxu8803@。
许寿方:2 个 Weibull 分布的 Pearson- χ 2 距离
2 ) 当 α 2 → 2α1 时, d 2 ( f , g ) → +∞ 。
2 2 存在,记 dm ( f , g) = max{d2 ( f , g) , d2 ( g, f )} ,则称 dm ( f , g ) 为密度函数 f ( x ) 、 g ( x ) 之间的 Pearson- χ 2 最大距离。 类似性质 1,可以给出如下结论。 2 2 2 2 2 性质2: dm ( f , g) 具有如下特性: 1) dm ( f , g ) ≥ 0 ; 2) dm ( f , g) = 0 的充要条件是 f ( x) = g( x) ; 3) dm ( f , g) = dm ( g, f ) 。 2 显而易见,在度量 2 个密度函数的差异时, d m ( f , g ) 比 d 2 ( f , g ) 更加合理。