概率论与数理统计7.4

合集下载

理学概率论与数理统计教程茆诗松第7章

理学概率论与数理统计教程茆诗松第7章
一对应的。
7.2.2 两个正态总体均值差的检验
检验 法
u检 验
t检 验
条 原假 件 设H 0
1, 2
已 知
1, 2
未 知
1 2
1 2 1 2 1 2
1 2 1 2 1 2
备择 检验统 假设 H 1 计量
拒绝域
1 2 1 2 1 2
1 2 1 2 1 2
x y { u u 1 }
设承受方有理由猜测甲地发送的讯号值为8, 问能否承受这猜测?
解:这是一个假设检验的问题,总体X ~N(2),
检验假设: H 0: 8v .s. H 1: 8
这个双侧检验问题的拒绝域为
|u|u1/2
取置信水平 ,那么查表知 u。
用观测值可计算得
x 8 0 1 5 ,u 5 8 .1 5 8 0 .2 1 .6 7 7 1
W |x0| snt1/2(n1)
它可以改写为
W xs n t1 /2 (n 1 )0 xs n t1 /2 (n 1 )
并且有 P0 (W) 1, 这里0并无限制.
假设让 0 在(- )内取值,就可得到
置信区间: x
s n
t1/2(n1)
的1-
反之假设有一个如上的1- 置信区间,也可获得
u 值未落入拒绝域内,故不能拒绝原假设, 即承受原假设,可认为猜测成立。
二、 未知时的t 检验
由于 未知,一个自然的想法是将〔7.2.4〕中
未知的 替换成样本标准差s,这就形成t 检验
统计量
t n x 0 s
(7.2.9)
三种假设的检验拒绝域分别为
tt1n1, t tn1, |t|t1/2n1 .
➢ 当备择假设 H 1在原假设 H 0 一侧时的检验称 为单侧检验;

概率论与数理统计

概率论与数理统计

2.和(并):
3.互斥(互不相容):对立:
事件的运算:
伯努利大数定律:当试验次数n足够大时,事件发生的频率就约等于事件发生的概率。

全概率公式、贝叶斯公式
定义:
引入随机变量后,可用随机变量的
等式或不等式来表达随机事件;
随机变量的函数一般也是随机变量
0-1分布是n=1时的二项分布
定义:性质:
定义:
F(x)是X的分布函数,X是连续型随机变量,f(x)是它的概率密度函数,简称概率密度
性质:
均匀分布:
标准正态分布N(0,1)
标准正态分布的分位数
举例:
期望反映了随机变量取值的平均,又称均值。

概率论与数理统计习题详解(周概容)——习题7解

概率论与数理统计习题详解(周概容)——习题7解

—习题解答●7.1— 7.1 假设总体X服从参数为??的泊松分布,nXXX21??是来自总体X的简单随机样本,X是样本均值,2S是样本方差,对于任意实数??,证明12SXE是??的无偏估计量.熟知,对于任何总体,样本均值X是总体数学期望的无偏估计量,样本方差2S是总体方差的无偏估计量;对于泊松分布的总体,数学期望和方差都等于分布参数??,因此.11122SXSXEEE 7.2 设总体X服从参数为??的泊松分布;21nXXX??是来自X的简单随机样本,求2??的无偏估计量.熟知XXDE.设X为样本均值,则.,2222221nnXnXnXXXEEDE 由此可见2??的无偏估计量为.XnX12?? 7.3 设21mXXX??是来自正态总体2NX的简单随机样本,统计量1121niiiXXkD 是总体方差2??的无偏估计量,求常数k.由条件知:222XE.由于统计量D是总体方差2??的无偏估计量,则.22112221112211121122222 nkkXXXXkXXkDniniiiiiniiiEEE 由此可见121nk.7.4 总体2??aNX2??bNY;基于分别来自总体X和Y的两个相互独立的简单随机样本21mXXX??和21nYYY??,得样本均值X和Y及样本方差2xS和2yS;证明总体X和Y的联合样本方差1121222yxxySnSmnmS 是总体X和Y的共同方差2??的无偏估计量,并且计算其方差.熟知,对于任意总体,样本方差2xS和2yS都是2??的无偏估计量,可见22221121yxxySnSmnmSE,—习题解答●7.2—即联合样本方差2xyS是2??的无偏估计量.由正态总体的抽样分布,知2222 xySnm?? 服从自由度为2 nm=??的2??分布;而自由度为??的2??变量的方差等于2??:事实上,设??UUU21??是独立标准正态分布随机变量,则服从自由度为??的2??分布的随机变量X可以表示为:22221??UUUX.由于10NUi,可见21102iUUUiiiEDE;.33de23e21de2122223244222 iuuuiUuuuuuUEE ??????.由此可见21UXEE.因此.22222222422222222 nmnmnmnmSnmnmSxyxy????????????DDD2 7.5 设总体X 服从参数为pm的二项分布,其中m已知;21nXXX??是来自X的简单随机样本,1 求未知参数p的最大似然估计量;2 证明所得估计量是无偏的.1 总体X的概率函数可以表示为.,若不然;,若;0 10 1Cmxpppxpxmxxm?? 参数p的似然函数为XnmnXnniXmniipppXppLi1C11;,其中X为样本均值.对数似然方程为0111ln1lnlnClnln1pXnmnpXnppLpXnm npXnpLniXmi;其解mXp即未知参数p的最大似然估计量.2 由于总体X的数学期望为mp,而对于任何总体X,样本均值X是其数学期望的无偏估计量,可见X 是mp的无偏估计量,从而mXp是未知参数p的无偏估计量.—习题解答●7.3—7.6 设总体X服从区间0??上的均匀分布,21nXXX??是来自X的简单随机样本,1 求未知参数??的最大似然估计量;2 假如所得估计量是有偏估计量,将其修正为无偏估计量. 1 总体X的概率密度函数为.,若不然;,若;001xxf 未知参数??的似然函数为,若不然.;,若;0 0111nnniiXXXfL?? 易见,似然函数??L无驻点.需要直接求??L的最大值点,记nnXXXXmax21;由于nX,且??L随??减小而增大,所以当??nX 时??L达到最大值,故??nX就是未知参数??的最大似然估计量.2 现在验证估计量??nX的无偏性.为此,首先求??nX的概率分布.总体X的分布函数为.,若,,若,若 1 0 0 0 xxxxxF 由于nXXX21??独立同分布,可见??nX的分布函数为,11nnnnnxFxXxXxXxXxXxFPPPP???? 其概率密度为.,若不然,,若0 0dd11xnxxFxFnxFxxfnnnnn 因此,有1dd01??nnxnxxxxxfXnnnnE.这样,??nX是??的有偏估计量.容易验证,??的无偏估计量为1nXnn??.7.7 已知随机变量X的概率密度为若不然.若0 101xxxf 试根据来自X的简单随机样本21nXXX??,求未知参数??的最大似然估计量.—习题解答●7.4—未知参数??的似然函数和对数似然函数为.;;10ln1lnln21n1112111niinnniiXXXXnLXXXXfL??????????由此,得似然方程n1 0lnlniiXnL;其惟一解是niinXnXXn11lnln??????.于是,就是未知参数??的最大似然估计量.7.8 设ugt??是严格单调函数且有惟一反函数.证明,若是未知参数??的最大似然估计量,则gtgT????是的最大似然估计量.设??L是未知参数??的似然函数.记th是??gt??的惟一反函数,则??LthL??.设D是函数??gt??的值域,由“是未知参数??的最大似然估计量”,可见maxmax??thLLLThLDt,即gT??是??gt??的最大似然估计量.7.9 设21nXXX??是来自总体X的简单随机样本,总体X的概率密度为:;,,,若若xxxfx0e 试求未知参数??的最大似然估计量1和矩估计量2. 1 参数??的似然函数为.nXniXniiniiiXfL??1ee11 由此可见,其似然方程无解,需要直接求其似然函数,,,若不然若0 exp211nniiXXXnXL?? 的最大值.当nXXX21??时0L,而当nXXX21??,即nXXXmin21??时??L随??的增大而增大,可见当nXXXmin21??时??L达到最大值.参数??的最大似然估计量为nXXXmin??211??.—习题解答●7.5— 2 求参数??的矩估计量.总体X 的数学期望为:.1edeeded xxxxxxxxxxxfXE 用样本均值X估计XE:1??2X,可得参数??的矩估计量为1??2??X=??.7.10设每次射击的命中率为p.接连不断独立地进行射击直到命中目标为止,nkkk21??是n轮射击各轮实际射击的次数,求命中率p 的最大似然估计量和矩估计量.1 设X表示实际射击的次数,则X服从参数为p的几何分布,而nkkk21??是来自总体X的简单随机样本.总体X的概率函数为2111xpppxpx.命中率p的似然函数为.,1lnlnln1111111pnkpnpLpppppkppLniininknkniiniii将该式两侧对p求导数并令其等于0,得似然方程:.011dlnd1pnkpnppLnii 其惟一解niiknp1 ?? 就是命中率p的最大似然估计量. 2 设X是实际射击的次数,而nkkk21??是来自总体X的简单随机样本,则样本均值为pXknXnii111E,.于是,由pX??1 ??,得未知参数p的矩估计量niiknXp1 1??.7.11 设来自总体X的简单随机样本21nXXX??,总体X的概率分布为22112321????????X,其中0lt??lt1.试求—习题解答●7.6—1 未知参数??的最大似然估计量1;2 未知参数??的矩估计量2;3 当样本值为(112132)时的最大似然估计值1和矩估计值2. 1 求参数??的最大似然估计量.分别以2121n和表示21nXXX?? 中1,2和3出现的次数,则似然函数和似然方程为.,,01222dlnd1ln22ln22lnln1211221212121222222212122121 nLnLLnn 似然方程的惟一解就是参数??的最大似然估计量:n22??211.2 求参数??的矩估计量.总体X的数学期望为221314XE.在上式中用样本均值X估计数学期望XE,可得??的矩估计量:321??2X. 3 对于样本值(112132),由上面得到的一般公式,可得最大似然估计值;321223222??211n?????? 矩估计值326523321??2X??.7.12 设随机变量X的分布函数为.,若,,若=1 0 111xxxxF 其中参数1.设nXXX21??为来自总体X的简单随机样本,求 1 未知参数??的矩估计量;2 未知参数??的最大似然估计量.由条件知随机变量X的概率密度为.,若,,若1 0 11xxxxf 1 X的数学期望为1d11xxxXE.用样本均值X估计XE得—习题解答●7.7— 1X,1XX?? 就是未知参数??的矩估计量.2 未知参数??的似然函数和对数似然函数为;,,,若不然;若ininnnniiXnLXXXXXXXfL1211211ln1lnln 01 似然方程为0lndlnd1niiXnL??????,其唯一解niiXn1ln???? 就是未知参数??的最大似然估计量.7.13 设随机变量X的分布函数为.,,,=xxxxF 0 122 其中0.设nXXX21??为来自总体X的简单随机样本,求未知参数??的最大似然估计量.由条件知随机变量X的概率密度为.,若,,若xxxxf 0 232 未知参数??的似然函数为.若若,,,nnnnnniiXXXXXXXXXXfL ***********??????似然函数??L显然无驻点,需要直接求其最大值点.由??L值随??增大而增大,可见??L的最大值点为nXXXmin??21??.于是nXXXmin??21??就是未知参数??的最大似然估计量.7.14 为观察一种橡胶制品的耐磨性,从这种产品中各随意抽取了5件,测得如下数据:—习题解答●7.8— 185.82,175.10,217.30,213.86,198.40.假设产品的耐磨性2NX,求2和的无偏估计值.样本容量n5.经计算,得样本均值X198.10,样本方差23.3240063.1822S.于是??的无偏估计值;10.198X?? 23.3242??S是2??的无偏估计.7.15 对某种袋装食品的质量管理标准规定:每袋平均重500克,标准差10克.现在从一商店的一批这种袋装食品中随意抽取了14袋,测量每袋的重量,得如下数据:500.90,490.01,501.63,500.73,515.87,511.85,498.39,514.23,487.96,525.01,509.37,509.43,488.46,497.15.假设这种袋装食品每袋的重量X服从正态分布2N.试利用??和??的0.95置信区间,说明抽查结果是否表明这一批袋装食品每袋平均重??和标准差??符合标准.经计算样本均值,64.503??X样本标准差11.11??S正态总体的数学期望??的1置信区间的一般形式为:XX,其中??的表达式区分202已知和2??未知两种情形:未知,若,已知,若 1 00nStnun 其中??u是标准正态分布水平??双侧分位数(附表3),1??nt??是自由度为1n??的t分布水平??双侧分位数(附表4)。

《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。

能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。

参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。

⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。

当然由于样本的随机性,这种推断只能具有⼀定的可靠性。

本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。

由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。

第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。

例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。

现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。

问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。

灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。

即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。

另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。

这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。

究竟是哪种情况与实际情况相符合,这需要作检验。

假如给定显著性⽔平05.0=α。

在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。

《概率论与数理统计》(第三版)课后习题答案

《概率论与数理统计》(第三版)课后习题答案

习题一:1.1 写出下列随机试验的样本空间:(1) 某篮球运动员投篮时, 连续5 次都命中, 观察其投篮次数; 解:连续5 次都命中,至少要投5次以上,故}{ ,7,6,51=Ω; (2) 掷一颗匀称的骰子两次, 观察前后两次出现的点数之和; 解:}{12,11,4,3,22 =Ω; (3) 观察某医院一天内前来就诊的人数;解:医院一天内前来就诊的人数理论上可以从0到无穷,所以}{ ,2,1,03=Ω;(4) 从编号为1,2,3,4,5 的5 件产品中任意取出两件, 观察取出哪两件产品; 解:属于不放回抽样,故两件产品不会相同,编号必是一大一小,故: ()}{;51,4≤≤=Ωj i j i (5) 检查两件产品是否合格;解:用0 表示合格, 1 表示不合格,则()()()()}{1,1,0,1,1,0,0,05=Ω;(6) 观察某地一天内的最高气温和最低气温(假设最低气温不低于T1, 最高气温不高于T2); 解:用x 表示最低气温, y 表示最高气温;考虑到这是一个二维的样本空间,故: ()}{216,T y x T y x ≤≤=Ω ;(7) 在单位圆内任取两点, 观察这两点的距离; 解:}{207 x x =Ω;(8) 在长为l 的线段上任取一点, 该点将线段分成两段, 观察两线段的长度. 解:()}{l y x y x y x =+=Ω,0,0,8 ; 1.2(1) A 与B 都发生, 但C 不发生; C AB ;(2) A 发生, 且B 与C 至少有一个发生;)(C B A ⋃; (3) A,B,C 中至少有一个发生; C B A ⋃⋃;(4) A,B,C 中恰有一个发生;C B A C B A C B A ⋃⋃; (5) A,B,C 中至少有两个发生; BC AC AB ⋃⋃; (6) A,B,C 中至多有一个发生;C B C A B A ⋃⋃;(7) A;B;C 中至多有两个发生;ABC(8) A,B,C 中恰有两个发生.C AB C B A BC A ⋃⋃ ; 注意:此类题目答案一般不唯一,有不同的表示方式。

概率论与数理统计 7.2 数理统计中的三大分布

概率论与数理统计 7.2 数理统计中的三大分布
数理统计
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025

中国矿业大学周圣武概率论与数理统计_图文

中国矿业大学周圣武概率论与数理统计_图文

定义2 设 都是参数θ的无偏估计量,若有
则称
有效。
例:160页,例7、例8
定义3 设
为参数θ的估计量,
若对于任意θ∈Θ,当
则称
的一致估计量。
例:由大数定律知
一致性说明:对于大样本,由一次抽样得到的估 计量 的值可作θ的近似值
例5 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
⑴ 验证
试求θ的极大似然估计值。 解
极大似然估计的不变性
练习
1.设总体X在
上服从均匀分布,
X1 , X 2 ,L X n是来自X的样本,试求 q 的矩估计量
和最大似然估计.
2.设X1,X2,…Xn是取自总体X的一个样本
其中 >0, 求 的极大似然估计.
课堂练习
P156:5,6
作业
P178:1,2,5,6
Fisher
最大似然法的基本思想:
问题:请推断兔子 是谁打中的?
例6 袋中放有白球和黑球共4个,今进行3次有放回 抽样,每次抽取1个,结果抽得2次白球1次黑球,试 估计袋中白球个数。 解 设袋中白球个数为m,
X为3次抽样中抽得的白球数,则
当袋中白球数m分别为1,2,3时, p对应的值分别为1/4,2/4,3/4, X对应的分布律见下表
中国矿业大学周圣武概率论与数理统计_图文 .ppt
第七章 参数估计
§7.1 点估计 §7.2 估计量的评选标准 §7.3 区间估计 §7.4 单个正态总体参数的区间估计 §7.4 两个正态总体参数的区间估计
统计推断
矩估计 点估计 最大似然估计
参数估计
最小二乘估计
区间估计
参数假设检验
假设检验 非参数假设检验

《概率论与数理统计》教案

《概率论与数理统计》教案

《概率论与数理统计》教案第一章:概率的基本概念1.1 随机现象与样本空间1.2 事件及其运算1.3 概率的定义与性质1.4 条件概率与独立性第二章:随机变量及其分布2.1 随机变量的概念2.2 离散型随机变量及其分布2.3 连续型随机变量及其分布2.4 随机变量的数字特征(期望、方差)第三章:多维随机变量及其分布3.1 多元随机变量的概念3.2 联合分布及其性质3.3 独立性及其检验3.4 随机向量的数字特征(协方差、相关系数)第四章:大数定律与中心极限定理4.1 大数定律4.2 中心极限定理4.3 样本均值的分布4.4 样本方差的分布第五章:假设检验与置信区间5.2 常用的检验方法5.3 置信区间的估计5.4 功效分析与错误类型第六章:抽样调查与样本分布6.1 抽样调查的基本概念6.2 随机抽样方法6.3 样本分布的性质6.4 抽样误差的估计第七章:回归分析与相关分析7.1 线性回归模型7.2 回归参数的估计7.3 回归模型的检验与诊断7.4 相关分析与判定系数第八章:时间序列分析8.1 时间序列的基本概念8.2 平稳时间序列的模型8.3 时间序列的预测8.4 季节性分析与指数平滑第九章:非参数统计与生存分析9.1 非参数统计的基本概念9.2 非参数检验方法9.4 生存函数与生存分析的估计第十章:贝叶斯统计与统计软件应用10.1 贝叶斯统计的基本原理10.2 贝叶斯参数估计与预测10.3 贝叶斯统计的应用10.4 统计软件的使用与实践重点和难点解析一、随机现象与样本空间补充说明:事件的关系与包含关系,概率的基本性质(互补性、传递性等),概率的计算方法。

二、随机变量及其分布补充说明:概率质量函数与概率密度函数的区别与联系,分布函数的性质,随机变量的期望与方差的计算。

三、多维随机变量及其分布补充说明:二维随机变量的联合分布函数,条件概率的计算,独立性的数学表述与检验方法。

四、大数定律与中心极限定理补充说明:大数定律的数学表述及其含义,中心极限定理的条件与结论,样本均值与标准差的性质。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
npˆ11 14360.9081 0.2496 384.1677
其它结果见表7.4.6
表7.4.6 诸npˆij的计算结果
<80
8090 9099 100
pˆ i.
营养良好 384.1677 346.8724 259.7631 313.3588 0.9081
营养不良 38.8779 35.1036 26.2881 31.7120 0.0919
表7.4.3 rc列联表
A\B 1
j
c和
1 n11
n1 j
n1c n1
i ni1
nij
nic ni
r nr1
nrj
nrc nr
和 n1
n j
nc n
列联表分析的基本问题是: 考察各属性之间有无
关联,即判别两属性是否独立。如在前例中,问
题是:一个人是否色盲与其性别是否有关?在 rc表中,若以 pi, p j 和pij 分别表示总体中的个体
参数 ,采用极大似然估计,

=
1 1 203 2383 ... 11 6 3.870
2608
将ˆ 代入可以估计出诸 pˆi 。
于是可计算出 2
列表如下。
i
ni
0
57
1
203
2
383
3
525
4
532
5
408
6
273
7
139
8
45
9
27
10
10
11
6
合计 2608
pˆ i
p. j 0.2946 0.2660 0.1992 0.2403
由表7.4.5和表7.4.6可以计算检验统计量的值
2 (367 384.1677)2 (342 346.8724)2
384.1677
346.8724
19.2785
(16 31.7120)2 31.7120
二、诸 pi 不完全已知
若诸 即
pi
,i 1, pi
pi
, k由r
(1,
(r<k)个未知参数
,r ), i 1, ,k.
1,...,确r 定,
首然pˆi先 后给 给pi (出 出1诸, 1,p,i,ˆr,i).r的1,F极is,大hke似的r证然极明估大了计似然ˆ1,估计,ˆr,
§7.4 分布拟合检验
7.4.1 总体分布只取有限个值的情况
设总体X 可以分成k 类,记为A1, , Ak,现对该总
体作了n 次观测,k 个类出现的频数分别为:
k
n1,…,nk, 且 ni n. i 1
检验如下假设: H0 : P( Ai ) pi , i 1, 2, , k.
k
其中诸 pi 0 且 pi 1.
在正态概率纸上作图步骤如下:
(1) 首先将数据排序: 7.2 8.2 8.6 8.8 9.4 9.6 9.8 10.1 10.2 11.1;
(2) 对每一个i,计算修正频率 (i-0.375)/(n+0.25), i=1,2,…,n,
(3) 将点 (x(i), (i 0.375)/(n 0.25)), i 1, 2, , n 逐一点在正态概率纸上,
i 0 1 2 3 4 5 6 7 8 9 10 11
ni 57 203 383 525 532 408 273 139 45 27 10 6
试利用该组数据检验该放射物质在单位时间内放 射出的粒子数是否服从泊松分布。
解:本例中,要检验总体是否服从泊松分布。
观测到 0, 1, …, 11 共 12 个不同取值,这 相当于把总体分成12类。这里有一个未知
它有四个水平,B1, B2, B3, B分4 别表示表中四种
情况。沿用前面的记号,首先建立假设 H0:营养状况与智商无关联,即A与B独立的。 统计表示如下:
H0 : pij pi. p. j , i 1, 2, j 1, 2,3, 4.
在原假设H0成立下,我们可以计算诸参数的极 大似然估计值:
仅属于 Ai ,仅属于B j 和同时属于 Ai 与 B j的概率,可
得一个二维离散分布表(表7.4.4),则“A、B两
属性独立”的假设可以表述为
H0 : pij pi p j ,
i 1, , r, j 1, , c
表7.4.4 二维离散分布表
A\B 1
j
c 行和
1 p11
p1 j
p1c p1
其表达式为
pij

pi p j

ni n
n j n
对给定的显著性水平 ,检验的拒绝域为:
W

{ 2

2 1
((
r
1)(c
1))}.
例7.4.3 为研究儿童智力发展与营养的关系,某 研究机构调查了1436名儿童,得到如表7.4.5的 数据,试在显著性水平0.05下判断智力发展与 营养有无关系。





3.75
2
4
6
4
2
2
由于 2 3未.75落入拒绝域,故接受原假设,
没有理由认为转盘不均匀。
在分布拟合检验中使用p 值也是方便的。 本例中,以T 记服从 2(5)的随机变量,则使用 统计软件可以算出
p P T 3.75 0.5859.
这个p 值就反映了数据与假设的分布拟合程度的 高低,p 值越大,拟合越好。
i 1
一、诸 pi 均已知
如果H0 成立,则对每一类Ai,其频率ni /n与概 率pi 应较接近。即观测频数ni 与理论频数npi 应 相差不大。据此,英国统计学家K.Pearson提出
如下检验统计量:
k
2
ni npi 2
i 1
npi
(7.4.2)
并证明在H0 成立时对充分大的n, (7.4.2) 给出的 检验统计量近似服从自由度为k-1的 分2 布。
额度 5万 10万 20万 30万 50万 100万
概率 0.1 0.2 0.3 0.2 0.1 0.1
现20人参加摇奖,摇得5万、10万、20万、30万、 50万和100万的人数分别为2、6、6、3、3、0, 由于没有一个人摇到100万,于是有人怀疑大转 盘是不均匀的,那么该怀疑是否成立呢?这就需 要对转盘的均匀性作检验。
10

18.307.
本例中 2=12.8967<18.307,故接受
原假设。使用统计软件可以计算出
此处检验的p 值是0.2295。
7.4.2 列联表的独立性检验
列联表是将观测数据按两个或更多属性 (定性变量) 分类时所列出的频数表。例 如,对随机抽取的1000人按性别(男或 女)及色觉(正常或色盲) 两个属性分类, 得到如下二维列联表,又称2×2表或四 格表。
约束条件:
r
c
pi 1,
p j 1
i 1
j 1
所以,此时 pij实际上由r+c-2个独立参数所确定。 据此,检验统计量为
r
2
c (nij npˆij )2
i1 j1
npˆ ij
在H2分0成布立。时,上式服从自由度为rc-(r+c-2)-1的
其中诸 pˆij是在H0成立下得到的pij 的极大似然估计,
一、 正态概率纸
正态概率纸可用来作正态性检验,方法如下: 利用样本数据在概率纸上描点,用目测方法看 这些点是否在一条直线附近,若是的话,可以 认为该数据来自正态总体,若明显不在一条直 线附近,则认为该数据来自非正态总体。
例7.4.4 随机选取10个零件,测得其直径与标 准尺寸的偏差如下:(单位:丝) 9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6
pˆ1 1304 /1436 0.9081, pˆ2 132 /1436 0.0919, pˆ1 423/1436 0.2946, pˆ2 382 /1436 0.2660, pˆ3 286 /1436 0.1992, pˆ4 345/1436 0.2403, 进而可给出诸 npˆij npˆi pˆ j ,如
拒绝域为:
W

2

2 1
k
1
例7.4.1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、4份、6份、4份、2份、2份。 假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:
此处r=2,c=4,(r-1)(c-1)=3,若取 =0.05 ,查表
有 2 0.95
(3)

7.815,由于19.2785>7.815,故拒绝原
假设,认为营养状况对智商有影响。
本例中检验的p 值为0.0002。
7.4.3 正态性检验
正态分布是最常用的分布,用来判断总体分布 是否为正态分布的检验方法称为正态性检验, 它在实际问题中大量使用。
换 y ln x、倒数变换 y 1/ x和根号变换
y x。
例7.4.5 随机抽取某种电子元件10个,测得其寿 命数据如下: 110.47, 99.16, 97.04, 77.60, 4269.82, 539.35, 179.49, 782.93, 561.10, 286.80.
图7.4.3 给出这10个点在正态概率纸上的图形, 这10个点明显不在一条直线附近,所以可以认 为该电子元件的寿命的分布不是正态分布。
5.7
2068
ni npˆi 2 / npˆi
相关文档
最新文档