概率统计第七章1-2
概率论与数理统计复习7章

( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
西北工业大学《概率论与数理统计》课件-第七章 假设检验

装糖重总体 X 的均值和标准差,
由长期实践可知, 标准差较稳定, 设 0.015,
则 X ~ N (, 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 ?
解 1º提出两个对立假设
H0 : 0 0.5 和 H1 : 0 . 2º X 是 的无偏估计量,
则我们拒绝 H0,
反之, 如果 u
x
/
0
n
u,则称 x 与0的差异是 2
不显著的, 则我们接受 H0,
上述关于 x 与 0 有无显著差异的判断是在显 著性水平 之下作出的.
2. 检验统计量
用于检验假设的统计量,称为检验统计量.
如:对于例2, 统计量 U X 0 / n
— 检验统计量.
3. 原假设与备择假设
1 假设 H0 : 0, H1 : 0 ;
2º取检验统计量
U X 0 ~ N (0,1), / n
(当H0为真时)
3º给定显著水平 ( 0< ≤ 0.05)
P{ U u }
2
由
(u
2
)
1
2
,查表可得
u
2
.
拒绝域: W1 {( x1, x2,, xn ) u u }, 2
u U ( x1, x2,, xn )
分析:从直观上分析,这批产品不能出厂. 因为抽样得到的次品率: 2 3% 10 然而,由于样本的随机性,如何才能根据抽
样结果判断总体(所有产品)的次品率是否≤3%?
解 用假设检验法,步骤:
1º提出假设 H0: p 0.03 其中 p为总体的次品率.
2º设
Xi
1, 0,
概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章

写在前面:由于答案是一个个复制到word rh,比校耗时耗力,故下载收取5分・希望需要的朋友给予理解和支持!PS网上有一些没经我同总就将我的答案整合、转换成pdf,放在文库里的.虽然是免费的.但是窃取f我的劳动成果,希望有心的朋友支持我一下.下载我的原版答案。
第七章假设检验假设检验的基本談念习题1 样木容fin确定后,在一个假设检验中•给定显著水平为*设此第一类错的概率为。
•则必有()•(A)a+p=l; (B)a+p>l; (C)a+p<l; {D)a+p<2.解答: 应选(D)・当样木容Sn确定后.aQ不能同时都很小.即a变小时,p变大:而P变小时• a变大.理论上,自然希望犯这两类错误的概率都很小・但a*的大小关系不能确定.并且这两类错谋不能同时发生,即a=l且p=l不会发生.故选(D).习題2设总休X^(g,a2b其中02已知,着要检验W需川统计a U=X"-gOa/n,(1)若对敢边检验,统计假设为则拒绝区间为(2)若肌边假设为H0:g=g0,Hl:n<^0,则拒绝区间为. (给定显着性水平为4样木均值为X•,样木容fi 为n,且可记ul・a为标准正态分布的(l・a)分位数).解答:由敢侧检验及拒绝的概念即可御到.习題3 如何理解假设检验所作出的〃拒绝原假设H0"和“接受原假设Hcr的判断解答:拒绝H0是有说服力的,接受H0是没有充分说服力的•因为假设检验的方法是概率性质的反证法.作为反证法就是必然要〃推出矛盾r才能得出"拒绝HO"的结论.这是有说服力的・如果“推不出矛盾化这时只能说〃目前还找不到拒绝H0的充分理由W此“不拒绝H0”或〃接受HCr\这并没有肯定H0—定成立•由于样木观察值是随机的• W此拒绝H0.不童味着H0是假的•接受H0也不意味着H0是真的•都存在着错误决策的可能.当原假设H0为真,而作出r拒绝H0的判断,这类决策错谋称为第一类错谋.又叫弃真错洪•显然犯这类错渓的概率为前述的小槪率a:a=P(拒绝HOIHO为真);而原假设HO不真•却作出接受H0的判断•称这类错误为第二类错误,又称取伪错误.它发生的槪率P为P二P(接受HO|H0不真).习題4 犯第一类错误的概率a与犯第二类错谋的概率P之间有何关系一般來说.当样木容g固定时,若减少犯一类错误的槪率.则犯另一类错渓的概率往往会增大•要它们同时减少,只有増加样木容a n.在实际问题中,总是控制犯節一类错误的概率a而使犯第二类错谋的概率尽可能小・a的大小视具体实际问题而定.通常取a弓等tfL 习題5 在假设检验中•如何理解指定的显著水平a 解答:我们希望所作的检验犯两类错谋的槪率尽可能都小・但实际上这是不可能的•当样木容Sn固定时,一般地•减少犯其中一个错谋的槪帑就会增加犯另一个错误的概率• W此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平6因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,«原因是不知道犯第二类错误的概率P处竟有多少.且a小,P就大.所以通常用JW 相容r 〃不拒绝HO"等词语來代替“接受H0".而"不拒绝HO"还包含有再进一步作抽样检验的意思.习题6 在假设检验中•如何确定原假设H0和备择假设H1 解答: 在实际中・通常把那些需要着重考虑的假设视为原假设H0.而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设.而将新方案取为备择假设:(2)若提出一个假设・检验的目的仅仅是为r判断这个假设是否成立.这时直接取此假设为原假设H0即可. 习題7 假设检验的基木步腺有哪些解答:根据反证法的思想和小概率原理•可将假设检验的步骤归纳如下:(1)根据问题的要求.提出原理假设H0和备择假设HL (2)根据检验对紀构造检验统计gT(Xl,X2宀Xn),使肖H0为真时汀有确定的分布.(3)由给定的显著水平6直统计址T所服从的分布表,定出临界值K使P{ 1 T I >A)=a,或P(T>M)=P(T<X2)=a/2,从而求出H0的拒绝域:I T I >入或T>MJ<X2,(4)由样木观察值计算统i|・fi T的观察值t(5)作出判断,将t的值与临界值比较大小作出结论:当tW拒绝域g时,则拒绝H0.否则,不拒绝H0.即认为在显著水平a下,H0与实际悄况差界不显著.习題8 假设检验与区间估il•有何异同解答:假设检验与区间估ii•的提法虽不同,但解决问题的途径是相通的.参数0的a信水平为i・a的a信区间对应于双边假设检验在駄着性水平a下的接受域:参数e的a信水平为1-a的爪侧置信区对应于爪边假设检验在显著性水平a下的接受域.在总休的分布已知的条件下•假设检验与区间估计是从不同的角度回答同一个问題•假设检验是判别原假设H0是否成立,而区间估计解决的是“多少"(或范前者是宦性的.后者是定fi的.习题9 某天开工时,需检验自动包装工作是否正常•根据以往的经验,其装包的质a在正常情况下服从正态分布N(100,仲位:kg).现抽测了9包,其质S为:问这天包装机工作是否正常将这一问题化为假设检验问题.写出假设检验的步驟(am 解答: ⑴提出假设检验问题H0:尸100, Hl:"100;(2)选取检验统il S U:U=X; HO成立时,UW((U);(3)a=,ua/2=,拒绝域W={ 1 u 1 >};(4))f勺I u I =. hM 1 u I <ua/2=,故接受HO,认为包装机.I:作正常.设总休X^(pJbXl,X2/7Xn是取自X的样木.对于假设检验HO:|i=O'Hl:pMO,取显著水平a,拒绝域为W={ i U i >ua/2b其中u=nX-,求:H0成立时,犯第一类错误的槪率aO;(2)十HO不成立时(若"0),犯第二类错的概率p.(l)X^(H4)/X'MM(g,l/n),故nX'=uMM(O,l). a0=P{ I u I >ua/2 I g=0}=l-P{-ua/2<u<ua/2}=1-[<D(ua/2)-(D(-ua/2)]=l-[(l-a2)-a2]=a,即犯第一类错误的概率是显著水平a.(2)F H0不成立.即PMO时.犯第二类错误的概率为P=P{ I U I 30/2 I E(X)=n}=P{・uct/2<u<ua/2 I E(X)=A}=P{-ua/2<nX'<ua/2 I E(X)=|i}=P{-ua/2-nn<n(X'-n)<ua/2-nn I E(X)=n}=(I)(ua/2-niJi)-®(-ua/2-nn),注1 '^1 H T+8或时,PTO.由此可见.当实际均值H偏离原假设校大时,犯第二类错误的概率很小.检验效果较好.注2!勺卩工0但接近于0时.Pdw.Wa很小.故犯第一娄错误的概率很大.检验效果较差.单正态总体的假设检験习题1 已知某炼铁厂铁水含碳量服从正态分布N,・现在测定r 9炉铁水•其平均含碳虽为•如果估计方差没有变化.可否认为现在生产的饮水平均含碳fi仍为(a=解答^ 木问题是在a二下检验假设HO:ns由r a2=已知,所以可选取统计sU=X •在HO 成立的条件下• UW(OJ),且此检验问题的拒绝域为I U 1 = I X •这里 说明U 没有落在拒绝域中.从而接受H0.即认为现在生产之饮水平均含碳S 仍为•习題2要求一种元件平均便用寿命不斜低于1000小肘,生产者从一批这种元件中随机抽取25件,测御其寿命的 平均值为950小时.已知该种元件寿命服从标准差为0=100小时的正态分布,试在显著性水平(1=卜确定 这批元件是否合格设总体均值为卩川未知.即需检验假设H0:H >1000,H1:H <1000.解答:检验假设 HO :n>1000,Hl :n<1000.这是飛边假设检验问题.由于方差02二,故用U 检验法.对于显着性水平a 二,拒绝域为W={X"-1000a/n<-ua.査标准正态分布表•得 又知n=25X=950,故可计算出x'-1000a/n=950-1000100/25=,因为&故在a=下拒绝H0,认为这批元件不合格.习题3 打包机装糖入包,每包标准重为100kg.毎天开工后,要检验所装糖包的总体期望值是否合乎标准 (100kg)•某日开工后.测御9包糖重如下位:kg):打包机装糖的包得服从正态分布•问该天打包机1:作是否正常(a 二 解答: 木问题是在a 二下检验假设HO:p=100,Hl :"100・由于02未知.所以可选取统讣fi T=X--100S/n,在HO 成立的条件下.W(n-1K 且此检验问題的拒绝域为I T I = 1 X'-lOOS/n I >ta/2(n-l).I t 1 =<=(8),即t 未落在拒绝域中・从而接受H0,即可以认为该天打包工作正常.习題4机器包装食盐.假设毎袋盐的净重服从正态分布•规定毎俊标准含fi 为500g,标准差不斜趙过lOg •某天开 工后•随机抽取9袋.测得浄重如下仲位:g):497, 507, 510, 475, 515, 484, 488, 524, 491,I U I =<=ua/2・这里 t=x"-100s/ns :试在駄著性水平a二下检验假设:HO:n=500,Hl:n#500,解答:x'=499,ss:,n=9,t=(x~-|jiO)sn==,a=, (8)=.Will <(8b故接受HO,认为该天每袋平均质a可视为500g・习«5从清凉饮料自动售货机・随机抽样36杯,其平均含g为219(mL),标准差为/在a二的显I?性水平下・试检验假设S HO:A=|I O=222,H1:H<M=222・解答: 设总休X-W(g,a2bX代表自动售货机售出的清凉饮料含S・检验假设H0:n=n0=222(mL), Hl:n<222(mL),由asn=36,査表毎(36・1)弓拒绝域为W={t=x'-nOs/n<-ta(n-l).il•算t值并判断:t=36»习題6 某种寻线的电阻服从正态分布N(x・今从新生产的一批导线中抽取9根・测«电阻•得s=Q,对于a®能否认为这批导线电阴的标准差仍为解答:木问题是在a二下检验假设H0:a2=, Hl:o2匕选取统计fi x2=n-la2S2,在HO成立的条件下,X2^2(n-1),且此检验问題的拒绝域为X2>xa/22(n-l)或x2<xl-a/22(n-l).这里X2==x=,X(8)=,x(8)-落在拒绝域中,从而拒绝HO,即不能认为这批导线电阻的标准差仍为.习题7某厂生产的铜线,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容fi为9的样木•测得其折断力如下(飛位:N):289, 286, 285, 286, 285, 284, 285, 286, 298, 292设总体服从正态分布,问该日生产的铜线的折斷力的方差是否符合标准(a二解答: 检验问題为n=9, s2勺X2=8XS216勺am X(8)=・因X2<X(8)s故接受HO,可认为铜丝的折断力的方差不超过16N2.习题8过去经验示.商三学生完成标准考试的时间为一正态变其标准差为6min.若随机样木为20位学生, 其标准差为X,试在显着性水平a= b\检验假设:H0:a>6,Hl:a<6,解答:HO:a>6,Hl:a<6,a=,n-l=19,ssx(19)-拒绝域为W={x2<},i l•算X2值X2=(20-l)x^.因为>■故接受H0,认为a>6.习題9测定某种潯液中的水分・它的10个测定值给出*%,设测定值总体服从正态分布.02为总休方差.02未知,试在a二水平下检验假设:在a= b\拒绝域为W={(n-l)S2a02<xl-a2(9).查X2分布表得X(9)m讣算得(n-l)s2o02=(10-l)x\per)2\per)2^>,未落入拒绝域•故接受H0.取正态总体的假设检越习題1制造厂家宜称•线A的平均张力比线B至少强120N,为证实其说法.在同样情况下测试两种线各50条.线A的平均张力x-=867N,标准差为01=;而线B的平均张力为y・=778N,标准差为o2m在a二的显善性水平下,试检验此制造厂家的说法.解答:H0:nl4l2=120,Hl:pl 屮2<120・am=・W={u=x'-y~-120ol2nl+a22n2<-ua,拒绝域为由x'=867,y'=778,nl=n2=50, 012=2,o22=2,得□=867-778-120250+250^^^,因为&故拒绝H0,认为pl-rx2<120,即厂家的说法不对.习题2 欲知某新血清是否能抑制白血球过多症,选择已患该病的老畝9只•并将其中5只施予此种血清,另外4 只则不热•从实验开始.其存活年限表示如下假设两总体均服从方差相同的正态分布,试在显著性水平a二下检验此种血清是否有效解答^ 设pl- p2分别为老鼠接受和未接受血清的平均存活年限。
概率论与数理统计PPT课件第七章最大似然估计

• 最大似然估计的概述 • 最大似然估计的数学基础 • 最大似然估计的实现 • 最大似然估计的应用 • 最大似然估计的扩展
01
最大似然估计的概述
定义与性质
定义
最大似然估计是一种参数估计方法, 通过最大化样本数据的似然函数来估 计参数。
性质
最大似然估计是一种非线性、非参数 的统计方法,具有一致性、无偏性和 有效性等优良性质。
无偏性
在某些条件下,最大似然估计的参数估计值是无偏的,即其期望值等于真实值。
最大似然估计的优缺点
• 有效性:在某些条件下,最大似然估计具有最小方差性质, 即其方差达到最小。
最大似然估计的优缺点
非线性
01
最大似然估计是非线性估计方法,对参数的估计可能存在局部
最优解而非全局最优解。
对初值敏感
02
最大似然估计对初值的选择敏感,不同的初值可能导致不同的
04
最大似然估计的应用
在回归分析中的应用
线性回归
最大似然估计常用于线性回归模型的参数估计,通过最大化似然函 数来估计回归系数。
非线性回归
对于非线性回归模型,最大似然估计同样适用,通过将非线性模型 转换为似然函数的形式进行参数估计。
多元回归
在多元回归分析中,最大似然估计能够处理多个自变量对因变量的影 响,并给出最佳参数估计。
最大熵原理与最大似然估计在某些方面具有相似性,例如都追求最大化某种度量, 但在应用场景和约束条件上有所不同。
THANKS
感谢观看
连续型随机变量的概率密度函数
然函数
基于样本数据和假设的概率模型, 计算样本数据在该模型下的可能 性。
似然函数的性质
非负性、归一化、随着样本数据的 增加而增加。
高中数学新人教A版选择性必修第三册 第七章 7.1.1 条件概率 7.1.2 全概率公式 课件

为在事件A发生的条件下,事件B发生的条件概率,简称条件概率.
2.概率的乘法公式:对任意两个事件A与B,假设P(A)>0,那么
P(AB)=P(A)P(B|A).我们称该式为概率的乘法公式.
名师点析对于条件概率需注意的问题
(1)利用条件概率公式求P(B|A)时一定要注意P(A)>0.
(2)事件B在“事件A已发生〞这个附加条件下发生的概率与没有
孩子呢.〞在回家的路上妈妈告诉达娜:“这个家庭有两个孩子,只
知道有一个是女孩,另一个不太清楚.〞于是达娜在想,另一个孩子
也是女孩的可能性有多大呢?是50%的概率吗?你能帮达娜分析一
下吗?
激趣诱思
知识点拨
一、条件概率
1.定义:一般地,设A,B为两个随机事件,且P(A)>0,我们称P(B|A)=P(AB)
这个附加条件发生的概率一般是不相同的.
激趣诱思
知识点拨
微思考
(1)P(B|A)与P(AB)有何区别?
(2)假设事件A,B互斥,那么P(B|A)是多少?
提示:(1)P(B|A)的值是事件AB发生相对于事件A发生的概率的大小;
而P(AB)是事件AB发生相对于原来的总空间而言,一般
P(B|A)≠P(AB).
P(AB )
P(B|A)=
答案:C
P(A)
=
1
10
4
15
3
= .
8
激趣诱思
知识点拨
二、条件概率的性质
条件概率只是缩小了样本空间,因此条件概率同样具有概率的性质.
设P(A)>0,那么
(1)P(Ω|A)=1;
(2)如果B和C是两个互斥事件,那么P(B∪C|A)=P(B|A)+P(C|A);
概率论与数理统计习题及答案第七章

习题7-11. 选择题(1) 设总体X 的均值μ与方差σ2都存在但未知, 而12,,,n X X X L 为来自X 的样本, 则均值μ与方差σ2的矩估计量分别是( ) .(A) X 和S 2. (B) X 和211()nii X nμ=-∑. (C) μ和σ2. (D) X 和211()nii X X n=-∑.解 选(D).(2) 设[0,]X U θ:, 其中θ>0为未知参数, 又12,,,n X X X L 为来自总体X 的样本, 则θ的矩估计量是( ) .(A) X . (B) 2X . (C) 1max{}i i nX ≤≤. (D) 1min{}i i nX ≤≤.解 选(B).2. 设总体X 的分布律为其中0<θ<12n , 试求θ的矩估计量.解 因为E (X )=(-2)×3θ+1×(1-4θ)+5×θ=1-5θ, 令15X θ-=得到θ的矩估计量为ˆ15X θ-=. 3. 设总体X 的概率密度为(1),01,(;)0, x x f x θθθ+<<=⎧⎨⎩其它.其中θ>-1是未知参数, X 1,X 2,…,X n 是来自X 的容量为n 的简单随机样本, 求: (1) θ的矩估计量;(2) θ的极大似然估计量. 解 总体 X 的数学期望为1101()()d (1)d 2E X xf x x x x θθθθ+∞+-∞+==+=+⎰⎰. 令()E X X =, 即12X θθ+=+, 得参数θ的矩估计量为21ˆ1X X θ-=-. 设x 1, x 2,…, x n 是相应于样本X 1, X 2,… , X n 的一组观测值, 则似然函数为1(1),01,0,n n i i i x x L θθ=⎧⎛⎫+<<⎪ ⎪=⎨⎝⎭⎪⎩∏其它. 当0<x i <1(i =1,2,3,…,n )时, L >0且 ∑=++=ni ixn L 1ln )1ln(ln θθ,令1d ln ln d 1ni i L nx θθ==++∑=0, 得θ的极大似然估计值为 1ˆ1ln nii nxθ==--∑,而θ的极大似然估计量为 1ˆ1ln nii nXθ==--∑.4. 设总体X 服从参数为λ的指数分布, 即X 的概率密度为e ,0,(,)0,0,x x f x x λλλ->=⎧⎨⎩≤ 其中0λ>为未知参数, X 1, X 2, …, X n 为来自总体X 的样本, 试求未知参数λ的矩估计量与极大似然估计量.解 因为E (X )=1λ =X , 所以λ的矩估计量为1ˆXλ=. 设x 1, x 2,…, x n 是相应于样本X 1, X 2,… ,X n 的一组观测值, 则似然函数11nii inxx nni L eeλλλλ=--=∑==∏,取对数 1ln ln ()ni i L n x λλ==-∑.令1d ln 0,d ni i L n x λλ==-=∑ 得λ的极大似然估计值为1ˆxλ=,λ的极大似然估计量为1ˆXλ=. 5. 设总体X 的概率密度为,01(,)1,120,x f x x θθθ<<=-⎧⎪⎨⎪⎩,≤≤,其它,其中θ(0<θ<1)是未知参数. X 1, X 2, …, X n 为来自总体的简单随机样本, 记N 为样本值12,,,n x x x L 中小于1的个数. 求: (1) θ的矩估计量; (2) θ的极大似然估计量.解 (1) 1213()d (1)d 2X E X x x x x θθθ==+-=-⎰⎰, 所以32X θ=-矩.(2) 设样本12,,n x x x L 按照从小到大为序(即顺序统计量的观测值)有如下关系:x (1) ≤ x (2) ≤…≤ x (N ) <1≤ x (N +1)≤ x (N +2)≤…≤x (n ) .似然函数为(1)(2)()(1)(2)(1),1()0,,N n N N N N n x x x x x x L θθθ-++-<=⎧⎨⎩L L ≤≤≤≤≤≤≤其它.考虑似然函数非零部分, 得到ln L (θ ) = N ln θ + (n − N ) ln(1−θ ),令d ln ()0d 1L N n N θθθθ-=-=-, 解得θ的极大似然估计值为ˆN nθ=. 习题7-21. 选择题: 设总体X 的均值μ与方差2σ都存在但未知, 而12,,,n X X X L 为X 的样本, 则无论总体X 服从什么分布, ( )是μ和2σ的无偏估计量.(A) 11nii X n=∑和211()nii X X n=-∑. (B)111nii X n =-∑和211()1nii X X n =--∑.(C)111nii X n =-∑和211()1nii X n μ=--∑. (D)11nii X n=∑和211()nii X nμ=-∑.解 选(D).2. 若1X ,2X ,3X 为来自总体2(,)X N μσ:的样本, 且Y 1231134X X kX =++为μ的无偏估计量, 问k 等于多少?解 要求1231111()3434E X X kX k μμμμ++=++=, 解之, k =512.3. 设总体X 的均值为0, 方差2σ存在但未知, 又12,X X 为来自总体X的样本, 试证:2121()2X X -为2σ的无偏估计.证 因为22212112211[()][(2)]22E X X E X X X X -=-+2222112212[()2()()]22E X E X X E X σσ=-+==,所以2121()2X X -为2σ的无偏估计.习题7-31. 选择题(1) 总体未知参数θ的置信水平为0.95的置信区间的意义是指( ). (A) 区间平均含总体95%的值. (B) 区间平均含样本95%的值.(C) 未知参数θ有95%的可靠程度落入此区间. (D) 区间有95%的可靠程度含参数θ的真值. 解 选(D).(2) 对于置信水平1-α(0<α<1), 关于置信区间的可靠程度与精确程度, 下列说法不正确的是( ).(A) 若可靠程度越高, 则置信区间包含未知参数真值的可能性越大. (B) 如果α越小, 则可靠程度越高, 精确程度越低. (C) 如果1-α越小, 则可靠程度越高, 精确程度越低. (D) 若精确程度越高, 则可靠程度越低, 而1-α越小. 解 选(C )习题7-41. 某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试, 取得数据如下(单位:小时):1050, 1100, 1080, 1120, 1250, 1040, 1130, 1300, 1200. 设灯泡寿命服从正态分布N (μ, 902), 取置信度为0.95, 试求当天生产的全部灯泡的平均寿命的置信区间.解 计算得到1141.11,x = σ2 =902. 对于α = 0.05, 查表可得/20.025 1.96z z ==α.所求置信区间为/2/2(,)(1141.11 1.96,1141.11 1.96)(1082.31,1199.91).x x z +=-=αα2. 为调查某地旅游者的平均消费水平, 随机访问了40名旅游者, 算得平均消费额为105=x 元, 样本标准差28=s 元. 设消费额服从正态分布. 取置信水平为0.95, 求该地旅游者的平均消费额的置信区间.解 计算可得105,x = s 2 =282.对于α = 0.05, 查表可得0.0252(1)(39) 2.0227t n t α-==.所求μ的置信区间为22((1),(1))(105 2.0227,105 2.0227)x n x n αα--+-=+=(96.045, 113.955).3. 假设某种香烟的尼古丁含量服从正态分布. 现随机抽取此种香烟8支为一组样本, 测得其尼古丁平均含量为18.6毫克, 样本标准差s =2.4毫克. 试求此种香烟尼古丁含量的总体方差的置信水平为0.99的置信区间.解 已知n =8, s 2 =2.42, α = 0.01, 查表可得220.0052(1)(7)20.278n αχχ-==, 220.99512(1)(7)0.989n αχχ--==, 所以方差σ 2的置信区间为2222122(1)(1)(,)(1)(1)n S n S n n ααχχ---=--22(81) 2.4(81) 2.4(,)20.2780.989-⨯-⨯=(1.988, 40.768). 4. 某厂利用两条自动化流水线灌装番茄酱, 分别从两条流水线上抽取样本:X 1,X 2,…,X 12及Y 1,Y 2,…,Y 17, 算出221210.6g,9.5g, 2.4, 4.7x y s s ====.假设这两条流水线上装的番茄酱的重量都服从正态分布, 且相互独立, 其均值分别为12,μμ. 又设两总体方差2212σσ=. 求12μμ-置信水平为0.95的置信区间, 并说明该置信区间的实际意义.解 由题设22121210.6,9.5, 2.4, 4.7,12,17,x y s s n n ======2222112212(1)(1)(121) 2.4(171) 4.71.94212172wn s n s s n n -+--⨯+-⨯===+-+-120.0252(2)(27) 2.05181,t n n t α+-==所求置信区间为122(()(2)((10.69.5) 2.05181 1.94x y t n n s α-±+-=-±⨯ =(-0.40,2.60).结论“21μμ-的置信水平为0.95 的置信区间是(-0.40,2.60)”的实际意义是:在两总体方差相等时, 第一个正态总体的均值1μ比第二个正态总体均值2μ大-0.40~2.60,此结论的可靠性达到95%.5. 某商场为了了解居民对某种商品的需求, 调查了100户, 得出每户月平均需求量为10公斤, 方差为9 . 如果这种商品供应10000户, 取置信水平为0.99.(1) 取置信度为0.99,试对居民对此种商品的平均月需求量进行区间估计; (2) 问最少要准备多少这种商品才能以99%的概率满足需要? 解 (1) 每户居民的需求量的置信区间为2222((1),(1))()(10 2.575,10 2.575)(9.2275,10.7725).,x n x n x z x αααα-+-≈+=-=10000户居民对此种商品月需求量的置信度为0.99的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以99%的概率满足需要.。
概率论与数理统计(茆诗松)第二版课后第七章习题参考答案

⎧ 20
⎫ ⎭
⎩ i =1
⎛ 20 ⎞ k ⎟ p (1 − p ) 20−k , ⎟ k =2 ⎝ k ⎠
6
故 g ( 0) = 1 − ∑ ⎜ ⎜
6 ⎛ 20 ⎞ k 20−k ⎛ 20 ⎞ k 20− k ⎟ × 0 ×1 = 1 , g (0.1) = 1 − ∑ ⎜ = 0.3941 , ⎟ ⎜k⎟ ⎟ × 0.1 × 0.9 k k =2 ⎝ k =2 ⎝ ⎠ ⎠ 6
解: (1)因 nX = X 1 + X 2 + L + X 30 ~ P (30λ ) , 假设 H0:λ ≤ 0.1 vs H1:λ > 0.1,
统计量 nX ~ P (30λ ) ,
Pp ( 3)−1
当 H0 成立时,设 nX ~ P (3) ,其 p 分位数 Pp (3) 满足
∑
k =0
3k −3 e < p≤ k!
β (0.5) = 1 − ∑
6
6 15k −15 18k −18 e = 0.9924 , β (0.6) = 1 − ∑ e = 0.9990 , k =0 k ! k =0 k !
β ( 0 .7 ) = 1 − ∑
6
21k −21 e = 0.9999 , k =0 k! 24 k −24 e ≈1, k =0 k!
6
β (λ)
β (0.8) = 1 − ∑ β ( 0 .9 ) = 1 − ∑
27 k −27 e ≈1. k =0 k!
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
λ
习题 7.2
说明:本节习题均采用拒绝域的形式完成,在可以计算检验的 p 值时要求计算出 p 值. 1. 有一批枪弹,出厂时,其初速率 v ~ N (950, 1000)(单位:m/s) .经过较长时间储存,取 9 发进行测 试,得样本值(单位:m/s)如下: 914 920 910 934 953 945 912 924 940. 据经验,枪弹经储存后其初速率仍服从正态分布,且标准差保持不变,问是否可认为这批枪弹的初速 率有显著降低(α = 0.05)? 解:设枪弹经储存后其初速率 X ~ N (µ , 1000),假设 H0:µ = 950 vs H1:µ < 950, 已知σ 2,选取统计量 U =
东华大学《概率论与数理统计》课件 第七章 假设检验

1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(|U|>u1-α/2)=α
φ(x)
U检验
α/2
- u1-αΒιβλιοθήκη 2 u1-α/2接受域α/2
X
否定域
否定域
双侧统计检验
该检验用 u 检验统计量,故称为u 检验。
② H0:μ≤μ0(已知); H1:μ>μ0 (右侧检验) 1) 提出原假设和备择假设: H0:μ≤μ0; H1:μ>μ0, X 0 在H0下有 2) 对统计量: U / n X 0 X , / n / n X 0 X 对给定的α有 { u1 } { u1 } / n / n X 0 X 所以 P( u1 ) P( u1 ) / n / n 3) 故 拒绝条件为U> u1-α
c u u0.05 1.645
由
X 110 4/5
1.645
X 108.648
即区间( ,108.648 ) 为检验的拒绝域 称 X 的取值区间 (108.648,+) 为检验的接受域
四、作出判断
在有了明确的拒绝域后,根据样本观测值 我们可以做出判断: 当 x 108.684 或 u 1.645 时,则拒绝H 0 即接收 H1 ;
H 0 : p 4%
vs
H1 : p 4%
二、选择检验统计量 由样本对原假设进行判断总是通过一 个统计量完成的,该统计量称为检验统计 量。 找出在原假设 H 0 成立条件下,该统计量 所服从的分布。
三、选择显著性水平,给出拒绝域形式 小概率原理中,关于“小概率”的值通常根据实 际问题的要求而定,如取α =0.1,0.05,0.01等, α 为检验的显著性水平(检验水平). 根据所要求的显著性水平α ,描写小概率事件的 统计量的取值范围称为该原假设的拒绝域(否定 域),一般用W表示;一般将 W 称为接受域。 拒绝域的边界称为该假设检验的临界值.
当 x 108.684 或 u 1.645时,则接收 H 0
在例7.1.1中,由于 x 108 108.684 因此拒绝原假设,即认为该日生产不正常。
由例7.1.1可见,在给定的前提下, 接受还是拒绝原假设完全取决于样本 值, 因此所作检验可能导致以下两类 错误的产生:
第一类错误 第二类错误
定义7.1.2
对检验问题
H 0 : 0 对
H1 : 1
如果一个检验满足对任意的 0 , 都有 g ( ) , 则称该检验是显著性水平为 的显著性检 验,简称水平为 的检验。
求势函数 例: 见P334 NO. 2
§7.2 正态总体参数假设检验
参数假设检验常见的有三种基本形式 (1) H 0 : 0 vs H1 : 0 (2) H 0 : 0 vs H1 : 0 (3) H 0 : 0 vs H1 : 0
P( U >u1-α)≤α
φ(x)
α
u1-α 接受域 否定域 X
单侧(右侧)统计检验
③ H0:μ≥μ0(已知); H1:μ<μ0 (左侧检验)
1) 提出原假设和备择假设:
2) 选择统计量:
H0:μ≥μ0; H1:μ<μ0,
u
X 0
/ n
3) 对给定α, 否定域为U<- u1-α,
P( U <-u1-α)≤α
P(|U|>u1-α/2)=α
φ(x)
α/2
- u1-α/2
拒绝域
接受域
α/2
u1-α/2 拒绝域 X
例7.1.1 某厂生产的合金强度服从 N ( ,16),其中 的设计值 为不低于110(Pa)。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金, 测得强度值为x1, x2 , …, x25,其均值为 x 108 (Pa),问当日生产是否正常?
~ N (0,1)
φ(x)
α/2
- uα/2
β
uα/2 0
α/2
X
/ n
0 U ~ N( ,1) / n / n
'
X 0
注意: 增大样本容量n时,可以使α 和β 同时减小.
当样本容量 n一定时, 小, 就大,反之,小, 就大.
在进行假设检验时,我们采取的原则是:
拒真错误 受伪错误
假设检验的两类错误
所作判断 接受 H0 真实情况
H0 为真 H0 为假
正确 第二类错误
(受伪)
拒绝 H0
第一类错误
(拒真)
正确
犯第一类错误的概率通常记为,拒真概率 犯第二类错误的概率通常记为,受伪概率
原假设真: μ=μ0 备择假设真: μ≠μ0(μ>μ0)
U
X 0
/ n
势函数是 的增函数(见图),只要 g (0 ) 就可保证在 0 时有 g ( )
7.2.1 (a) g ( ) 的图形
对左侧检验 H 0 : 0
vs H1 : 0 是类似
只是拒绝域变为: W {u u1 } 其势函数为 g
解
p 0.04 代入
P (1) C p (1 p) 0.306 0.01 12
1 12 1 11
这不是小概率事件,则该批产品可以出厂.
P (3) C p (1 p) 0.0097 0.01 12
3 12 3 9
这是 小概率事件 , 一般在一次试验中 是不会发生的, 现一次试验竟然发生, 故认 p 0.04 为该批产品次品率 p>4%,该批产品不能出厂.
分析 直接算 1/ 12 0.083 0.04 抽查12件发现1件按理不能出厂.
求检验准则: ——抽取的12个产品中至少有几个次品则判 断不合格? 思路: 假定p<=4%, 约定α=0.01(小概率), 记12件样品中的次品数为X,检验准则为 一次试验中,“Xk”发生为小概率事件时, 则不能出厂。
需要根据实际问题的需要,对总体参数或分 布函数的表达式做出某种假设(称为统计假 设),再利用从总体中获得的样本信息来对所 作假设的真伪做出判断或进行检验. 这种利用样本检验统计假设真伪的 过程叫做统计检验(假设检验)
7.1.2 假设检验的基本步骤
一、建立假设
在假设检验中,常把一个被检验的假设称 为原假设,用H 0 表示,通常将不应轻易加 以否定的假设作为原假设。 当 H 0被拒绝时而接收的假设称为备择 假设,用 H1表示,它们常常成对出现。 在引例1中,我们可建立如下两个假设:
x c c g ( ) P ( x c) P 4/5 4/5 4/5
这个势函数是 的减函数 g
v v
1
0
利用这个势函数容易写出犯两类错误的概率 分别为 c , ( ) 0 4/5 和
出厂检验问题的数学模型
对总体X ~ f ( x ; p) p (1 p) , x 0,1 提出假设
x 1 x
H 0 : p 0.04;
要求利用样本观察值
H1 : p 0.04
( xi 3 or 1 )
i 1 12
( x1 , x2 , , x12 )
对提供的信息作出接受 H 0 (可出厂) , 还 是接受 H1 (不准出厂) 的判断.
α
-u1-α 否定域
φ(x)
X 接受域
单侧(左侧)统计检验
对右侧检验 H 0 : 0
0
vs
H1 : 0
由 P u c 可推出具体的拒绝域为
W u u1
该检验的势函数是 的函数,它可用正态分布 写出,具体为
g 1
n 0 u1
控制犯第一类错误(即 事先给定且很小)的同时使犯 第二类错误的概率达到最小.
关于原假设与备择假设的选取
H0与H1地位应平等,但在控制犯第一类错误的概 率 的原则下,使得采取拒绝H0 的决策变得 较慎重,即H0得到特别的保护.
因而,通常把有把握的、有经验的结论作为原 假设,或者尽可能使后果严重的错误成为第一 类错误.
0 1
(7.1.3)
势函数 g ( ) 是定义在参数空间 上的一个函数。 犯两类错误的概率都是参数 的函数,并可由势 函数算得,即: ( ), 0 g ( ) 1 ( ), 1
对例7.1.1,其拒绝域为 W {x c} ,由(7.1.3)可 以算出该检验的势函数
统计检验的基本思想 (1)小概率原理:认为概率很小的事件在一次试验 中实际上不会出现,并且小概率事件在一次试验 中出现了,就被认为是不合理的. (2)基本思想: 先对总体的参数或分布函数的作 出某种假设,然后找出一个在假设下发生可能性 甚小的小概率事件.
如果试验或抽样的结果使该小概率事件发生了, 这与小概率原理相违背,表明原来的假设有问题, 应拒绝这个假设. 若该小概率事件在一次试验或 抽样中并未出现, 表明试验或抽样结果支持这个 假设, 则接受原来的假设.
当备择假设 H1在原假设 H 0 一侧时的检验称 为单侧检验; 当备择假设 H1 分散在原假设 H 0两侧时的检验 称为双侧检验。
7.2.1 单个正态总体均值的检验
设总体X~N(μ,σ2), X1,X2,…,Xn 为一组样本,
一、已知 时 的检验
① H0:μ=μ0(已知); H1:μ≠μ0 (双侧检验) 1) 提出原假设和备择假设: H0:μ=μ0; H1:μ≠μ0, X 0 |H0成立 ~ N ( 0 ,1 ) 2) 确定检验统计量: u / n 3) 对给定α,由原假设成立时P(|u|> u1-α/2)=α得 拒绝条件为 |u|>u1-α/2