正态总体参数的置信区间及显著性检验一览表(2020)

合集下载

概率论第八章 置信区间

概率论第八章 置信区间

试问机器是否正常 (给定显著性水平 0.05)
解 : 设X ~ N ( , ), 此是在 0.015已知条件下 ,
2
判断均值 0.5
还是 0.5的问题, 为此
1)提出假设 H 0 : 0.5; H1 : 0.5;
2)显著性水平 0.05, 样本容量 n9
装糖重总体 X 的均值和标准差, 已知 0.015, 则 X ~ N ( , 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 .
提出两个对立假设H 0 : 0 0.5 和 H1 : 0 . 再利用已知样本作出判断是接受假设 H0 ( 拒绝 假设 H1 ) , 还是拒绝假设 H0 (接受假设 H1 ). 如果作出的判断是接受 H0, 则 0 ,
又如, 对于正态总体提出数学期望等于 0 的 假设等. 假设检验就是根据样本对所提出的假设作 出判断: 是接受, 还是拒绝.
假设检验问题是统计推断的另一类重要问题. 如何利用样本值对一个具体的假设进行检验?
通常借助于直观分析和理论分析相结合 的做法,其基本原理就是人们在实际问题中经 常采用的所谓实际推断原理:“一个小概率事 件在一次试验中几乎是不可能发生的”.
对实际中需作出判断的 问题, 提出适当的 统计假设, 根据来自总体的样本 X 1 , X 2 , , X n , 选择适当的统计量 , 此统计量需服从熟知的 分 布, 据此分布由小概率原理 可以确定原假设的 拒绝域, 若样本值落入此拒绝域 中, 则拒绝原假 设, 否则接受原假设。
二、假设检验的相关概念
H0:0 H0: 0 H 0: = 0
vs vs vs
H 1: > 0 H 1: < 0 H1: 0

04 第四节 正态总体的置信区间

04 第四节 正态总体的置信区间

第四节 正态总体的置信区间与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。

在构造正态总体参数的置信区间的过程中,t 分布、2χ分布、F 分布以及标准正态分布)1,0(N 扮演了重要角色.本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间;4. 双正态总体均值差(方差已知)的置信区间;5. 双正态总体均值差(方差未知但相等)的置信区间;6. 双正态总体方差比的置信区间.注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为α-1的置信区间, 其区间长度在所有这类区间中是最短的.内容分布图示★ 引言★ 单正态总体均值(方差已知)的置信区间★ 例1 ★ 例2★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ *双正态总体均值差(方差未知)的置信区间★ 例7 ★ 例8★ *双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4内容要点:一、单正态总体均值的置信区间(1)设总体),,(~2σμN X 其中2σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间,,2/2/⎪⎪⎭⎫⎝⎛⋅+⋅-n u X n u X σσαα二、单正态总体均值的置信区间(2)设总体),,(~2σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2σ, 构造统计量n S X T /μ-=,从第五章第三节的定理知).1(~/--=n t nS X T μ对给定的置信水平α-1, 由αμαα-=⎭⎬⎫⎩⎨⎧-<-<--1)1(/)1(2/2/n t n S X n t P ,即 ,1)1()1(2/2/αμαα-=⎭⎬⎫⎩⎨⎧⋅-+<<⋅--n S n t X n S n t X P 因此, 均值μ的α-1置信区间为.)1(,)1(2/2/⎪⎪⎭⎫ ⎝⎛⋅-+⋅--n S n t X n S n t X αα三、单正态总体方差的置信区间上面给出了总体均值μ的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差2σ进行区间估计.设总体),,(~2σμN X 其中μ,2σ未知,n X X X ,,,21 是取自总体X 的一个样本. 求方差2σ的置信度为α-1的置信区间. 2σ的无偏估计为2S , 从第五章第三节的定理知,)1(~1222--n S n χσ, 对给定的置信水平α-1, 由,1)1()1()1()1(,1)1(1)1(22/12222/222/2222/1αχσχαχσχαααα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---=⎭⎬⎫⎩⎨⎧-<-<---n S n n Sn P n S n n P 于是方差2σ的α-1置信区间为⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(22/1222/2n S n n S n ααχχ而方差σ的α-1置信区间.)1()1(,)1()1(22/1222/2⎪⎪⎭⎫ ⎝⎛-----n S n n S n ααχχ四、双正态总体均值差的置信区间(1)在实际问题中,往往要知道两个正态总体均值之间或方差之间是否有差异,从而要研究两个正态总体的均值差或者方差比的置信区间。

置信区间(详细定义及计算)

置信区间(详细定义及计算)

可见,对参数 作区间估计,就是要设法找出两个 只依赖于样本的界限(构造统计量) (ˆ1 ˆ2 )
[ˆ1 ,ˆ2 ] 内.
1. 要求 很大的可能被包含在区间 [ˆ1 , ˆ2 ] 内,
就是说,概率 P {ˆ1 ˆ2 } 要尽可能大. 即要求估计尽量可靠.
ˆ ˆ 2. 估计的精度要尽可能的高.如要求区间长度 2 1 尽可能短,或能体现该要求的其它准则.
查正态分布表得临界值 Z 1.96,由此得置信区间:

18
当总体X的方差未知时, 容易想到用样本方差Ѕ 2代替σ2。 X T ~ t (n 1) 已知 2 S n X t (n 1)} 1 则对给定的α,令 P{ S 2 2 n 查t 分布表,可得 t (n 1) 的值。 2 S S P{ X t 2 ( n 1) X t 2 ( n 1)} 1 n n
有时我们嫌置信度0.95偏低或偏高, 也可采用0.99或
0.9. 对于 1- α不同的值, 可以得到不同的置信区间。
15
ˆ1 ˆ1 ( X 1 , X 2 , X n ) ˆ2 ˆ2 ( X 1 , X 2 , X n )
一旦有了样本,就把 估计在区间 这里有两个要求:
[96.05 , 113.95]
用某仪器间接测量温度,重复测量5次得 1250 0 12650 1245 0 1260 0 12750 求温度真值的置信度为 0.99 的置信区间。

设μ为温度的真值,X表示测量值,通常是一个 正态随机变量 EX .
问题是在未知方差的条件下求μ的置信区间。 由公式 1 x 1250 [0 15 5 10 25] 1259 5 1 570 2 2 2 s [(1250 1259) (1275 1259) ] 5 1 4 2 s n 1 4 0.01 28.5 5.339 5 S [X t 2 ( n 1)] t ( 4 ) t ( 4 ) 4 . 6041 查表 0.01 0.005 n 则所求μ的置信区间为 [1259 24 .58 , 1259 24 .58]

第二节 正态总体均值的假设检验

第二节 正态总体均值的假设检验
α 2 α 2
σ
~ N(0,1)
n
(σ 2 已知)
原假设 备择假设 检验统计量及其在 H0为真时的分布 H0 H1
=0 ≠0
X 0 T= ~ T(n 1) S n
接受域
x 0 s n
≤ tα
(σ 2未知)
2
待估参数
枢轴量及其分布 置信区间
X 0 T= ~ T(n 1) S n
( x tα
2
= 0 ≥ 0 ≤ 0
≠ 0 < 0 > 0
U=
X 0
σ
U ≥ zα
2
n
U ≤ zα
N(0,1)
U ≥ zα
未知) T 检验法 (σ2 未知) 原假设 备择假设 检验统计量及其 H0 H1 H0为真时的分布 拒绝域
= 0 ≥ 0 ≤ 0
≠ 0 < 0 > 0
X 0 T= S n ~ t(n 1)
(2)关于 σ
2
χ2检验法 的检验
拒绝域
原假设 备择假设 检验统计量及其在 H1 H0为真时的分布 H0
σ
2=σ 2 0
σ
2≠σ 2 0
χ =
2
∑(X )
i=1 i
n
χ ≤ χ (n)
2 2 1α 2
2
或 χ 2 ≥ χα2 (n)
2
σ 2≥σ 02 σ 2<σ 02
σ
2 0
~ χ (n)
2
χ ≤ χ (n)
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在 H0为真时的分布 H0 H1
1 – 2 = δ 1 – 2 ≠ δ 1 – 2 ≥ δ 1 – 2 < δ 1 – 2 ≤ δ 1 – 2 > δ

置信度(置信区间计算方法)

置信度(置信区间计算方法)
S S , X t (n 1) (2) X t (n 1) 2 2 n n
推导
选取枢轴量 T X ~ T (n 1)
S
n X 由P t (n 1) 确定t ( n 1) 2 S 2 n
这时, T2 T1 往往增大, 因而估计精度降低.
确定后, 置信区间 的选取方法不唯一,
ch73
常选最小的一个.
75
处理“可靠性与精度关系”的原 则

求参数 置信区间 保 证 可靠性

提 高 精 度
ch73
76
求置信区间的步骤
寻找一个样本的函数
— 称为枢轴量 它含有待估参数, 不含其它未知参数, 它的分布已知, 且分布不依赖于待估参 数 (常由 的点估计出发考虑 ). 例如 X~N ( , 1 / 5)
P(T1 T2 ) 1

则称 [ T1 , T2 ]为 的置信水平为1 - 的
置信区间或区间估计. T1 置信下限 T2 置信上限
ch73

几点说明
置信区间的长度 T2 T1 反映了估计精度 T2 T1 越小, 估计精度越高.
反映了估计的可靠度, 越小, 越可靠. 越小, 1- 越大, 估计的可靠度越高,但
( 引例中 a 1.96, b 1.96 )
由 a g ( X1, X 2 , X n , ) b 解出 T1 , T2
得置信区间 ( T1 , T2 ) 引例中
( T1 , T2 ) ( X 1.96 1 , X 1.96 1 ) 5 5
ch73 78
置信区间常用公式

复习资料(医学统计)

复习资料(医学统计)

复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()∙ A. 样本∙ B. 有限总体∙ C. 无限总体∙ D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()∙ A. 身高变异程度大∙ B. 头围变异程度大∙ C. 身高和头围的变异程度相同∙ D. 由于两者的均数相差很大,无法比较两者的变异程度3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )∙ A. 会变小∙ B. 会变大∙ C. 不变∙ D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )∙ A. 概率∙ B. 构成比∙C. 发病率∙D. 相对比5、两个分类变量的频数表资料作关联性分析,可用( )∙A. 积距相关或等级相关∙B. 积距相关或列联系数∙C. 列联系数或等级相关∙D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:∙A. 越大∙B. 越小∙C. 比r小∙D. 可能较大也可能较小7、多组均数的两两比较中,若不用q检验而用t 检验,则:()∙A. 结果更合理∙B. 结果一样∙C. 会把一些无差别的总体判断为有差别∙D. 会把一些有差别的总体判断为无差别8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()∙A. -3.5,3.5∙ B. -3.5,-3.5∙ C. 3.5,3.5∙ D. -3,49、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()∙ A. 截距改变∙ B. 回归系数改变∙ C. 两者都改变∙ D. 两者都不变10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。

6-5 两个正态总体均值及方差比的置信区间

6-5 两个正态总体均值及方差比的置信区间

6.5 两个正态总体均值差及 方差比的置信区间
1. 两正态总体均值差 µ1 − µ 2的置信区间
2 σ1 2. 两个总体方差比 2 的置信区间 σ2
3. 小结
设给定置信度为1 − α , 并设 X 1 , X 2 ,⋯, X n 为 第一个总体 N ( µ1 ,σ 1 )的样本 , Y1 ,Y2 ,⋯,Yn 为第二
要点回顾
无偏性 1. 估计量的评选的三个标准 有效性 相合性 2. 置信区间是一个随机区 (θ , θ ), 它覆盖未知参 间 ( 数具有预先给定的概率置信水平) , 即对于任
意的θ ∈Θ, 有 P{θ < θ < θ } ≥ 1−α. 求置信区间的一般步骤(分三步 分三步). 求置信区间的一般步骤 分三步
例4 分别由工人和机器人操作钻孔机在纲部件 上钻孔,今测得所钻的孔的深度(以cm计)如下 上钻孔,今测得所钻的孔的深度( 计
工人 操作 机器人 操作 4.02 3.64 4.03 4.02 3.95 4.06 4.00 4.01 4.03 4.02 4.01 4.00 3.99 4.02 4.00
2 σ1 , 由 X , Y 的独立性及 X ~ N µ1 , n1 2 2 σ1 σ 2 , + 可知 X − Y ~ N µ1 − µ 2 , n1 n2
2 σ2 , Y ~ N µ2 , n2

( X − Y ) − (µ1 − µ 2 ) ~ N (0, 1),
2 s1 s12 1 1 2 , 2 s F (6,7) s F (6,7) = ( 2.87,46.81). 0.95 2 2 0.05
这个区间的下限大于1,在实际中, 这个区间的下限大于 ,在实际中,我们就认为

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】

伍德⾥奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】第4章多元回归分析:推断4.1复习笔记考点⼀:OLS估计量的抽样分布★★★1.假定MLR.6(正态性)假定总体误差项u独⽴于所有解释变量,且服从均值为零和⽅差为σ2的正态分布,即:u~Normal(0,σ2)。

对于横截⾯回归中的应⽤来说,假定MLR.1~MLR.6被称为经典线性模型假定。

假定下对应的模型称为经典线性模型(CLM)。

2.⽤中⼼极限定理(CLT)在样本量较⼤时,u近似服从于正态分布。

正态分布的近似效果取决于u中包含多少因素以及因素分布的差异。

但是CLT的前提假定是所有不可观测的因素都以独⽴可加的⽅式影响Y。

当u是关于不可观测因素的⼀个复杂函数时,CLT论证可能并不适⽤。

3.OLS估计量的正态抽样分布定理4.1(正态抽样分布):在CLM假定MLR.1~MLR.6下,以⾃变量的样本值为条件,有:∧βj~Normal(βj,Var(∧βj))。

将正态分布函数标准化可得:(∧βj-βj)/sd(∧βj)~Normal(0,1)。

注:∧β1,∧β2,…,∧βk的任何线性组合也都符合正态分布,且∧βj的任何⼀个⼦集也都具有⼀个联合正态分布。

考点⼆:单个总体参数检验:t检验★★★★1.总体回归函数总体模型的形式为:y=β0+β1x1+…+βk x k+u。

假定该模型满⾜CLM假定,βj的OLS 量是⽆偏的。

2.定理4.2:标准化估计量的t分布在CLM假定MLR.1~MLR.6下,(∧βj-βj)/se(∧βj)~t n-k-1,其中,k+1是总体模型中未知参数的个数(即k个斜率参数和截距β0)。

t统计量服从t分布⽽不是标准正态分布的原因是se(∧βj)中的常数σ已经被随机变量∧σ所取代。

t统计量的计算公式可写成标准正态随机变量(∧βj-βj)/sd(∧βj)与∧σ2/σ2的平⽅根之⽐,可以证明⼆者是独⽴的;⽽且(n-k-1)∧σ2/σ2~χ2n-k-1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档