统计推断 pdf
第4章节统计推断

1. 假设
先假设新品种产量与当地品种产量无差异, 记作
➢H0:μ新=μ原=300kg ➢HA:μ新≠μ原
2. 确定显著水平α
➢ 取α=0.05
3. 统计计算
在假定H0成立的前提下进行计算
x =
n = 75 25
u = x = 330 300 = 2
x
15
4. 统计推断
查附表2,当u=2时, 0.03fN(y)
[ 例2 ] 某春小麦良种的千粒重μ0=34g,现自外地引 入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、 37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入 品种的千粒重是否与当地良种有显著差异?
这里总体 2为未知,又是小样本,故需用t 测验;
1.假设 H0:μ≤34g;对HA: μ >34g。
“小概率原则”是指小概率事件在一次观测或试验 中一般是不会发生的。如果在一次观测中,小概率 事件居然发生了,我们就有理由认为这个现象是不 合适的。
二、假设测验的步骤
1.假设:对总体参数的一种看法
无效假设(或零假设 null hypothesis 备择假设(或对立假设alternative hypothesis)
➢ 用来推断无效假设否定与否的概率标准叫做显著水平
➢ 研究者根据试验的要求和试验的结论的重要性而定
试验中难以控制的因素较多,试验误差可能较 大,则α取大值。如果试验耗费较大,对精确 度要求较高,不容许反复,则α取小值。
显
α=0.05时否定原假设,称差异性是显著的
著
性
α=0.01时否定原假设,称差异性是极显著的
检
验
3.测验计算
6 统计推断

第六章统计推断第四章研究了随机变量的几种分布律,总体如何配合样本,第五章讲的是样本统计量的分布规律,这些都属于总体与样本之间关系的第一个方面。
本章讨论第二个方面,即如何通过样本来推断总体。
由样本推断总体是以各种样本统计量的抽样分布为基础的。
所谓统计推断是指根据样本以及问题的条件和假定模型对未知事物(即总体)作出的以概率形式表述的推断,它主要包括假设检验和参数估计两个内容。
对所估计的总体提出一个假设,例如假设这个总体的平均数μ等于某个值μ0(μ= μ0),然后通过样本数据去推断这个假设是否可以接受。
如果可以接受,样本很可能抽自这个总体;否则,很可能不是抽自这个总体。
这一统计推断过程就是所谓的统计假设检验。
第一节单个样本的统计假设检验一、一般原理及两种类型的错误二、单个样本显著性检验的程序三、在σ已知的情况下,单个平均数的显著性检验—U 检验四、在σ未知时平均数的显著性检验——t 检验五、变异显著性的检验—x 2检验一、一般原理及两种类型的错误例1 用实验动物做实验材料,要求动物平均体重μ=10.00g ,若μ<10.00g,则需再饲养,若μ>10.00g则应淘汰。
动物体重是服从正态分布N (μ,σ2)的随机变量。
已知总体标准差σ= 0.40g ,但总体平均数μ是未知的。
为了得出对总体平均数μ的推断,从动物群体中,随机抽取含量为n的样本,通过样本平均数推断总体平均数μ。
(一)基本概念x 零假设是被检验的假设,通过检验可能被接受,也可能被否定。
本例中如果接受H 0:μ=10.00g , 表示该实验条件下饲养的实验动物可供实验用。
这里假设μ=μ0或μ-μ0=0, 称为零假设(null hypothesis),记作H 0:μ=μ0或H 0:μ-μ0=0。
1.假设提出零假设的同时,相应地有一对应假设,称为备择假设(alternative hypothesis),记作H A :μ>μ0, μ<μ0,μ≠μ0。
统计推断的内容概要

区间下限 = x - t (a/2, df)
s n
t (0.025,9) = 2.262 =
-
(
)=
New
区间上限 =
x + t (a/2, df)
s n
=
+
(
)=
范例--续
设备3所制造部件的平均值是否在目标范围之内?
5.397
高度 (英寸)
5.396 5.395
置信区间上限值 = 5.3955英寸
置信区间随样本容量的 增加而减小。
造部件的平均高度不在目标范围内
。
New
……使用不同的a值来计算置信区间
置信区间量化了数据的不定性。
样本大小对置信区间的影响
让我们取20个以上的样本(总数 n = 30),看一看对 95%的置信区间有何影响。
假设平均值和标准差保持不变:x = 5.3947 和 s = 0.00116 。
置信区间下限值 = x - t (a/2, df)
20
2.09
30
2.05
100
1.98
1000
1.96
用所给出的有关部件的数据代入以上公式…
New
置信区间
计算利用设备3所生产的传输设备平均高度的置信区间
使用a=0.05(95%的置信区间)
x = 5.3947
-s = 0.00116 n = 10
df = n - 1 = 9
t(a/2,df)取自t表格。
Calc > Random data > Normal
由1000个组成的样本保存在“数据 ”变量.
Calc > Random data > Sample from columns…
第六章统计推断

第六章统计推断第六章统计推断6.1 什么是统计假设?统计假设有哪⼏种?各有何含义?假设测验时直接测验的统计假设是哪⼀种?为什么?6.2 什么是显著⽔平?为什么要有⼀个显著⽔平?根据什么确定显著⽔平?它和统计推断有何关系?6.3 什么叫统计推断?它包括哪些内容?为什么统计推断的结论有可能发⽣错误?有哪两类错误?如何克服?6.4 若n =16,=σ15,要在=α0.01⽔平上测验H 0:=µ140,问y 要多⼤?若n =100,=σ15,要在=α0.05⽔平上测验H 0:=µ100,试求其否定区域?[答案:(1)y <132.65或>147.35;(2)y <96.13或>103.87]6.5 对桃树的含氮量测定10次,得结果(%)为:2.38,2.38,2.41,2.50,2.47,2.41,2.38,2.26,2.32,2.41,试测验H 0:=µ 2.50(提⽰:将各观察值减去2.40,可简化计算)。
[答案:y =2.39%,=y s 0.02%,t =5.5]6.6 从前作喷洒过有机砷杀雄剂的麦⽥中随机取4株各测定砷的残留量得7.5,9.7,6.8,和6.4mg ,⼜测定对照⽥的3株样本,得砷含量为4.2,7.0及4.6mg 。
(1)已知喷有机砷只能使株体的砷含量增⾼,决不会降低,试测验其显著性;(2)⽤两尾测验。
将测验结果和(1)相⽐较,并加解释。
[答案:=2e s 2.218,=-21y y s 1.14]6.7 从⼀个⽅差为24的正态总体中抽取⼀个容量为6的样本,求得其平均数=1y 15,⼜从⼀个⽅差为80的正态总体中抽取⼀个容量为8的样本,并知=2y 13,试取=α0.05测验210µµ=:H 和相对应的21µµ≠:A H 。
[答案:u =0.534,接受H 0]6.8 ⼀个容量为6的样本来⾃⼀个正态总体,知其平均数=1y 30和均⽅=21s 40,⼀个容量为11的样本来⾃⼀个正态总体,得平均数=2y 22,均⽅=22s 45,测验=-210µµ:H 4和相对的21µµ-:A H >4,取0.05的显著⽔平。
统计推断

E-mail: xybms@
统计学是搜集、整理、 统计学是搜集、整理、 总结、 总结、分析数据以及 依据数据进行推断的科学
定义
统计描述: 统计描述:包括搜集数 整理数据、 据、整理数据、总结数 据、分析数据以及将数 据呈现出来 统计推断: 统计推断:包括进行推 假设检验、 测、假设检验、确定关 系然后作出预测
肺癌病人 RD值 RD值 2.78 3.23 4.20 4.87 5.12 6.21 7.18 8.05 8.56 9.60 矽肺0期工人 矽肺0 RD值 RD值 3.23 3.50 4.04 4.15 4.28 4.34 4.47 4.64 4.75 4.82 4.95 5.10
1. Tests for Normality
研究阶段 随访 周数 体格检查 实验室检查 尿妊娠试验2 心电图 胸部X-ray3
模拟剂期 V1 –2周 X X X X X X X X X X
V2 第1天 X
药物治疗期 V3 V4 V5 2周末 4周末 X X 6周末 X
V6 8周末 X X X X
伴随用药情况 X 分发研究药物 回收研究药物 动态血压评价 不良事件评估
五、 分析思路
• • • • • 实验研究的目的是什么?研究变量是什么? 实验研究的目的是什么?研究变量是什么? 该资料属何种类型资料?属什么实验设计 属什么实验设计? 该资料属何种类型资料 属什么实验设计? 可以采用什么假设检验方法进行分析? 可以采用什么假设检验方法进行分析? 怎样建立检验假设? 怎样建立检验假设? 如果根据假设检验的统计量如何下结论? 如果根据假设检验的统计量如何下结论?
Equality of Variances
Variable
第6章 统计推断

第六章 统计推断
原假设和备择假设
什么是备择假设?
与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设
提出假设 作出决策
拒绝假设! 别无选择.
总体
我认为人口的平 均年龄是70岁
抽取随机样本
第六章 统计推断
均值 X = 50
原假设和备择假设
什么是原假设?
研究者想收集证据予以反对的假设,又称
“0假设”
总是有等号( , 或) 表示为 H0
第六章 统计推断
2、臵信区间
设 是总体 的一个参数, X
是 的 2 1 和
两个估计量,且1 ,对给定的常数 2
,有 (0 1)
随机区间 1 ,是臵信度(臵信水平)为 2
P(1 ,则称 2 ) 1
1
的臵信区间(区间估计)。其中1 和 分别 2
为臵信下限和臵信上限。
第六章 统计推断
3、臵信度(臵信系数/臵信水平),是指臵信区 间中包含总体参数真值的可能性大小,也就 是人们可以信赖的程度,通常用 1 表示。 置信度也可以指重复抽样条件下,在构 造的所有置信区间中包含参数真值的区间所 占的比例,也就是说构造的所有置信区间中 有1 区间包含总体参数真值。
青少年上网比例的95%的臵信区间。
第六章 统计推断
解:已知n 500 ,根据抽样结果 , z 2 1.96 样本比例为: p 225 45% 500
p(1 p) p z 2 , p z 2 n p(1 p) n
45% 55% 45% 55% (40.64%,49.36%) 45% 1.96 ,45% 1.96 500 500
第二部分统计推断-

15
点估计
点估计是指对某个感兴趣的量的真值 *做一个最 佳估计,这个估计称为 ˆ 或 ˆ n ,因为它取决于数 据,所以 ˆ 是一个随机变量。
但 θ为固定值,虽然未知
如果 X1, …,Xn 是从某个分布F的IID数据点,参数 θ的点估计为X1, … ,Xn 的函数:
ˆngX1,...,Xn
6
非参数模型
非参数模型
粗略地说,非参数模型不能用有限个参数参数化 如 F ALL allC D F's
如 F SOB
2
f: f x dx
7
例:参数推断
6观.1测例,(问一题维在参于数如估何计估)计设参X数1p,.。.., Xn 是独立的Bernoulli(p)
6.2例(二维参数估计)假设 X1,...,Xn F且PDF
n
对分布 f x1,...,xn;
f xi;
求期望,而不是对θ平i均1
bias n
n
若
n
,则该估计是无偏估计。
一致性
若 n P ,则该点估计是一致的。
有效性
无偏估计中,方差较小的一个更有效(收敛速度更快)
18
偏差—方差分解
点估计的性能有时通过均方误差(MSE, mean squared error) 来评价:
假设 X 1,...,X n~B ern o u lli(p )表示n次独立的抛 硬币试验,我们想知道该硬币是否公正
原假设 H 0 :硬币是公正的
备择假设 H
:硬币是不公正的
1
记为:H 0:p1 2v s . H 1 :p1 2
当 T pˆn 1 2 较大时,拒绝 H 0 问题:T应为多大?(拒绝域/接受域/显著水平)
第5章 统计推断

第 5 章 统计推断5.1 统计推断概述统计推断就是利用样本的数据,对总体的数量特征作出具有一定可靠程度的估计和判断。
统计推断的基本内容有参数估计和假设检验两方面。
概括地来讲,参数估计是指研究一个随机变量,推断它的数量特征和变动模式。
而假设检验是检验随机变量的数量特征和变动模式是否符合我们事先所作的假设。
参数估计和假设检验的共同特点是它们对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征作出估计或判断。
所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。
5.1.1 参数估计参数估计是以样本统计量作为未知总体参数的估计量,并通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值,把它作为总体参数的估计量。
参数估计包括点估计和区间估计。
点估计是直接以样本统计量作为相应总体参数的估计量。
例如,用样本均值作为总体均值的点估计量,用样本方差作为总体方差的点估计量。
点估计的优点在于它能提供总体参数的的具体估计值,可以直接作为决策的数量依据。
但是,点估计事实上几乎不可能做到完全准确,更谈不上有多大的置信度。
而区间估计是估计总体参数以某种概率保证程度(置信度)落入某一区间,这样就有把握多了。
对总体被估计参数θ作区间估计,就是要给出区间的下限1ˆθ和上限2ˆθ,使被估计参数落在(1ˆθ,2ˆθ)内的概率为1α−,即 12ˆˆ()1P θθθα≤≤=− 其中,1α−就是置信度,α被称为显著性水平,如图 5-1。
ˆθ12图 5-1 区间估计在SPSS 中没有专门的参数估计命令。
参数的点估计值可以在Descriptives 命令中得到,例如用统计量mean 作为总体均值的点估计,用统计量variance 作为总体方差的点估计等。
参数的区间估计可以通过Explore 命令得到(参见4.4节的内容),也可以在各种假设检验的过程中可以得到(参见本节后面的内容)。