第四章 统计推断 PPT
合集下载
第4章 统计推断(g)1PPT课件

原品种 µ0 =300kg ,σ=75kg
新品系 n=25,-x=330kg
µ
? µ≠µ0
3
一、数据结构
从服从正态分布N(μ0=300,σ=75)的原品种总体中,随 机抽取n个个体构成样本,则样本观察值可表示为
xi = μ0 + εi (i=1,2 ,… ,n)
(4.1)
而从新品系总体中随机抽取的样本观察值,则为
xi = μ + εi (i=1,2 ,… ,n)
(4.2)
新品系与原品种的产量差异为
τ = μ - μ0
(4.3)
将(4.3)代入(4.2)得
xi = μ0 + τ + εi (i=1,2 ,… ,n)
(4.4)
4
二、统计假设测验的基本思路
对一个样本的n个观察值xi求平均数,由(4.4)有
x0i
为试验误差的概率。
9
标准正态离差 u=
x- _ µ0 σ x-
=
330-300 75/√25
=2
(σ
x-
=σ √n
)
查附表2,即得u值对应的概率p<0.05。表明30Kg差异 属于试验误差的概率小于5%。
根据小概率事件实际不可能性原理,这个假设应被否定, 即表面差异不全为试验误差,新品系与原品种之间存在真实 差异。
12Байду номын сангаас
四、统计假设测验的几何意义
α=0.05时,由附表2得u=1.96
若要在0.05水平上接受H0: µ= µ0
则
u=
︳x- _ µ0 σ x-
︳ <
1.96
(σ
x
=σ √n
)
假设接受区域(acceptance region)
第4章统计推断PPT课件

x x (3.41)
t
s x
sn
9
t分布的特征:
(1)曲线左右对称,围绕平均数μt=0向两侧递降。
(2) t分布受自由度df=n-1的制约,每个自由度都有一
条t分布曲线。
(3)和正态分布相比,t分布的顶部偏低,尾部偏高, df〉30时,其曲线接近正态分布曲线,当df→+∞时,则和正态 曲线重合。
拒绝域比较,若没落入,则认为有显著差异,单未 达极显著差异,拒绝H0
若也落入α=0.01拒绝域,则认为差异极显著,拒
绝H0
36
例3.1 已知豌豆重量(mg)服从N(377.2,3.32)。
在改善栽培条件后,随机抽取9粒,籽粒平均重 X =379.2,若标准差仍为3.3,问改善栽培条件是否显 著提高了豌豆籽粒重量?
解:1.小麦的株高是服从正态分布的随机变量
2.假设:
H0: σ=σ0(14cm)
HA: σ<σ0(14cm)
关于备择假设的说明:小麦经过提纯后株高只 能变得更整齐,绝不会变得更离散。即σ只能小于σ0 。因此, HA: σ<σ0
3.显著性水平:规定α=0.01
40
4.统计量的值: 2n 1 0 2S2 ~2n1
正态分布和t分布:双侧检验--取绝对值与分位数 比 ;单侧检验--下单尾是小于负分位数拒绝H0; 上单尾是大于分位数拒绝H0。
χ2分布:下侧分位数和上侧分位数
35
5.计算统计量
把样本观测值代入统计量公式,求得统计量取值 ,检查是否落入拒绝域。
若没落入,则认为无显著差异,接受H0
若落入α=0.05的拒绝域,则应进一步与α=0.01的
10
注: t1(n)t(n) 分位点
生物统计第4章 统计推断

2014-8-4
4.1.5 变异性的显著性检验:2检验
一个混杂的小麦品种,株高标准差0 =14cm,经 提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察 提纯后的群体是否比原群体整齐?
1、小麦株高是服从正态分布的随机变量 2、提出假设 关于备择假设的说明:小麦经提纯后只 能变得更整齐,绝不会更离散,即只能 小于0,因此HA:< 0 。
2014-8-4
4.1.5 变异性的显著性检验:2检验(续) 3、显著性水平规定=0.05 4、统计量的值:
5、建立的拒绝域:因HA: < 0 ,故为下尾 单侧检验,当2<21-时拒绝H0 ,从附表6中可 以查ቤተ መጻሕፍቲ ባይዱ29,0.99 = 2.09 6、结论,因2<29,0.99,拒绝H0 ,接受HA , 提纯后株高比原株高整齐。
2014-8-4
小概率原理
在一次试验中,几乎是不会发生的,若根 据一定的假设条件计算出来的该事件发生 的概率很小,而在一次试验中它竟然发生 了,则可认为原假设条件不正确,给予否 定。 在生物统计的显著性检验中,通常取5%或 1%小概率为显著性水平,记为“”
2014-8-4
小概率原理用于显著性检验
2014-8-4
两种类型的错误
–Ⅰ型错误:假设是正确的,却错误地拒绝了它。 犯Ⅰ型错误的概率不会大于 。(以真为假) –Ⅱ型错误:当 0但错误地接受了 = 假设时所犯的错误。(以假为真)
0的
2014-8-4
关于两种类型错误的三点解释
• 当1越接近于0时,犯Ⅱ型错误的概率愈 大;当1越远离0时,犯Ⅱ型错误的概率 愈小。 • 在样本含量和样本平均数都固定时,为了 降低犯Ⅰ型错误的概率 (就应将图5-2 中的竖线右移),必然增加犯Ⅱ型错误的 概率。 • 为了同时降低和就需增加样本含量。
4.1.5 变异性的显著性检验:2检验
一个混杂的小麦品种,株高标准差0 =14cm,经 提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察 提纯后的群体是否比原群体整齐?
1、小麦株高是服从正态分布的随机变量 2、提出假设 关于备择假设的说明:小麦经提纯后只 能变得更整齐,绝不会更离散,即只能 小于0,因此HA:< 0 。
2014-8-4
4.1.5 变异性的显著性检验:2检验(续) 3、显著性水平规定=0.05 4、统计量的值:
5、建立的拒绝域:因HA: < 0 ,故为下尾 单侧检验,当2<21-时拒绝H0 ,从附表6中可 以查ቤተ መጻሕፍቲ ባይዱ29,0.99 = 2.09 6、结论,因2<29,0.99,拒绝H0 ,接受HA , 提纯后株高比原株高整齐。
2014-8-4
小概率原理
在一次试验中,几乎是不会发生的,若根 据一定的假设条件计算出来的该事件发生 的概率很小,而在一次试验中它竟然发生 了,则可认为原假设条件不正确,给予否 定。 在生物统计的显著性检验中,通常取5%或 1%小概率为显著性水平,记为“”
2014-8-4
小概率原理用于显著性检验
2014-8-4
两种类型的错误
–Ⅰ型错误:假设是正确的,却错误地拒绝了它。 犯Ⅰ型错误的概率不会大于 。(以真为假) –Ⅱ型错误:当 0但错误地接受了 = 假设时所犯的错误。(以假为真)
0的
2014-8-4
关于两种类型错误的三点解释
• 当1越接近于0时,犯Ⅱ型错误的概率愈 大;当1越远离0时,犯Ⅱ型错误的概率 愈小。 • 在样本含量和样本平均数都固定时,为了 降低犯Ⅰ型错误的概率 (就应将图5-2 中的竖线右移),必然增加犯Ⅱ型错误的 概率。 • 为了同时降低和就需增加样本含量。
第四章 统计推断

.
二、双侧检验与单侧检验 (一)双侧检验 H0:µ =µ 0, HA:µ ≠ µ 0 H0的拒绝域 :|U| > ua/2 ; H0的接受域: |U| < ua/2 。(见图示) (二)单侧检验 H0:µ =µ 0, HA:µ < µ 0 或 HA:µ > µ 0 1、下尾检验 H0:µ =µ 0, HA:µ < µ 0 H0的拒绝域 :U< -ua ;
.
u=
x m0
s
x
s s x = n
.
10.23 10 u= = 3.15 0.40 30
根据u值的大小,即可判定假设H0:µ=µ 0 ( m =10㎏)是否正确?
.
.
.
查附表2,实得u=3.15值对应的概率p< 0.05。表明0.23Kg差异属于抽样误差的概 率小于5%。 (三)根据小概率事件实际不可能性原理, 推断 H0是否正确。 判定假设H0是否正确的小概率标准称为
.
2 s1 193.4 F = 2 = = 0.206 s2 937.7
.
④H0的拒绝域:因为是下尾检验,当F<F0.95时拒 绝 H 0。
F19,19,0.95 =
.
1 F19,19,0.05
2 n 1 s 10 124.23 2 = = = 1.113
.
.
14 2 ④H0的拒绝域:当a=0.01时,拒绝域为2 <20.99 从附表6中查出20.99,9=2.088 。
s 02
⑤结论:因实得2 < 2.088 ,P < 0.01,所以拒 绝H 。推断经过提纯后株高已变得非常整齐。
s F = s
2 1 2 2
统计推断PPT课件

计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
. 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
统计推断
(statistical inference)
.
1
统
由一个样 本或一糸
计
列样本所
推
得的结果
断
来推断总 体的特征
.
假设检验 参数估计
2
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
.
3
.
4
第一节 假设检验
0.025 -1.96x
否定区
0.95
0.025
0 +1.96x
接受区
否定区
临界值: + ux
.
+ 1.96x
19
P(-2.58x <x< +2.58x) =0.99
0.005 -2.58x
否定区
0.99
0.005
0 +2.58x
接受区
否定区
临界值: + 2.58x
.
双尾检验
(two-sided test)
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
. 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
统计推断
(statistical inference)
.
1
统
由一个样 本或一糸
计
列样本所
推
得的结果
断
来推断总 体的特征
.
假设检验 参数估计
2
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
.
3
.
4
第一节 假设检验
0.025 -1.96x
否定区
0.95
0.025
0 +1.96x
接受区
否定区
临界值: + ux
.
+ 1.96x
19
P(-2.58x <x< +2.58x) =0.99
0.005 -2.58x
否定区
0.99
0.005
0 +2.58x
接受区
否定区
临界值: + 2.58x
.
双尾检验
(two-sided test)
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
第四章 统计推断 ppt课件

H0:μ≤ μ0=30(cm),即该棉花品种纤维长度达不到 纺织品生产的要求。 HA:μ>μ0
24
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
返回 H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
12
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
(3)检验
x
x n 4.421 s
x2
(x)2
n
0.267
n1
(tn1
x
sx
0.9 4
t 0.05(9) =2.262
P>0.05
在0.05显著水平上,接受H0,否定HA;
认为该次抽样所测结果与多年平均值无显著差别,
属于随机误差。
45
二、两个样本平均数 的假设检验
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
24
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
返回 H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
12
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
(3)检验
x
x n 4.421 s
x2
(x)2
n
0.267
n1
(tn1
x
sx
0.9 4
t 0.05(9) =2.262
P>0.05
在0.05显著水平上,接受H0,否定HA;
认为该次抽样所测结果与多年平均值无显著差别,
属于随机误差。
45
二、两个样本平均数 的假设检验
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
第4章 统计推断 120

H0
1 2
1 2 1 2
H1
1 2
1 2 1 2
医学统计学
12
三 、双尾检验与单尾检验
2
否定区 接受区
2
否定区
双尾 检验
接受区 否定 区
单尾 检验
二 、假设检验的步骤
2.确定检验水准 检验水准(size of a test)亦称显著 性根水据准选(定sig的ni显fic著an性ce水le平ve(l)0,.0符5或号0为.0α1。),决定接受 还它是是拒判绝别H差0. 异有无统计意义的概率水准,其大小 应根据分析的要求确定。通常取α= 0.05。
u值。
医学统计学
15
二 、假设检验的步骤
4.确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于
或及的样大前本于提(下间出或的小现差于观异)察由样现抽有本样统以误计及差更量所的极致概端的率情概。况即的率概在。率H0为。真
│t│≥ tα,υ ,则P≤ α;
可以认为差别不由抽样误差引起,可以拒绝H0
医学统计学
14
二 、假设检验的步骤
3.选定检验方法和计算统计量
的根选检据验择研方究法适设。计当如的完类的全型随统和机统计设计计推方中断,法的两目计样的本要算均求数H选的用0比不较同 可不成同用的t立检统验计的,检样可验本方能含法量,性较可大即得时到(概不n同>率1的00有统)计,可多量用,大Z如检t验值。和
假设检验的原理
反证法:当一件事情的发生只有两种可能A和B, 为了肯定其中的一种情况A,但又不能直接证实A, 这时否定另一种可能B,则间接的肯定了A。
小概率原理:概率很小的事件在一次抽样试验中
统计推断的概要(ppt 共24页)

样本均值的分布
从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为 了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均 值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确.
推断的概要
10
随样本容量变化的平均标准误差(平均值的标准偏差)
平均值的标准偏差称平均的标准误差(SE Mean),如下定义. 一般标准误差越小推断值越好.
统计推断的概要
(分析阶段) (ZTE-GB303-V1.5)
推断的概要
1
主要内容
1. 统计推断 2. 误差的来源 3. 置信统计推断
统计推断是通过抽取样本,然后对样本进行分析,以样本的分析结果 推测出“总体可能是这样”结论,对总体下一个正确判断的行为,即总
体
是否发生了变动。而且,一般以推测总体平均值,总体的比率,总体标 准偏差等显示总体分布特征值的统计程序称为统计推断。
95% Confidence Interval for Median 95% Confidence Interval for Median 49.315 60.494
对总体区间推断值 -95%置信度总体平均值 的置信区间 -95%置信度下总体标准 偏差的置信区间 -95%置信度总体中位 数的置信区间
弯曲点 标 准 误 差
Sx Sx n
Sx = Sx =
平均的标准误差 样本的标准偏差 n = 样本大小
0
10
20
30
标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大
小应为5以上,为了得到更精确的平均推断值,样本大小应为30以上.
推断的概要
11
3. 区间推断
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
τ为处理效应, i 为误差效应。
大家好 9
x 从式 - μ0 = τ + i 可知表型效应的构成有二种可能性
(1)处理效应与误差效应; (2)全为试验误差。
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
但在某些情况下,双尾测验不一定符合实际需要。
在已知μ不可能小于μ0时,则备择假设为HA:μ>μ0
在已知μ不可能大于μ0时,则备择假设为HA:μ<μ0
例:研究矮壮素使玉米矮化的效果,从理论上判断, 喷施矮壮素只可能矮化无效而不可能促进植物长高, 因此假设
H0:喷施矮壮素的株高与未喷的相同或更高,即H0: μ≥μ0 ,对应HA: μ<μ0 ,即喷施矮壮素的株高较未
例:上例中
P >0.05
所以接受H0,从而得出结论:使用克 矽平治疗前后血红蛋白含量未发现有 显著差异,其差值10应归于误差所致。
0.025 0.95
0.025
u >1.96 u >2.58
P( u ) <0.05 差异达显著水平 P( u ) <0.01 差异达极显著水平
三 、双尾检验与单尾检验 P(-1.96x <x< +1.96x) =0.95
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验数检验
频率的检验
假
设
方差的检验
检
秩和检验
验
符号检验
非参数检验
游程检验
秩相关检验
统计假设测验的基本思想
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
小概率原理
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
统计推断
(statistical inference)
统
由一个样 本或一糸
假设检验
计
列样本所
推
得的结果
断
来推断总 体的特征
参数估计
第一节 假设检验的原理与方法 第二节 样本平均数的假设检验 第三节 样本频率的假设检验 第四节 参数的区间估计与点估计 第五节 方差的同质性检验
第一节 假设检验
一 概念 :
0.025 否定区-1.96x
0.95
0.025
0 接受区
+1.9否6定x 区
临界值: + ux
+ 1.96x
P(-2.58x <x< +2.58x) =0.99
0.005 否定区-2.58x
0.99
0.005
0 接受区
+2.5否8定x 区
临界值: + 2.58x
双尾检验
(two-sided test)
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验 也常取=0.05和=0.01两个显著水平 。
=0.05
P<
=0.01
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值
根据研究设计的类型和统计推断的目的选择使
用不同的检验方法。
1 、提出假设
H0
无效假设 /零假设 /检验假设
0 =
误差 效应
备择假设 /对应假设
0
HA
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。
平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
xi= μ +εi (i=1,2,…,n)
式中μ为新品种的总体平均数。新品种与地方品种的差 异(品种效应)用τ表示,则
τ
= μ- 大家好
μ0
8
代入上式得:
xi= μ0 + τ + εi (i=1,2,…,n)
对xi求平均数,并将式子稍作变形得:
x - μ0 = τ + i
x 0 为表型效应, 在本例中,x033030030
喷的为矮。
例:生产某种纺织品,要求棉花纤维长度平均为30mm以上, 现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为 30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否符合纺织品的生产要求?
注:备择假设比无效假设重要,具体选择要由实际问 题来确定,一般把期望出现的结论作为备选假设。
大家好 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025 否定区0 -1.96x
0.95
0 接受区
0.025 0+1.9否6定x 区
4、作出推断结论:是否接受假设
小 概
P> 可能正确
率
原
理 P< 可能错误
接受H0 否定HA 否定H0 接受HA
设某地区的当地小麦品种一般667m2产300kg,即当
地品种这个总体的平均数为μ0=300(kg),并从多年种植
结果获得其方差σ2=(75)2kg。若从这一总体中随机抽 取n个个体构成样本,则样本观察值可表示为:
yi= μ0 +εi (i=1,2,…,n)
现有某新品种通过25个小区的试验,计算其样本平均产 量为每667m2为330kg。新品种的样本观察值可表示为:
H0:μ=μ0 =126(mg/L)
HA:μ≠μ0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。
大家好 9
x 从式 - μ0 = τ + i 可知表型效应的构成有二种可能性
(1)处理效应与误差效应; (2)全为试验误差。
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
但在某些情况下,双尾测验不一定符合实际需要。
在已知μ不可能小于μ0时,则备择假设为HA:μ>μ0
在已知μ不可能大于μ0时,则备择假设为HA:μ<μ0
例:研究矮壮素使玉米矮化的效果,从理论上判断, 喷施矮壮素只可能矮化无效而不可能促进植物长高, 因此假设
H0:喷施矮壮素的株高与未喷的相同或更高,即H0: μ≥μ0 ,对应HA: μ<μ0 ,即喷施矮壮素的株高较未
例:上例中
P >0.05
所以接受H0,从而得出结论:使用克 矽平治疗前后血红蛋白含量未发现有 显著差异,其差值10应归于误差所致。
0.025 0.95
0.025
u >1.96 u >2.58
P( u ) <0.05 差异达显著水平 P( u ) <0.01 差异达极显著水平
三 、双尾检验与单尾检验 P(-1.96x <x< +1.96x) =0.95
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验数检验
频率的检验
假
设
方差的检验
检
秩和检验
验
符号检验
非参数检验
游程检验
秩相关检验
统计假设测验的基本思想
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
小概率原理
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
统计推断
(statistical inference)
统
由一个样 本或一糸
假设检验
计
列样本所
推
得的结果
断
来推断总 体的特征
参数估计
第一节 假设检验的原理与方法 第二节 样本平均数的假设检验 第三节 样本频率的假设检验 第四节 参数的区间估计与点估计 第五节 方差的同质性检验
第一节 假设检验
一 概念 :
0.025 否定区-1.96x
0.95
0.025
0 接受区
+1.9否6定x 区
临界值: + ux
+ 1.96x
P(-2.58x <x< +2.58x) =0.99
0.005 否定区-2.58x
0.99
0.005
0 接受区
+2.5否8定x 区
临界值: + 2.58x
双尾检验
(two-sided test)
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验 也常取=0.05和=0.01两个显著水平 。
=0.05
P<
=0.01
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值
根据研究设计的类型和统计推断的目的选择使
用不同的检验方法。
1 、提出假设
H0
无效假设 /零假设 /检验假设
0 =
误差 效应
备择假设 /对应假设
0
HA
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。
平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
xi= μ +εi (i=1,2,…,n)
式中μ为新品种的总体平均数。新品种与地方品种的差 异(品种效应)用τ表示,则
τ
= μ- 大家好
μ0
8
代入上式得:
xi= μ0 + τ + εi (i=1,2,…,n)
对xi求平均数,并将式子稍作变形得:
x - μ0 = τ + i
x 0 为表型效应, 在本例中,x033030030
喷的为矮。
例:生产某种纺织品,要求棉花纤维长度平均为30mm以上, 现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为 30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否符合纺织品的生产要求?
注:备择假设比无效假设重要,具体选择要由实际问 题来确定,一般把期望出现的结论作为备选假设。
大家好 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025 否定区0 -1.96x
0.95
0 接受区
0.025 0+1.9否6定x 区
4、作出推断结论:是否接受假设
小 概
P> 可能正确
率
原
理 P< 可能错误
接受H0 否定HA 否定H0 接受HA
设某地区的当地小麦品种一般667m2产300kg,即当
地品种这个总体的平均数为μ0=300(kg),并从多年种植
结果获得其方差σ2=(75)2kg。若从这一总体中随机抽 取n个个体构成样本,则样本观察值可表示为:
yi= μ0 +εi (i=1,2,…,n)
现有某新品种通过25个小区的试验,计算其样本平均产 量为每667m2为330kg。新品种的样本观察值可表示为:
H0:μ=μ0 =126(mg/L)
HA:μ≠μ0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。