第四章 生物统计学统计推断121031

合集下载

生物统计学-4-统计推断

生物统计学-4-统计推断


µ0 µ

Ⅰ和Ⅱ重合
0.025 0.95
α错误
µ = µ0
0.025
犯第一类错误的概率等于显著水平 α 值
Ⅰ和Ⅱ不重合
C1
β
C2


α 2
α 2
-uα
µ0

µ
犯第二类错误的概率记为 β 值
为了降低犯两类错误的概率,一般从选取适当的显 为了降低犯两类错误的概率,一般从选取适当的显 来考虑; 著水平α 和增加试验重复次数 n 来考虑; 结论: 结论: 1. 两类错误既有联系又有区别:α 错误只在否定 H 时 两类错误既有联系又有区别: 0 发生,β 错误只在接受 H 0时发生;α 错误增加时 β 发生; 发生, 错误减小, 错误减小; 错误减小,β 错误增加时 α 错误减小; 2. β 还依赖于 µ − µ0 的距离; 的距离; 3. 可使两类错误的概率都减小; n ↑, σ ↓ 可使两类错误的概率都减小;
1.3 对二个样本平均数相比较的假设:假设二个样本平均 对二个样本平均数相比较的假设: 数 的总体, x1和 x 2 来自于具有平均数 µ1和µ 2 的总体,即: H 0 : µ1 = µ 2
H A : µ1 ≠ µ 2
2. 确定显著性水平: 确定显著性水平: 在确定无效假设和备择假设后, 在确定无效假设和备择假设后,要确定一个否定 H 0 的 概率标准,即显著性水平( 概率标准,即显著性水平(significance level)或概率 ) 水平( ),记作 水平(probability level),记作 α ,生物统计中常取 ), 两个显著水平; α = 0.05和α = 0.01 两个显著水平; 3. 计算概率; 计算概率; 4. 推断是否接受假设 小概率原理:如果根据假设条件能够确定事件 出现 小概率原理:如果根据假设条件能够确定事件A出现 为很小, 的概率 α 为很小,则在此假设条件下的 n 次独立重复 试验中,事件 将按预定的概率发生 将按预定的概率发生, 试验中,事件A将按预定的概率发生,而在一次试验 中则几乎不可能发生; 中则几乎不可能发生;

生物统计学课后习题解答-李春喜

生物统计学课后习题解答-李春喜

第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。

第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。

【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。

24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。

重庆大学生物统计学_第四章 统计推断

重庆大学生物统计学_第四章 统计推断
生物统计学上,一般认为: • 等于或小于0.05或0.01的概率为小概率 •
假设检验的步骤
1、分析 • 2、提出假设 • 3、确定显著性水平 a • 4、计算概率 • 5、推断是否接受假设 •
确定适当的检验统计量
什么检验统计量? •
用于假设检验问题的统计量 • 选择统计量的方法与参数估计相同,需考虑 • (1)是大样本还是小样本 • (2)总体方差已知还是未知 •
提出假设
无效假设又称零假设,即待检验的假设,表示为H0
无效:指处理效应与总体参数之间没有真实的差异, 试验结果中的差异是误差导致 •
备择假设:与无效假设对立的假设,表示为HA
备择假设认为试验结果中的差异是由于总体参数不 同引起 •
无效假设遵循原则: •
1、无效假设有意义 • 2、可算出因抽样误差而获得样本结果的概率 •
P(X<7.65) P(X>7.65)
7.65 7.25
0.158
true
0.994
0.006
(4)推断 •
P<0.05, 显著水平上拒绝H0,接 受HA。即认为新育苗方法和常 规方法有显著差异 •
0.994
α
α
2
2
P 1 =0.025
P 2 =0.975
分析:1)总体方差已知,故采用u检验 • 2)治疗后能否提高总体平均数,故进行单尾检验 •
小概率 原理 •
可能正确 •
接受H0 否定HA
P <α 可能错误
接受HA 否定H0
判断P-值显著性的指导
如果 0.01<=P<0.05: 则结果是显著的 (*) 如果 P<0.01: 则结果是极显著的(**) 如果 P>0.05: 则结果被认为没有统计显著性 (NS)

生物统计学中的统计推断共42页

生物统计学中的统计推断共42页

16、业余生活要有意义,不要越轨。——华盛顿 17、一个人即使已登上顶峰,也仍要自强不息。——罗素·贝克 18、最大的挑战和突破在于用人,而用人最大的突破在于信任人。——马云 19、自己活着,就是为了使别人过得更美好。——锋 20、要掌握书,莫被书掌握;要为生而读,莫为读而生。——布尔沃
END
生物统计学中的统计推断
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为了不让强 者做什 么事都 横行霸 道。— —奥维 德 19、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生

04生物统计学第4章1

04生物统计学第4章1

置信水平
样本统计量
41
抽样分布
置信水平
1- 接受域
拒绝域

H0值 观察到的样本统计量
临界值
样本统计量
42
抽样分布
置信水平
1- 接受域
拒绝域

H0值 临界值
样本统计量
43
1.第一类错误(弃真错误)
◦ 原假设为真时拒绝原假设 ◦ 会产生一系列后果
◦ 第一类错误的概率为
被称为显著性水平
2.第二类错误(取伪错误)
◦ 原假设为假时接受原假设
◦ 第二类错误的概率为
20
假设检验中的两类错误
(决策结果)
H : 无罪 假设检验就好像一场审判过程 0
统计检验过程
陪审团审判
设H0;或者说,是把希望(想要)证明的有效假 设作为备择假设 3. 先确立备择假设H1
33
例1,改善栽培技术后,将会使豌豆的平 均籽粒重超过360毫克以上
◦ 属于研究中的假设 ◦ 建立的原假设与备择假设应为
H0: 360 H1: 360
例2,改进筛选方法后,会使鱼苗场的杂 种率降低到2%以下
◦ 事先对总体参数或分布形式作出某种假设 ◦ 然后利用样本信息来判断原假设是否成立
2. 类型
◦ 参数假设检验 ◦ 非参数假设检验
3. 特点
◦ 采用逻辑上的反证法 ◦ 依据统计上的小概率原理
8
这个值不像我 们应该得到的 样本均值 ...
抽样分布
... 因此我们拒 绝假设 = 50
... 如果这是总 体的真实均值
3. 检验统计量的基本形式为
Z x 0 n
14
什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率

生物统计第4章 统计推断

生物统计第4章 统计推断
2014-8-4
4.1.5 变异性的显著性检验:2检验
一个混杂的小麦品种,株高标准差0 =14cm,经 提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察 提纯后的群体是否比原群体整齐?
1、小麦株高是服从正态分布的随机变量 2、提出假设 关于备择假设的说明:小麦经提纯后只 能变得更整齐,绝不会更离散,即只能 小于0,因此HA:< 0 。
2014-8-4
4.1.5 变异性的显著性检验:2检验(续) 3、显著性水平规定=0.05 4、统计量的值:
5、建立的拒绝域:因HA: < 0 ,故为下尾 单侧检验,当2<21-时拒绝H0 ,从附表6中可 以查ቤተ መጻሕፍቲ ባይዱ29,0.99 = 2.09 6、结论,因2<29,0.99,拒绝H0 ,接受HA , 提纯后株高比原株高整齐。
2014-8-4
小概率原理
在一次试验中,几乎是不会发生的,若根 据一定的假设条件计算出来的该事件发生 的概率很小,而在一次试验中它竟然发生 了,则可认为原假设条件不正确,给予否 定。 在生物统计的显著性检验中,通常取5%或 1%小概率为显著性水平,记为“”
2014-8-4
小概率原理用于显著性检验
2014-8-4
两种类型的错误
–Ⅰ型错误:假设是正确的,却错误地拒绝了它。 犯Ⅰ型错误的概率不会大于 。(以真为假) –Ⅱ型错误:当 0但错误地接受了 = 假设时所犯的错误。(以假为真)
0的
2014-8-4
关于两种类型错误的三点解释
• 当1越接近于0时,犯Ⅱ型错误的概率愈 大;当1越远离0时,犯Ⅱ型错误的概率 愈小。 • 在样本含量和样本平均数都固定时,为了 降低犯Ⅰ型错误的概率 (就应将图5-2 中的竖线右移),必然增加犯Ⅱ型错误的 概率。 • 为了同时降低和就需增加样本含量。

生物统计学中的统计推断

生物统计学中的统计推断

x
非患者 506 180.6
45.8 34.2
u x1 x2
s s 2
2
1 2
n1 n2
ν=n1+n2-2
t检验:要求样本来自正态分布,且两均数比 较时还要求两总体方差相等。
u检验:n较大。
t检验的条件是样本观察值来自于正态分布,且 要求两组比较时两组总体方差相等,由于抽 样误差的存在,即使总体方差相等,求出的 样本方差也未必相等,但是否一定是由抽样 误差引起的呢?
检验统计量
t
d
sd
n
例 某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系,将同种属的大白鼠按性别相同,年龄、 体重相近者配成对子,共8对,并将每对中的两头 动物随机分到正常饲料组和维生素E缺乏组,过一 定时期将大白鼠杀死,测得其肝中维生素A的含量, 问不同饲料的大白鼠肝中维生素含量有无差别?
当样本例数n一定时,α减小则β会增大。
检验效能(power of a test):亦称把握度,1-β, 它的意义是当两总体确有差别,按规定检验水准α 所能发现该差异的能力。
(1)统计意义:从总体中作大数次随机抽样, 有95%求得的可信区间包含总体均数。并不是 做一次抽样求得可信区间包括μ的概率是0.95,
n
t s
x
n ,
< μ<
t x s
n ,
1
n1

1
n2

ν=n1+n2-2
例 某克山病区测得11例克山病患者与13名健康人的血 磷值(mmol/L),问该地急性克山病患者与健康人 的血磷值是否不同?
患者X1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11

生物统计学4 统计推断

生物统计学4 统计推断
即:新规格与原规格亩产量相同。
2) 选取显著水平: 0 .0 5
3)
计算: x 3 5 5 ( k g / 亩 )
s
(x x)2 9.4868
n 1
sx
s 3.3541 n
t x 0 1.491
sx
4) 推断: 查表t-table, 与显著性水平对应的|t 0.05, 7|=2.365,因
第一节 假设检验的原理与方法
统计假设:在科学研究中,往往首先要提 出一个有关某一总体参数的假设,这种假 设称为统计假设。
原品种 µ0 =300kg ,σ=75kg
新品系 n=25,-x=330kg
µ
? µ≠µ0
首先,先假设真实差异不存在,表面差 异全为随机误差;
其次,计算这一假设出现的概率,根据 小概率事件实际不可能性原理,判断假设是 否正确。
即:两品种产量相同。
2) 选取显著水平: 0 .0 1
3) 计算:s x1 x2
s12

s
2 2
4.951
n1 n2
u x1 x2 3.595 s x1 x2
4) 推断:查表z-two-tails,与显著性水平对应的 |U0.01|=2.58,因为3.595>2.58,所以假设错误,
如第一节的例子,如n从25增至225,则 σx -=75/√225=5㎏ 由此计算的接受区间变小,为
290.2㎏~309.8㎏。若新品种μ=315㎏,则不能发现H0:µ=µ0 为错误的概率β=0.1492=14.92%(图4.5) 。
综合起来可以归纳如下:
样本容量n固定的情况下,提高显著水平,如从 5%提高到1%,则将增大第二类错误的概率值。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
3、临界值
例 从上述动物群体中抽出含量n=10的样本, 计算出x=10.23g,并已知该批动物的总体平 均数μ绝不会小于10.00g,规定的显著水平α= 0.05。根据以上条件进行统计推断。
H0: μ=10.00 HA: μ>10.00 根据备择假设,为了x 得到落在上侧尾区的
概率P(U > u),将x 标准化,求出u值。
样本含量。
15
7、关于两个概念的说明
(1)当p <α时,所得结论的正确表述应为:由 样本平均数推断出的总体平均数μ与μ0之间的 差异有统计学意义。即它们属于两个不同总体。 习惯上称为“差异是显著的”。
(2)接受H0的更严密的说法应是:尚无足够理 由拒绝H0。但习惯上采用接受H0和拒绝H0这 种表达方法。
6
从动物群体中抽出含量为n的样本,计算样本 平均数,假设该样本是从N(10.00,0.402 )中抽 取的,标准化的样本平均数
u
x
0
x
10.00 0.40
n
n
服从N(0,1)分布,可以从正态分布表中查出样本 抽自平均数为μ的总体的概率,即P(U>u), P(U<-u), 以及P(|U|>u)的概率。
➢ H0:μ=300 HA:μ≠300 ➢ 统计量: t x 0
s
n
28
➢ Data View ➢ Variable View
SPSS 界面
29
SPSS操作
➢ 在Data View中输入数据后,选择 [Analyze]=>[Compare Means]=>[One Sample T Test],弹出对话框,将“穗重”
13
6、两种类型的错误
(1)I型错误,犯I型错误的概率记为α
α=P(I 型错误)=P(拒绝H0|H0是正确的,μ=μ0) 弃真错误
(2)II型错误,犯II型错误的概率记为β
βμ1=P(II 型错误)=P(接受H0|H0是错误的,μ=μ1) 纳伪错误
14
犯I型错误的概率α,犯II型错误的概率
(((2)13))降当为低μ了犯1 I型越同错接时误近降的μ低概0 率时犯,,两必犯种然I错增I型 加错误犯误的II型的概错概率误, 的率必概越须率大增。。加
即改善栽培条件显著提高了豌豆籽粒重量。
22
当总体方差σ2未知时,只要样本容量n>30,可 以用样本方差s2来代替σ2 ,仍可以使用u检验 法
例:生产某种纺织品,要求棉花纤维长度平均 为30mm以上,现有一棉花品种,以n=400进 行抽查,测得其纤维平均长度为30.2mm,标 准差为2.5mm,问该棉花品种的长度是否符合 纺织品的生产?
9
u
x
0
10.23 10.00 0.40
1.82
n
10
P(U >1.82)=0.03438,P < 0.05,拒绝H0,接受 HA。
10
在实际应用中,并不直接求出概率值,而是建 立在α水平上H0的拒绝域。从正态分布上侧分 位数表中查出P(U > uα)= α时的uα值,U > uα的 区域称为在α水平上的H0拒绝域,而U < uα的 区域称为接受域。接受域的端点一般称为临界 值。本例的u=1.82,从附表3可以查出 u0.05=1.645, u > uα,落在拒绝域内,拒绝H0而 接受HA。
t x 0
s
n
26
检验程序
5、相应于2中各备择假设之H0的拒绝域: ① t > tα ② t <-tα ③ |t| > tα/2
6、得出结论并给予解释。
27
例:已知玉米单交种群单105的平均穗重μ0= 300g。喷洒植物生长促进剂后,随机抽取9个 果穗,其穗重为:308、305、311、298、315、 300、321、294、320g。问喷药后与喷药前的 果穗重差异是否显著?
➢ 依题意有: n=9 x=379.2 σ=3.3
➢ H0:μ=377.2 HA:μ>377.2
➢ ➢
a=0.05 统计量:
u
x
0
379.2 377.2 3.3
2 1.1
1.82
n
9
➢ 查临界值,确定拒绝域和接受域
21
标准正态分布的单侧和双侧分位点(/临界值)表
Uα Uα/2
➢ 查表得:u0.05(单)=1.645 ∵u=1.82>u0.05(单)=1.645 ∴p<0.05,落在拒绝域内,故拒绝H0,接受HA ,
导入“Test Variable”框中,在“Test Value” 中输入300,<OK> ,在output界面输出统计 结果:
30
SPSS操作
31
SPSS结果输出
s s
x
n
穗重
穗重
t 2.495
One-Sample Statistics
N 9
Std. Error
Mean Std. Deviation Mean
23
解题思路: “t检验”或“大样本u检验”
解:依题意有: n=400 x=30.2 s=2.5
➢ H0:μ=30 (代表μ≤30 区间,不符合生产要求) HA:μ>30 (代表符合生产要求的长度区间)
➢ a=0.05
∵ n=400>30为大样本,故可用u检验代替t检验
➢ 统计量: u x 0 30.2 30 0.2 1.6
12
5、单侧检验和双侧检验的效率
在样本含量和显著水平相同的情况下,单侧检验的 效率高于双侧检验。这是因为在做单侧检验利用了 已知有一侧是不可能这一条件,从而提高了它的辨 别力。所以,在可能的条件下尽量做单侧检验。
例 上例已经计算出u =1.82,上尾单侧检验的临界 值u0.05=1.645,u > uα,结论是拒绝零假设。在做 双侧检验时u仍然等于1.82,双侧检验的临界值为 u 0.05/2 =1.96, |u|<u0.025, 不能拒绝零假设。
16
二、单个样本显著性检验的程序
1. 假设:确定H0和HA 2. 显著性水平:α=?(0.01,0. 05,0.10) 3. 确定应该使用的检验方法:u检验、t检验、
χ2检验、F检验 4. 建立在α水平上H0的拒绝域:单侧检验、双
侧检验 5. 对推断的解释:看统计量的值落在接受域还
是拒绝域里
17
三、在σ已知的情况下,单个平均数的显 著性检验—— u 检验
实验要求动物体重μ=10.00g。已知总体标准 差σ=0.40g,总体平均数μ未知,为了得出对 总体平均数μ的推断,以便决定是否接受这批 动物,随机抽取含量为n的样本,通过样本平 均数,推断μ。
4
1、假设
H0: μ=μ0 或 H0: μ-μ0=0 HA: μ>μ0 μ<μ0 μ≠μ0 三种情况中的一
4、检验统计量:
统计量 2服从n – 1自由度的 2分布。
2
n 1 s2
2 0
35
检验程序
5、相应于2中各备择假设之H0的拒绝域: ① χ2 > χ2 α ② χ2 < χ2 1-α ③ χ2 < χ2 1-α/2 和 χ2 > χ2 α/2
6、得出结论并给予解释。
36
例:一个混杂的小麦品种,株高标准差σ0= 14cm,经提纯后随机抽出10株,它们的株
7
小概率事件
如果得到的值很小,则抽自平均数为μ0的总体的事 件是一个小概率事件,它在一次试验中几乎是不会 发生的,但实际上它发生了,说明假设的条件不正 确,从而拒绝零假设,接受备择假设。
显著性检验:根据小概率原理建立起来的检验方法
显著性水平:拒绝零假设时的概率值,记为α。通常 采用α=0.05和α=0.01两个水平,当P < 0.05时称为 差异显著,P < 0.01时称为差异极显著。
11
4、单侧检验和双侧检验
上尾单侧检验:上例中的HA:μ>μ0,相应的拒 绝域为U > uα。对应于HA:μ>μ0时的检验称为 上尾单侧检验。
下尾单侧检验:对应于HA:μ<μ0时的检验称为 下尾单侧检验。其拒绝域为U <-uα。
双侧检验:对应于HA:μ≠μ0时的检验称为双侧 检验。双侧检验的拒绝域为|U| >uα/2 。19
检验程序
5、相应于2中各备择假设之H0的拒绝域 ① u > uα ② u <-uα ③ |u| > uα/2
6、得出结论并给予解释
20
例:已知豌豆籽粒重量服从正态分布N(377.2,
3.32)在改善栽培条件后,随机抽取9粒,其籽
粒平均重为379.2,若标准差仍为3.3,问改善
栽培条件是否显著提高了豌豆籽粒重量?
2、零假设: 备择假设:
H0: μ=μ0 HA: ① μ > μ0
② μ < μ0 ③ μ ≠ μ0
25
检验程序
3、显著性水平: 在α=0.05水平上拒绝H0称为 差异显著;在α=0.01水平上拒绝H0称为差异 极显著。
4、检验统计量: 当σ未知时以s 代替之,标准 化的变量称为t,服从n-1自由度的t分布。t 分布的分位数可从附表4中查出。
种。 本例的μ0=10.00g,因此
H0: μ=10.00 HA: μ>10.00 或 μ<10.00或 μ≠10.00
5
2、小概率原理
小概率的事件,在一次试验中几乎是不会发生 的,若根据一定的假设条件计算出来该事件发 生的概率很小,而在一次试验中,它竟然发生 了,则可以认为假设的条件不正确,从而拒绝 假设。
308.00
9.618
3.206
One-Sample Test
相关文档
最新文档