《医学统计学》假设检验整理

合集下载

医学统计学假设检验

医学统计学假设检验

T检验
双边检验
构造T统计量 T
X 0 S n
~ t (n 1)
X 0 由 P t 2 (n 1) S n 确定拒绝域 T t 2 (n 1) x 0 如果统计量的观测值 T t 2 (n 1) S n
如果统计量的观测值

2 0
~ (n)
2

2 (n) 或
2 2 2
2 1 2
(n)
则拒绝原假设;否则接受原假设
一个正态总体均值未知的方差检验
问题:设总体 假设
2
2检验
X~N(,2),未知
2 0 2 2 0
H0 : ; H1 : ; 双边检验 (n 1) S 2 2统计量 2 构造 ~ 2 (n 1) 由 2 0 2 2 2 2 P (n 1) , P (n 1)

~ N (0,1)
则拒绝原假设;否则接受原假设
例1 由经验知某零件的重量X~N(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05)


统计假设——通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种 假设。 假设检验——根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。
基本原则——小概率事件在一次试验中是不可能发生的。
基本概念
引例:已知某班《应用数学》的期末考试成绩服从 正态分布。根据平时的学习情况及试卷的难易程度,估 计平均成绩为75分,考试后随机抽样5位同学的试卷, 得平均成绩为72分,试问所估计的75分是否正确? “全班平均成绩是75分”,这就是一个假设 根据样本均值为72分,和已有的定理结论,对EX=75 是否正确作出判断,这就是检验,对总体均值的检验。

医药卫生医学统计学假设检验

医药卫生医学统计学假设检验
均数不同,H1:μ≠μ0
=0.05
▲ 计算统计量:Z 统计量: Z= ▲ 确定概率值:
x 0 Sx
|Z|=9.58 Z = 1.96 |Z|> Z p < =0.05;
▲ 做出推论:
Z= 9.58> 1.96, p < 0.05 = , 小概率事件发生 了,原H0假设不成立;拒绝H0 , 接受H1, 可认为: 某校女大学生身高均数与一般女子身高均数不同; 某校女大学生身高均数与一般女子身高均数差别有 显著性。
α是在统计推断时,预先设定的一个小概率值,是当 H0为真时,允许错误地拒绝H0的概率,是检验水准。
P值是由实际样本决定的,是指从由H0所规定的总 体中随机抽样,获得大于及等于(或小于)现有样本检 验统计量值的概率。
5、两类错误(I型错误 与Ⅱ型错误 )
统计推断可能出现的4种结果
拒绝H0,接受H1
H0为真
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
设计类型 资料的类型和分布 统计推断的目的 n的大小 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
I型错误 (α)
(假阳性错误)
不拒绝H0
推断正确 (1-α)
(可信度)
H0为假 推断正确 (1-β) Ⅱ型错误 (β)
(检验效能、把握度) (假阴性错误)
无效假设(H型错误与Ⅱ型错误):
Ⅰ型错误:H0原本是正确的
假阳性错误 误诊
拒绝H0 弃真
用α 表示

医学统计学-假设检验

医学统计学-假设检验
差别有统计学意义,可以认为病毒性肝炎患者的转 铁蛋白含量较低。
3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立

F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。

医学统计学 第五讲 计量资料的统计推断-假设检验

医学统计学 第五讲 计量资料的统计推断-假设检验

可计算出样本标准误:3.8/10=0.38
(3) n = 100;
假设检验:
▲ 建立假设: 检验假设:某校女大学生身高均数与一般女子身高 均数相同; H0:μ=μ 0; 备择假设 :某校女大学生身高均数与一般女子身高 均数不同; H1:μ≠μ0
▲ 确定显著性水平( ):0.05
24
▲ 计算统计量:u 统计量: u = ▲ 确定概率值:
25
二、小样本 已知中学一般男生的心率平均为74次/分钟。 为了研究常参加体育锻炼的中学生心脏功能
是否与一般的中学生相同,在某地区中学生
中随机抽取常年参加体育锻炼的男生16名,
测量他们的心率,得平均心率为65.63次/分钟,
标准差为7.2次/分钟。
▲目的:比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。
20
一、样本均数与总体均数的比较
实质是一个未知总体与一个已知总体均数的比较
(一)、大样本
一般女性平均身高160.1 cm。某大学 随机抽取100名女大学生,测量其身高,身 高的均数是163.74cm,标准差是3.80cm。 请问某大学18岁女大学生身高是否与一般 女性不同。
21
▲目的:比较样本均数所代表的未知总体均数 与已知的总体均数有无差别
(3)计算统计量
根据资料类型与分析目的选择适当的
方法,使用适宜的公式计算出统计量,比
如计量资料分析常用 u 、t 或F检验。
注意:在检验假设成立的情况下,才 会出现的分布类型或公式。
(4)确定概率值(P)
将计算得到的u值或 t值与查表得到u或t,ν , 比较 ,得到 P值的大小。 根据u分布和t分布我们知道,
n4
. . . . . .

医学统计学:第七章 分类资料的假设检验

医学统计学:第七章 分类资料的假设检验
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布 14
1.建立假设,确定检验水准
H0 : 0 0.2 H1 : 0
单侧 0.05
2.计算累统计量 u 值
0 0.20, n 304, p 0.3158
u p 0 0.3158 0.2 5.05
0 (1 0 )
H0(λ =3)成立时, 每毫升水中大肠杆菌数的概率分布 26
1.建立假设,确定检验水准 H0: 0 3 H1: 0 单侧 α=0.05 2. 计算累计概率 P 值,做出推断结论 需求 1ml 水样中至少有 5 个大肠杆菌的概率
P( X 5) 1 P(0) P(1) P(2) P(3) P(4) 0.1847
P( X 2) 1 e0.15 0.150 e0.15 0.151 1 P(0) P(1) 0.0102
0!
1!
P<0.05,按 α=0.05 检验水准拒绝 H0,接受 H1,可以认为该批疫苗的严重反应率高于一般。
25
例8 卫生标准规定, 生活饮用水大肠杆菌数不 得超过3个/ml。现对某饮用水进行抽检,抽取 1ml水样培养得到5个大肠杆菌。问该水样中 的大肠杆菌是否超标?
接受 H1,故可认为双亲中只有一方患高血压与双亲均患
高血压的子代中高血压患病率不同。
18
例6 某研究者在某地区随机抽取10岁儿 童100人,20岁青年120人,检查发现10岁 儿童中有70人患龋齿,20岁青年中有60人 患龋齿,问该地区10岁儿童与20岁青年患 龋齿率是否相等?
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
u
X1 X2

医学统计学第3版 第7章 假设检验

医学统计学第3版 第7章 假设检验
检验形式 双侧检验 单侧检验 目的 是否0 是否>0 是否<0 H0 H1
=0 =0 =0
0 >0 <0
建立检验假设,确定检验水准
检验水准(significance level),以表示
习惯上取 =0.05或0.01 是小概率事件在本次假设检验中发生的界值标 准 应在设计时根据专业知识和研究目的,在进行 假设检验前设定
选定适当的检验方法,计算相应统计量。 依据:
分析目的 设计方法 变量类型 已知条件
选定检验方法,计算检验统计量
本例:
分析目的:高原地区成年男子平均Hb量高于一 般人群,即 >0 设计方法:调查设计 变量类型:定量资料 已知条件: 0=140g/L;n=25,x=155g/L, s=24g/L;未知
P=P(t≥t*)
确定P值,作出统计推断
X- 155-140 =4.8412 = t = s x 24/ 60
=59
P =P(t 4.8412)<0.0005


1.6714.841
确定P值,作出统计推断
若P,表示在H0成立的条件下,出现等 于及大于现有统计量的概率是小概率,按 小概率事件原理现有样本信息不支持H0, 因而拒绝H0。
不拒绝H0 II 型错误
未知
1. ,
2. , 3. , 4. n ,
的影响因素
假设检验需要注意的问题
数据应来自设计科学的实验或调查
样本的代表性 可比性/均衡性:比较的基础
数据应该满足假设检验方法的前提条件 正确理解假设检验中概率值的含义
差异有统计学意义与差异大小的区别
假设检验的分类
根据假设的对象
参数检验—对总体参数提出假设 非参数检验—对总体分布提出假设

医学统计学 假设检验

医学统计学 假设检验

2023/12/7
计量资料的统计推断
30
t检验注意事项
4. 假设检验的结论不能绝对化
不能拒绝H0,有可能是样本数量不够 拒绝H0 ,有可能犯第Ⅰ类错误
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60
(X1 X1)2 (X2 X2)2 n1 n2-2
例 3-9 白血病组 ( X1) :12.3 13.2 13.7 15.2 15.4 15.8 16.9 正常组 ( X 2 ) : 10.8 11.6 12.3 12.7 13.5 13.5 14.8
问正常鼠和白血病鼠脾脏中 DNA 平均含量(mg/g)是否不同?
5.41
0.04
2.06
1.24
0.82
1.64
1.83
-0.19
1.06
1.45
-0.39
0.77
0.92
-0.15
--
--
1.34
d2
0.1521 0.0196 0.7569 0.0400 0.0196 0.2401 0.5184 0.0016 0.6724 0.0361 0.1521 0.0225 2.6314
3. 自身对比。即同一受试对象处理前后的结果进行比 较。
2023/12/7
计量资料的统计推断
19
二、配对样本t 检验
目的:判断不同的处理是否有差别

假设检验-医学统计学

假设检验-医学统计学
▪ 有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设。
12
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
13
样本:随机抽查25名男炊事员的血清总胆固醇,求得其均数为 5.1mmol/L,标准差为0.88mmol/L。
▪ 医学统计学
1
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
2
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
总体参数
未知
样本统计量
统计 推断
已知
风险
总体Α是100例正常成年男子的血红蛋白(单位:g/L),从中随机抽
取从样中本随机a1抽和取样样本本ab2
;总体B是另外100例正常成年男子的血红蛋白, ;三个样本的含量均为10例,有关数值如下:
µ
σ
a1/b1
a2
A
130
7.5
131.9
128.3
B
140
8.2
138.2
6
▪ 在知道A和B总体的参数时
a1-a2 a1-b1
抽样误差 本质差别
7
▪ 假如事先不知道A和B是不是同一个总体
a1-b1
抽样误差

本质差别
A=B A≠B
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自由度也需要校正
F 检验(两总体) Levene 检验 Bartlett 检验
������ =
2(大) ������1
1.B-要求正态分布 L-不依赖总体分布 2.随机分布在残差 0 上下, 无任何特殊结构, 不存在异常点 1.T 在界值范围内,则 P>概率 2.左侧找较小样本量,上方找两组例数差值 3.当������1 < 10; ������2 − ������1 ≤ 10:查表
������ = ������������
������������组间
组内
1.方差不齐:数据变换;非参数检验 2.纵标目:分子自由度,横标目:分母自由 度 3.偏态资料:对数变换、平方根变换、角度 变换 敏感,激进 ������0 成立也可以进行比较 可以对感兴趣的两组进行比较 应用广;保守;调整检验水准 探索性;一般性分析 多组均数与指定组均数比较 ������������ (存在多组相同秩次) ������������ = ������ 1 − ∑ (������������3 − ������������ )/(������ 3 − ������)
������������������ (非参数) 析因设计 ANOVA ������������ = ������������ A ������������ =
������������
SE
析因设计 (多因素 设计) 重复测量 设计
分析多个因素之 间相互作用
比较主效应和 交互效应的总 体差异
正态分布 方差齐性(残差图) 独立性 每组每个时点资料 分别服从各自对应 正态分布方差齐
1 1 √������������误 (������ +������ ) ������ ������
������ = ������组内 = ������ − ������ Bonfferoni 法 SNK Dunnett-t 比较多个总体 分布 非正态分布 方差不齐 偏峰分布 比较两两分布 随机区组 设计 对重要的非实验 因素控制 比较处理因素 和区组因素 K-W 检验有意义 方差齐性,正态性 同区组内不独立 Bonfferoni 法 多因素 ANOVA ������������������ (近似正态法) ������ =
配对设计
二分类 (2*2) (不 相互独立)
比较概率分布
������ + c ≥ 40
McNemar 检验
������ 2 =
(������−������)2 b+c
, ν=1
误用一般四格表������ 2 会增大 II 类错误
������ + c < 40 独立多组 二分类 (R*2) (分 组变量多于 2 组) 概率分布两两 比较 无 序 多 分 类 (R*C) 比较概率分布 ������������������ < 5 个 数 不 超 过 总格子 1/5;不能有 1 个������������������ < 1 有 序 多 分 类 (R*C) 比较总体分布 有序分类变量 相持不多 ������ 2 检验有意义 比较概率分布
������ = ������ ������
̅̅̅̅ ̅̅̅̅ ������ −������ ������
̅̅̅̅̅ ̅̅̅̅̅ ������ ������ −������ ������
(参数)
计算调整检验水准,最为保守,犯 I 型错误 的概率最低;比较次数超过 10 次以上,不 建议采用 ������A = a − 1 ������B = ������ − 1 ������AB = (������ − 1)(������ − 1) ������误差 = ������������(������ − 1) 主效应 = 相加⁄2 交互效应 = 相减⁄2 1. 不同时间点处理组之间的总体均数差异 不全相同 2.两两比较:用 Bonforroni 成组 t 检验,比 较校正α
正态近似法
Z
������������ =
������ √������
(c < 1)(出现较多相持情况时)
配对 t 检验
������ = ������
̅ ������ ⁄ ������ √������
可替代随机区组设计的方差分析,|������| = ������
������ = ������ − 1
Pearson������ 2 检验
������ 2 = ∑������ ������=1 ������ = 1
(������������ −������������ )2 ������������
������ 2 只看单侧卡方值
������ ≥ 40 1 ≤ ������������������ < 5
随机样本
������ = ������������
������������处理
误差
������
������处理 = k − 1 ������区组 = ������ − 1 ������误差 = (������ − 1)(������ − 1) 方差不齐 Friedman 秩和检验 (M 检验) ̅ ������ = ∑ ������������ − ������ ������ = ������ − 1(������ 2 分布) 当超出界值表时, 可近似������ 2 检验; 对于相同
������ = ������1 + ������2 − 2
1
Sorted by SYSUCC Seele NERV
设计 正态分布 方差不齐 比较方差齐性
2 2 ������1 = ������2
校正 t 检验
������ ‘ =
̅̅̅̅ ̅̅̅̅ ������1 −������ 2
������2 ������2 √ 1+ 2 ������1 ������2
样本分别 相加后 作为
������ =
������1 −������2 √������1 −������2
1. ������ = ������ 2 2.Poisson 分布可加性原理 3.当λ = 20时,接近正态分布
2
数、放射性核素等) 正态分布检验 每组资料<20
Sorted by SYSUCC Seele NERV
������−������0 ������������ ������(1−π) ������
假设检验 Z 检验
计算统计量 ������ =
̅ −������0 ������ ������ ⁄ √������
其他
������������ ̅ = ������⁄√������ t 检验 ������ =
连 续 性 校 正 ������ 2 检 验 (Yates’correction)
校正������ 2
4
Sorted by SYSUCC Seele NERV
������ < 40,或至少存在 一个������������������ < 1
Fisher 确切概率法
P
1. 将小于或等于样本观察值概率的所有可 能结局求和 2.不属于������ 2 范畴,但作为������ 2 的补充
̅ −������0 ������ ������⁄√������
1.自由度不同对应的 90、95、99%界值不同 2.非正态总体 n≥30 时,样本均数服从正态 分布 IC 直接查表
������������ ̅ = ������ ⁄√������ ������ = ������ − 1 P
������������ = √ W 检验(灵敏) 矩法检验(保守)
Wilcoxon 符号秩和检 验
T(绝对值较小)
非正态分布 ������ > 25 Poisson 分布 比较均数 λ1 = ������2 Poisson 分布(菌落
正态近似法
������ =
������1 −������2 ������������
������������ (出现较多相持情况时) 连续性校正 Z(25<n<50)
������������总 = ������������组间 + ������������组内 ������总 = ������ − 1 ������组间 = ������ − 1 ������组内 = ������ − ������ ������ =
̅̅̅̅ ̅̅̅̅ |������ 1 −������ 2|
Sorted by SYSUCC Seele NERV
假设检验:为了支持������������ 而进行,然而多希望得出拒绝������������ 的结论。 数据类型 定量资料 实验设计 完全随机 设计 样本情况 单 组 独立 样本 & 两样本 (n>30) 差 值 研究目的 比较均数 μ = ������0 数据情况 正态分布 方差齐性 总体标准差 (σ) 已知 正态分布 方差齐性 σ未知 比较频率 π = ������0 二项分布 观察结果相互独立 ������较大, ������π 和������(1 − π) > 5 累计概率 函数直 接计 算 P 值进行假设检验 Z 检验 ������ =
������������B ������������SE ������������AB ������������SE ������������1
SE1
������������������ = 重复测量 ANOVA (球形对称性,若不满 足则不能 进一步 分解 残差项)
分两样本连续取 值
比较时间效 应、 主效应、 交 互效应的总体 差异
正态性检验
������ < 50
1. ������ > 50样本均数近似服从正态分布,α取 0.1 或更大 2.n≥1000,可绘制 10-15 个组段直方图计 算各组段理论频数和实际频数实施拟合优 度
相关文档
最新文档