卫生统计学_第七章_假设检验基础

合集下载

卫生统计学-假设检验

卫生统计学-假设检验

H 0 : 0
0
显然包括
H1 : 0
0.05
0 0
故称双侧检验(two-sided test)
若检验假设如下:
H 0: 0 H1: 0

H 0: 0 H1: 0
称单侧检验(one-sided test)
123.5与125不同的原因何在?
来自于总体均数为125g/L 的总体,差别由抽样误 差导致。
25名1岁婴儿 血红蛋白浓度 X
0 125
0 125
来自另一总体,这个 总体的血红蛋白均数 未知,差别不仅是抽 样误差,主要是本质 的不同。
先假设 0 125,原当前的 X 与0 的差异ห้องสมุดไป่ตู้是抽样误差——提出原假设 接下来验证假设,如何验证? 根据 X 0 的大小,如果 X 0 较小可以认为 当前的差异是抽样误差,反之如果 X 0 较大 就怀疑当前的差异不仅仅是抽样误差(反证法)
问题
(1)该结论是否正确? (2)应该如何解决诸如此类的问题?
采用假设检验的方法予以解决
1.假设检验(hypothesis testing)的
基本思想
应用反证法和小概率原理,先对总体的参
数或分布作出某种假设,再用适当的方法根
据样本对总体提供的信息,推断此假设应当
拒绝或不拒绝。这个过程即为假设检验。
Chapter 7
假设检验
Hypothesis test
主要内容
假设检验的基本原理和步骤 Ⅰ型错误与Ⅱ型错误
单侧检验与双侧检验
假设检验应注意的事项 假设检验与区间估计的联系 (自学)
§1 假设检验的基本思想 和步骤

卫生统计学-第七章 假设检验基础

卫生统计学-第七章 假设检验基础

一:单样本t检验(one sample t-test) 即样本均数代表的未知总体均数与已知总体 均数差异的比较
样本均数与总体均数比较,其分析目的是推断
样本所代表的未知总体均数与已知总体均数 0有无差别。
例1据大量调查知,健康成年男子脉搏的均数 为72次/分,某医生在山区随机调查了25名健 康成年男子,其脉搏均数为74.2次/分,标准 差为6.5次/分,能否认为该山区成年男子的脉 搏高于一般人群?
1- :检验效能(power):当两总体确有差别,
按检验水准 所能发现这种差别的能力。
减少I型错误的主要方法:假设检验时设定 值。
减少II型错误的主要方法:提高检验效能。
提高检验效能的最有效方法:增加样本量。 如何选择合适的样本量:实验设计。
与 间的关系
减少(增加)I型错误,将会 增加(减少)II型错误
理解二: 单次试验(抽样)观测到的事件不应该 是小概率事件。
假设检验的思路
根据背景建立假设 根据样本得到某些特征 推断该样本特征在假设下的概率 根据‘否定小概率事件’思想做出推断
假设检验的思路分析 数学上的反证法原理进行分析
先假设要比较的事物是相同的 再在这种假设成立的情况下,进行逻辑推理 如果推理出发生的事是一个小概率事件,一般
第七章 假设检验基础
吴立娟 流行病与卫生统计学系
假设检验的概念和原理
同一总体
样本1 样本2
差异 抽样误差引起 P>0.05
无统计学意义
总体甲
样本1
(本质不同)
总体乙
样本2
差异 本质不同引起 P<0.05
有统计学意义 不能用抽样误差来解释
假设检验的原理/思想

07《卫生统计学》第七章_假设检验基础(6版) (1)

07《卫生统计学》第七章_假设检验基础(6版) (1)
2 2 d
sd t
n 1
n

2 7950 8832500
10 1
10
528.336IU / g
d d d 795.0 4.785 sd s d n 528.336 10
确定概率P:按ν =9查t 界值表,得P<0.01 判断结果:在α=0.05的水准上,拒绝H0,接受H1,可以认为 维生素E缺乏组大鼠肝脏维生素A含量低于正常饲料组。
二、 假设检验的基本步骤
• 确定检验水准: 检验水准(size of a test),亦称为 显著性水准(significance level),符号 为α,即拒绝或不拒绝H0所要冒出错的风 险大小。一般取α=0.05或α= 0.01。
二、 假设检验的基本步骤
• 确定单侧检验(one sided test)还是双侧检验(two sided test): 如果根据现有的专业知识无法预先判断该病 病人的脉搏是高于还是低于一般健康成年男,两 种可能性都存在,研究者对这两种可能性同等关 心,那么,就是要推断两总体均数有无差别,应 当采用双侧检验;如果根据专业知识,已知病人 的脉搏不会低于一般人,或是研究者只关心病人 的脉搏是否高于一般,而不关心是否低于一般, 则应当采用单侧检验(one sided test)。
二、 假设检验的基本步骤
本例的资料符合t 检验的应用条件,已知 μ=72次/min , x =75.572次/min ,s=5.0次/min , n=25,代入公式计算t 值,结果:
x x 75.5 72.0 t 3.50 sx s n 5.0 25
3. 确定P值
第二节 t 检验
1. 一组样本资料的 t 检验

卫生统计学:第7-8章 假设检验与t检验

卫生统计学:第7-8章 假设检验与t检验
8
反证法
当一件事情的发生只有A、B两种可能的时候,为了肯 定其中的一种情况A,但又不能直接证实A,这时否定 了另一种情况B,则间接肯定了A。 证明A还是证明B? 抗氧化剂 • 在H0成立的条件下,均数之间的差异是由抽样误差
引起的,有规律可循; • 在H1成立的条件下,均数间的不同包含种种未知情
形,无规律可循。 • 故从H0成立的角度出发,寻求其成立的概率。
分布。
数理统计的中心极限定理表明:从正态总体N ( , ) 中抽取例数均为n 的样 本,样本均 数也服从正态分布N( , X )。
Gosset 将此时的 u 转换:
X
定义为t 转换: t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布,以0为中心,左右对称 • t分布是一簇曲线,其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设,确定检验水准
假 设 检 验 步 骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度,某医 生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125 g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一 般正常小儿的平均血红蛋白浓度。
│t│值越大,则 P 值越小;反之,│t│值 越小,P 值越大。根据上述的意义,在同 一自由度下,│t│≥ tα ,则P≤ α ; 反之, │t│<tα,则P>α。
t 检验的应用条件:
单样本t 检验中,σ未知且样本含量较小 (n<50)时,要求样本来自正态分布总体;

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。

医学统计学第七、八章 假设检验的基本概念和t检验

医学统计学第七、八章  假设检验的基本概念和t检验

S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX

假设检验的基本概念

假设检验的基本概念

客观实际
可能发生的两类错误
假设检验的结果
拒绝 H0
“接受”H0
H0 成立
H0 不成立 即 H1 成立
I 型错误( ) 推 断 正 确 (1 )
推断正确(1 ) II 型错误( )
第四军医大学卫生统计学教研室 2020年3月20日
H1: <0
成立
1
1
界值 0
图8-2 I型错误与II型错误示意图(以单侧u检验为例)
降低。
第四军医大学卫生统计学教研室 2020年3月20日
二、两个率比较的u检验 推断两个总体率是否相同
u
p1 p2
·pc )(
1 n1
1 n2
)
P124例8-5
第四军医大学卫生统计学教研室 2020年3月20日
例8–5 某医院用黄芪注射液和胎盘球蛋白进行穴 位注射治疗小儿支气管哮喘病人,黄芪注射液 治疗117例,有效103例;胎盘球蛋白治疗55例, 有效49例。试比较两种疗法有效率有无差别
第四军医大学卫生统计学教研室 2020年3月20日
③ H1的内容直接反映了检验单双侧。若H1
中只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
④ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。
二 、 两 样 本 比 较 的 u 检 验 (two-
sample u-test) 适用于两样本含量较大(如 n1>30且n2>30)时。检验统计量为
u X1 X2 X1 X2
S X1X 2

卫生统计学基础流行病学数据的假设检验与置信区间计算

卫生统计学基础流行病学数据的假设检验与置信区间计算

卫生统计学基础流行病学数据的假设检验与置信区间计算在卫生统计学中,流行病学数据的假设检验与置信区间计算是常见的分析方法。

通过这些方法,我们可以对流行病学数据进行有效的推断和判断。

本文将介绍基本的假设检验和置信区间计算的原理和应用。

一、假设检验假设检验是指通过收集样本数据,对总体的某个参数提出假设,并利用样本统计量对该假设进行验证的统计方法。

常见的假设检验有单样本均值检验、两样本均值检验和相关性检验等。

1. 单样本均值检验假设我们有一组样本数据,想要判断该样本的均值是否等于某个给定的值。

首先我们提出原假设(H0)和备择假设(H1),然后计算样本均值和标准误差,接着利用标准正态分布或t分布进行判断。

2. 两样本均值检验在两个独立的样本群体中,我们想要判断两个群体均值是否存在显著差异。

同样,我们提出原假设(H0)和备择假设(H1),计算两个样本的均值和标准误差,并利用t分布进行判断。

3. 相关性检验当我们需要了解两个变量之间是否存在相关性时,可以进行相关性检验。

常见的方法有Pearson相关系数和Spearman等级相关系数。

通过计算相关系数的置信区间,我们可以判断两个变量之间的相关程度。

二、置信区间计算置信区间是指对总体参数的一个区间估计,通常用一个上限值和一个下限值表示。

置信区间计算可以帮助我们确定总体参数的范围。

在流行病学数据分析中,我们常用置信区间来估计疾病的患病率、死亡率等指标。

置信区间的计算方法与假设检验类似,根据所需的置信水平和样本数据,计算样本均值和标准误差,再利用正态分布或t分布确定置信区间。

除了单个参数的置信区间计算外,对于两个参数之间的差异,也可以计算置信区间。

例如,在两组样本数据中,我们希望确定两个样本均值之间的差异是否显著。

通过计算差异的置信区间,可以得出结论。

三、数据分析示例为了更好地理解假设检验和置信区间计算的应用,我们以某疾病的发病率为例进行说明。

假设我们有两组样本数据,分别为疫苗接种组和非接种组的患病人数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0: =0 =3.30kg,即难产儿总体平均出生 体重与一般新生儿总体平均出生体重相等 H1: ≠0=3.30kg,即难产儿总体平均出生 体重与一般新生儿总体平均出生体重不等
=0.05
33
(2)计算检验统计量
本例 n=35, X =3.42kg,S=0.40kg, 0 =3.30kg。 按公式 X 0 3.42 3.30 t 1.77 S/ n 0.4 / 35
(1)选择检验方法,建立检验假设,确定检验水准
H 0: μ μ 0 ; H1 : μ μ 0 ,α 0.05
(2)计算统计量 (3)确定P值
P
P
做推断结论 不拒绝H0, 可能 犯Ⅱ类错误
28
拒绝H0,接受H1 可能犯Ⅰ类错误
第二节
t检验(t –test)
29
一、单样本资料的t检验
已知 0 14.1 s 5.08 的比较
n 36 X 14.3
是单一样本与一已知总体
22
第二步
选择适当的假设检验方法,
计算相应的统计量


X 0 14.3 14.1 t 0.236 / n 5.08 / 36
n 1 36 1 35
23
⑶同一受试对象处理前后,数据作对比。
37
将10只小白鼠按配对设计分成两组,
分组方法见下表:
配对号 1 2 3 4 5
小白鼠 排序号
1 1
2 2
3 2 乙
4 1 甲
5 1 甲
6 2 乙
7 1 甲
8 2 乙
9 10 1 2
随机数 18 24 22 07
29 57 33
49 65 92
分 组 甲பைடு நூலகம்乙
甲 乙
前进
18
单、双侧检验
若H1为 0,则此检验为双侧检验 若H1只是 0或 0 , 则此检验为单侧检验
首先根据专业知识
单双侧检验的确定
其次根据研究者的目的
注意:一般认为双侧检验较保守和稳妥!
返回
19


H 0 : 0 14.1 (该县儿童前囟门闭合月龄
的平均水平与一般儿童的平均水平相同)
只能下"根据目前试验结果 ,尚不能认 为有差别 的结论. "
26
本 例
t=0.236 P>0.05
1.69
拒绝域
a=0.05
0
接受域
1.69
拒绝域
t
P 0.05, 不拒绝H 0 , 差别无统计学意义(统计结论) , 故还不能认为该县儿童前囟门闭合的平均月龄 与一般儿童不同(专业结论)。
27
表6-1
序号 2
用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
用药前 921.69 用药后 1293.36 差值d 371.67
1 1206.44 1678.44 472.00 例6-2 某儿科采用静脉注射人血丙种球蛋白治疗小儿
急性毛细支气管炎。用药前后患儿血清中免疫球蛋白 3 1294.08 1711.66 417.58
IgG(mg/dl)含量如表所示。试问用药前后IgG有无变 4 945.36 1416.70 471.34
5 化?
6 7 8 9 10 11 12
721.36
692.32 980.01 691.01 910.39 568.56 1105.52 757.43
1204.55
1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
13
例:某商家宣称他的一大批鸡蛋 “坏蛋” 率为1%,顾客与商家约定,从中抽取5个 做检查,来判断这一批蛋的质量。结果4 个好蛋,1个坏蛋。请问这批鸡蛋的“坏
蛋” 率为1%还是高于1%?
14
假设该批鸡蛋的坏蛋率为1%,(反证法)
以此为前提,计算5个鸡蛋中样品中出现1 个 或更多变质蛋的概率p(x≥1)=0.049,(小概率 事件)。
P488
38
成对样本均数比较的数据格式
对子号 1 2 3 4 5 . . 合计 对照组 . . . . . . . . 实验组 . . . . . . . . 差值d . . . . . . . .
39
配对设计检验统计量:
d d d 0 d t= , Sd Sd n Sd n
n 1
12



0的对立面 0 出发,间接判断是

0 .
假设 0,看 X 可能性P 有多大,用公式
0由于抽样误差造成的
X 0 t SX
计算t值
由t值求得P 值来判断。若P 值很小,则拒绝上述假 设( ),而接受其相互对立的假设( 0)。 0 反之亦然。
第三步
确定P值,做出推断
P值:是用计算出来的统计量查相应的界值表获 得。其意义是:P的含义是指从H0规定的总体随机
抽样,抽得等于及大于(或/和等于及小于)现有样 本获得的检验统计量(如t、u等)值的概率。
做出推断: (包括统计结论和专业结论)
P a, 拒绝H 0 , 接受H1 , 下"有差别 的结论。 "
但发生机会理应很小的事件竟然在一次抽样中 出现了,人们不竟怀疑前提条件的真实性,从 而认为该批鸡蛋的坏蛋率不应为1%,应高于1%. (小概率事件原理)
15
三、假设检验的基本步骤
建立假设,确定检验水准
选择适当的假设检验方法,计算相
应的统计量
确定P 值 做推断结论
16
例7-1 已知北方农村儿童前囟门闭合月龄为 14.1月。某研究人员从东北某县抽取36名儿 童,得囟门闭合月龄均值为14.3月,标准差 为5.08月。问该县儿童前囟门闭合月龄的均 数是否大于一般儿童?
式中, d 为每对数据的差值, d 为差值的样本均数,
S d 为差值的标准差,S d 为差值样本均数的标准误, 为对 n
子数。
40
例7-2
某儿科采用静脉注射人血丙种球蛋白
治疗小儿急性毛细支气管炎。用药前后患儿血 清中免疫球蛋白IgG(mg/dl)含量如表6-1所
示。试问用药前后IgG有无变化?
41
1、设计:单样本与一已知总体均数的
比较
单样本均数:平时抽样或观察所得,其
总体均数 是未知的。
已知总体均数 0 :指已知的理论值、标
准值、或经大量观察所得到的稳定值。
30
2、目的:
推断样本均数 X 代表未知总体均数 ( )
和已知总体均数 0 (理论值、标准值、稳定
值)有无差别?
即推断是否 0 ?
P a , 不拒绝H 0 , 但不能下 无差别 的结论。 " " 只能下"根据目前试验结果 ,尚不能认 为有差别 的结论. "
24
立的条件下,得到现有检验结果的概率小于 ,因为 小概率事件不可能在一次试验中发生,所以怀疑 H 0 的真实性,从而做出拒绝 H 0 的决策。
若 P ,按所取检验水准 ,拒绝 H 0 ,接受 H1 ,差别有统计学意义。其统计学依据是,在 H 0 成
例 通过以往大量调查,已知某地一般新生
儿的头围均数为34.5cm,标准差为1.99cm。
为研究某矿区新生儿的发育情况,现从该地 某矿区随机抽取新生儿55人,测得其头围均 数为33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
9
0=34.50cm 0=1.99cm
=?
35
二、配对设计资料的t检验
配对设计:将受试对象按一定条件配成 对子,再将每对中的两个受试对象随机分 配到不同处理组。 为控制可能存在的主要非处理(非实 验)因素而采用的一种试验设计方法。
36
形式:
⑴异体配对:将受试对象配成特征相近的对子,同 对的两个受试对象随机分别接受不同处理; ⑵自身配对:同一受试对象的两个部位分别接受两 种处理;或同一样品分成两份,随机分别接受不同 处理(或测量)
同一总体 0 ,但有抽样误差
非同一总体 0
怎么判断? 利用反证法小概率事件原理
11
假设检验的基本原理:
反证法小概率事件原理:即首先假 设两总体无差别(反证法),然后根据 样本资料计算获得这样一份样本的概率 P值,当P值是一个小概率时,就拒绝 原假设(小概率事件在一次实验中不(大) 可能发生的推断原理),而认为 两 总体有差别。否则,就不能下有差别的 结论。
17
第一步
建立假设,确定检验水准
H0:原假设(无效假设、零假设)是对总体参数或 总体分布作出的假设,通常假设总体参数相等或 观察数据服从某一分布(如正态分布等). H1:对立假设(备择假设),与H0相对立又相联系
下一页
:检验水准,上述两种假设中,要作出抉择,
即是拒绝H0,还是不拒绝H0,需根据概率的大 小作出判断. 就是对H0假设作出抉择的一 个判定标准,通常 =0.05
H1 : 0 14.1 (该县儿童前囟门闭合月龄
的平均水平高于一般儿童的平均水平)
a 0.05
(单侧)
20
第二步
选择适当的假设检验方法,
计算相应的统计量
应根据资料类型,设计,分析目的 和各种假设检验方法的应用条 件加以选择。
21
第二步
选择适当的假设检验方法,
计算相应的统计量


n=55
已知总体 一般新生儿头围
X 33.89 未知总体 某矿区新生儿头围
10
该地某矿区的地理环境及生活条件并不影响 矿区的地理环境及生活条件确实对新生儿的 分 析 新生儿的头围大小,即本次调查的新生儿头 头围有影响,即本次调查的新生儿头围的总体 围的总体均数与一般新生儿头围的总体均数 目的:判断是否 0 ? 均数与一般新生儿头围的总体均数不同,亦 相同,亦即 X 0 仅由抽样误差造成, 即 X 不仅由抽样误差造成,而且是来自 现 这种差异无统计学意义。 X 0 0 原因有二: 不同的总体,这种差异有统计学意义。
相关文档
最新文档