医学统计学：第八章 t检验

合集下载

统计学-t检验

• Three types of Paired Samples.
异体配对
配对样本的类型

配成对子的两个受试对象分别给予两种不同的处理（如把同窝、同性别和体重相近的动物配成一对；
把同性别、同病情和年龄相近的病人配成一对等）；
自身配对

同一受试对象同时分别接受两种不同处理（如同一动物的左右两侧神经、同一份标本分成两部分）；
d 0 d 17.17 t 1475 . sd sd / n 40.33 / 12
(3)
确定P 值,作出统计推断 =n-1=12-1=11 查 t 界值表，得 0.10<P<0.20 ，按 =0.05 水准不拒绝 H0 ，尚不能认为两种仪器检查的结果不同。
例3：将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组，甲组给正常饲料，乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量（IU/g），结果如下。问2组大白鼠肝脏维生素A含量是否有差别？
两独立样本方差的齐性检验

两独立小样本均数的 t 检验，除要求两组数据均应服从正态分布
外，还要求两组数据相应的两总体方差相等，即方差齐性。

即使两总体方差相等，两个样本方差也会有抽样误差，两个样本
方差不等是否能用抽样误差解释？可进行方差齐性检验。
例8 由Ｘ线片上测得两组病人的Ｒ1值（肺门横径右侧距, cm），算得结果如下，试检验肺癌病人与矽肺0期病人的Ｒ1值的均数间差异是否明显。肺癌病人： n1 10, 矽肺0期病人：
4.22 4.40
X2: 4.12
4.95 5.18
7.38 5.92
n1= 18, n2= 16,

医学统计学 -第08章方差分析

第一节方差分析的基本思想
看一个例子
例8-1 为研究钙离子对体重的影响作用，某研究者将36 只肥胖模型大白鼠随机分为三组，每组12只，分别给予高脂正常剂量钙(0.5%)、高脂高剂量钙(1.0%)和高脂高剂量钙(1.5%)三种不同的饲料，喂养9周，测其喂养前后体重的差值。问三组不同喂养方式下大白鼠体重改变是否不同？
• 三种喂养方式体重改变的平均值各不相同，这种变异称为组间变异
•
是组内均值
X
与总均值
i
X
之差的平方和
360
340
组间变异反映了：
320
三种喂养方式的差异（影响）， 300
同时也包含了随机误差。
280
260
240
k ni
220
SS组间
(Xi X )2
200
i1 j
180
X甲
X
X乙
X丙
甲
乙
丙
3、组内变异(SS组内，variation within groups)
0.05
2、根据公式计算SS、MS及F值，列于方差分析表内(计算过程省略)
变异来源总变异组间组内（误差）
完全随机设计的方差分析表
平方和 SS 自由度
均方MS
47758.32
35
31291.67
2
15645.83
16466.65
33
498.99
F值
31.36
3、确定P值，作出判断
分子自由度=k-1=2，分母自由度=n-k=33，查F 界值表（方差分析用）
表 8-1 三种不同喂养方式下大白鼠体重喂养前后差值(g)
正常钙(0.5%) 高剂量钙(1.0%) 高剂量钙(1.5%)

卫生统计学专题八：t检验

专题八 t 检验⒈t 检验基础t 检验是一种以t 分布为基础，以t 值为检验统计量资料的假设检验方法。

⑴t 检验的基本思想：假设在H 0成立的条件下做随机抽样，按照t 分布的规律得现有样本统计量t 值的概率为P ，将P 值与事先设定的检验水准进行比较，判断是否拒绝H 0。

⑵t 检验的应用条件：①样本含量较少（n ＜50）；②样本来自正态总体（两样本均数比较时还要求两样本的总体方差相等，即方差齐性）。

【注】实际应用时，与上述条件略有偏离，只要其分布为单峰近似对称分布，对结果影响不大。

⑶t 检验的主要应用：①单个样本均数与总体均数的比较；②配对设计资料的差值均数与总体均数0的比较；③成组设计的两样本均数差异的比较。

⑷单样本t 检验基本公式：t=x0s x μ-=nsx 0μ- υ=n-1⒉z 检验z 分布（标准正态分布）是t 分布的特例，当样本n ≥50或者总体σ已知时用z 检验。

⑴单样本z 检验基本公式：z=nsx 0μ- 或 z=nx 0σμ-⑵单样本z 检验的步骤与单样本t 检验的基本相似。

⒊配对设计均数的比较配对设计是为了控制某些非处理因素对实验结果的影响而采用的设计方式，应用配对设计可以减少实验误差和个体差异对结果的影响，提高统计处理的效率。

⑴配对设计的主要四种情况：①配对的两受试对象分别接受两种处理，如在动物实验中，常先将动物按照窝别、体重等配对成若干对，同一对的两受试对象随机分配到实验组和对照组，然后观察比较两组的实验结果。

②同一样品用两种不同方法测量同一指标或接受不同处理。

③自身对比，即将同一受试对象（实验或治疗）前后的结果进行比较。

④同一对象的两个部位给予不同处理。

⑵对配对资料的分析：一般用配对t 检验，其检验假设为：差值的总体均数为0即μd =0。

计算统计量的公式为：t=ns 0d d-，υ=n-1式中d 为差值的均数；s d 为差值的标准差；n 为对子数。

⑶关于自身对照（同体比较）的t 检验：①在医学研究中，我们常常对同一批患者治疗前后的某些生理、生化指标进行测量以观察疗效，对于这些资料可以按照配对t 检验。

卫生统计学：第7-8章假设检验与t检验

8
反证法
当一件事情的发生只有A、B两种可能的时候，为了肯定其中的一种情况A，但又不能直接证实A，这时否定了另一种情况B，则间接肯定了A。证明A还是证明B？抗氧化剂 • 在H0成立的条件下，均数之间的差异是由抽样误差
引起的，有规律可循； • 在H1成立的条件下，均数间的不同包含种种未知情
形，无规律可循。 • 故从H0成立的角度出发，寻求其成立的概率。
分布。
数理统计的中心极限定理表明：从正态总体N ( , ) 中抽取例数均为n 的样本，样本均数也服从正态分布N( , X )。
Gosset 将此时的 u 转换：
X
定义为t 转换： t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布，以0为中心，左右对称 • t分布是一簇曲线，其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设，确定检验水准
假设检验步骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0，接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度，某医生从该地随机抽取了1岁婴儿25名，测得其血红蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L，而一般正常小儿的平均血红蛋白浓度为125 g/L，故认为该地1岁婴儿的平均血红蛋白浓度低于一般正常小儿的平均血红蛋白浓度。
│t│值越大，则 P 值越小；反之，│t│值越小，P 值越大。根据上述的意义，在同一自由度下，│t│≥ tα ，则P≤ α ；反之， │t│＜tα，则P＞α。
t 检验的应用条件：
单样本t 检验中，σ未知且样本含量较小 (n<50)时，要求样本来自正态分布总体；

医学统计学t检验

操作步骤
检验正态性
单样本t检验
具体步骤
1 分析——非参数检验——旧对话框——单个样本检验 2 分析——比较均值——单个样本t检验
结
论
1 分析得出的概率值有无统计学意义
2 若有意义，比较样本均数与总体均数的大小
配对样本t检验（Paired t-test）
将比较组受试对象某些影响结果的因素（如年龄，性别等），按特征相似配成对子，测定某指标结果。
0.681
0.5/ 2,38
P 0.50
结论：按=0.05 水准，p＞0.50不拒绝H0
，差别无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果有不同。
本次内容结束
LOREM IPSUM DOLOR
Lorem ipsum dolor sit amet, consectetur adipisicing elit.
对象编号
1 2 3
试验组（n=20） (阿卡波糖胶囊)
基线 8周后 5 4.3 7 4.5 8 5.2
对照组（n=20） (拜唐苹胶囊) 基线 8周后 85 64 6.5 4.2
.
20
9 10.2
75
两独立样本t检验的步骤
两组基本统计量的计算
s
nx
试验组
20
3.0601
2.065
对照组
20
合2并.4方20差5 计算
2.625
sc2

s12 (n1 1) s22 (n1 n1 n2 2
1)
sc2

3.0601 2 (20 1) 2.4205 20 20 2
2 (20
1)

医学统计学-t检验

；患者在用药后血浆胆固醇水平较用药前显著下降，暂且可认为该药有降低血浆总胆固醇水平的作用。
P
0.05
t
1.860
2021年9月30日星期四
0.01 0.005 P<0.005 2.896 3.355 4.86
30
三、两个样本均数比较
两个小样本均数的比较——t检验
t
x1 x2 Sx1 x2
假设检验的目的就是判断差异的原因:
求出由抽样误差造成此差异的可能性（概率P）有多大! 若 P 较大(P＞0.05)，认为是由于抽样误差造成的。
原因（1），实际上 = 0 若 P 较小(P≤0.05)，认为不是由于抽样误差造成的
原因（2），实际上＞ 0
2021年9月30日星期四
5
第二节假设检验的基本思想和基本步骤
2021年9月30日星期四
12
第二节假设检验的基本思想和基本步骤
❖ 3、确定P值，作出推断结论
▪ P值是指由H0所规定的总体作随机抽样，获得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。
▪ 将计算得出的概率P，与事先规定的概率—进行比较，
看其是否为小概率事件而得出结论。例如求得t=1.833,v=24，α=0.05，查附表其相应的t界值为2.064，根据t分布特征，可得出P>0.05.
正确，X ≠μ0是由于抽样引起。
如同法官判定一个人是否犯罪，首先是假定他“无罪” （H0），然后通过侦察寻找证据，如果证据充分则拒绝 “无罪”的假定（H0），判嫌疑人有罪；否则只能暂且认为“无罪”的假定（H0）成立。
2021年9月30日星期四
6
第二节假设检验的基本思想和基本步骤
假设检验的基本思想—利用反证法的思想

医学统计学8 方差分析

每组的每个测量值的差异可用离均差平方和反映变异的大小反映了各组均数的变异程度组间变异抽样误差处理因素效应meansquarems变异程度除与离均差平方和的大小有关外还与其自由度有关由于各部分自由度不相等因此各部分离均差平方和不能直接比较须将各部分离均差平方和除以相应自由度其比值称为均方差简称均方meansquarems
组间变异组内变异
总变异
观察值总变异可以分解为组间变异和组内变异
14
变异
1. 总变异(Total variation): 全部测量值Xij与总均数X 间的差异
2. 组间变异(between group variation ): 各组的均数 Xi 与总均数 X 间的差异
3. 组内变异（within group variation )：每组的每个测量值 X ij与该组均数 X i 的差异
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 7.19
基本步骤
（1）建立假设，确定检验水准
H0：三个总体均数相等，即三组工作人员的体重指数总体均数相等
(x j
x)2，自由度ni-1
组内：SS总-SS处理-SS区组，自由度N-k-ni-1
案例分析
为探讨Rgl对镉诱导大鼠睾丸损伤的保护作用，某研究者将同一窝别的3只大鼠随机地分到T1、T2 、T3三组，进行不同处理, 共观察了10个窝别大鼠的睾丸MT含量（μg/g）。试问不同处理对大鼠 MT含量有无影响？
可用离均差平方和反映变异的大小
总变异
所有测量值之间总的变异程度，SS总

医学统计学第八章-t检验

配对设计t检验（例8.2）
• 24名儿童接种卡介苗，按照年龄、性别配成12对，每对中的一人接种新制品，另外一人接种标准品；经相同部位注射，72小时后观察结核菌素皮肤反应的直径，请问两种疫苗的反应结果有无差别？
编号
1 2 3 4 5 6 7 8 9 10 11 12
标准品
12.0 14.5 15.5 12.0 13.0 12.0 10.5 7.5 9.0 15.0 13.0 10.5
• a＝0.05；双侧
• t计= 算d =检验d 统计= 量3.2t5 = 4.520； = 11
S d
sd / nd
2.491 / 12
• 查表，t 0.05/2,11 = 2.201，所以 P<0.05(P=8.7×10-4)；在a=0.05的水
准上，拒绝H ，两种疫苗的反应结果
3.成组t检验
2
t检验
• 在假设检验中使用了t统计量，所以就称之为 t检验
• t检验的使用是有条件的，什么样的资料可以计算t值？
3
t检验的使用条件
• 数值(计量资料、定量变量)变量 • 正态分布或近似正态分布 • 总体方差齐性(两样本资料) • 在满足上述条件下，如果总体标准差未知，而
且样本含量较小（n≤100），考虑使用t检验；而如果已知总体标准差或样本含量较大（n>100 ）则可以使用Z检验
• 在a=0.05的水准上，不拒绝H0，尚不认为农村新生儿的出生体重与该地平均水平不同。
2.配对设计的t检验
• 何为配对设计？ • 有时影响试验或研究结果的不仅仅是
我们所观察的因素，例如要比较两种药物的疗效，如果两组患者在开始时的病情严重程度相差较大，那么即使最终两药的治愈情况不同，也不能归结于药物差别；在这里患者的病情称之为非处理因素或“混杂”因素 • 配对设计就是研究者为了控制可能存在的非处理因素对研究结果的影响而采用的一种“均衡”的设计方法

医学统计学第七、八章假设检验的基本概念和t检验

S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下，可将两方差合并，求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中，σ 未知且n 较小，样本取自正态总体； ② 两小样本均数比较时，两样本均来自正态分布总体，两样本的总体方差相等；若两总体方差不齐可用t’检验； ③ 两大样本均数比较时，可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围：用于样本均数与已知总体均数（一般为理论值、标准值或经过大量观察所得的稳定值等）的比较。 • 分析目的：推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大，则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0＝ 3min，n＝50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值，作出统计推断根据算出的检验统计量如 t、z 值，查相应的界值表，即可得到概率 P。 P值是在H0成立前提下，抽得比现有样本统计量更极端的统计量值的概率。 P值越小只能说明：作出拒绝H0 ，接受 H1的统计学证据越充分。
X −μ X −μ 用公式：t = 或z = σX SX

医学统计学第二版高等教育出版社课后习题答案

医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体，这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值（即变量值）的集合，通常有无限总体和有限总体之分，前者指总体中的个体是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体是有限的，它是指特定时间、空间中有限个研究个体。

但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中，该地2007年全部正常成年男子的红细胞数就构成一个总体，从此总体中随即抽取2000人，分别测的其红细胞数，组成样本，其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差，一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差；非随机误差中最常见的为系统误差，系统误差也叫偏倚，是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病。

统计量是研究人员能够知道的，而参数是他们想知道的。

一般情况下，这些参数是难以测定的，仅能够根据样本估计。

显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时，统计学上习惯称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓的小概率事件原理，它是进行统计推断的重要基础。

第二章调查研究设计1.调查研究主要特点是什么？调查研究的主要特点是：①研究的对象及其相关因素（包括研究因素和非研究因素）是客观存在的，不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

作为总体指标）
（1）建立检验假设
H0：μ ＝μ0 ，即该托儿所男婴的体重发育状
况与全国九城市的同期水平相同。
H1： μ≠μ0 ，即该托儿所男婴的体重发育状
况与全国九城市的同期水平不同。
α ＝0.05(双侧)
（2）计算u值本例因总体标准差σ已知，故
可用u检验。
本例n=47, 样本均数=11, 总体均数=11.18,总
验）
一、单样本t检验（样本均数与总体均数比较的t检验）
即样本均数代表的未知总体均数与已知的总体均数（一般为理论值、标准值或经过大量观察所得的稳定值等）进行比较。
这时检验统计量t值的计算在H0成立的前提
条件下为：
t X 0
Sn
例3.3 根据调查，已知健康成年男子脉搏的均数为72次/分钟，某医生在一山区随机测量了25名健康成年男子脉搏数，求得其均数为 74.2次/分钟，标准差为6.5次/分钟，能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同？
二、配对资料的t检验
配对实验设计得到的资料称为配对资料。
医学科研中配对资料的四种主要类型： ➢ 同一批受试对象治疗前后某些生理、生化指标
的比较； ➢ 同一种样品，采用两种不同的方法进行测定，
来比较两种方法有无不同； ➢ 配对动物试验，各对动物试验结果的比较等。 ➢ 同一观察对象的对称部位。
配对资料的 t 检验
之间收缩压均数有无差别？
（1)建立检验假设
H0：μ1 ＝μ2 ，即该地20～24岁健康女子和
男子之间收缩压均数相同；
H1: μ1≠μ2 ，即该地20～24岁健康女子和男
子之间收缩压均数不同。 α ＝0.05（双侧）
（2）计算u值
本例 n1=100, 均数1=15.27, S1=1.16 n2=100, 均数2=16.11, S2=1.41
t | 74.2 72 | 1.692 6.5 25
（3）确定P值, 作出推断结论
本例υ =25－1=24，查t界值表，得 t0.05,24=2.064 ， t=1.692< t0.05,24=2.064 ，故P>0.05。按α=0.05的水准，不拒绝H0，
差异无统计学意义。
结论：即根据本资料还不能认为此山区健康成年男子脉搏数与一般健康成年男子不同。
根据大量调查，已知某地成年男子，通过
尿酸酶法测得血尿酸均数为400μmol/L,现在该地邻近海边区域随机调查20名健康成年男子，测得其血尿酸值分别为（410，415，422， 418，419，420，425，430，411，415，428 ，433，427， 411，421， 429，435，424， 427，440）请根据此判断海边区域成年男子的血尿酸是否与该地成年男子有所不同？
体标准差=1.23, 代入公式
11 11.18
u
1.003
1.23 / 47
（3）确定P值，作出推断结论
查u界值表（t界值表中为∞一行），得 u0.05=1.96，u=1.003< u0.05=1.96, 故P>0.05。按α=0.05水准，不拒绝H0，差异无统计学意义。
结论：不能认为该托儿所男婴的体重发
❖样本均数与总体均数比较的u检验适用于：
❖ ①总体标准差σ已知；
❖ ②样本含量较大时，如n>100时。
u 值的计算公式为：
σ已知，不管n的大小。 σ未知，但n>100时。
X 0
u
0 / n X 0
u S/ n
例3.4 某托儿所三年来测得21～24月龄的 49名男婴平均体重11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重 11.18kg，标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同？（全国九城市的调查结果可
15.27 16.11
u
4.60
1.162 1.412
100 100
（3）确定P值，作出推断结论
查u界值表（t界值表中为∞一行），得 u0.05=1.96，现u>u0.05=1.96,故P<0.05。按水准 α =0.05，拒绝H0，接受H1,差异有统计学意义。
结论：可认为该地20～24岁健康人的收缩压均数男性不同于女性。
例3.6 对例3.3资料进行t检验。
（1）建立检验假设
H0：μ ＝μ0 ，即该山区健康成年男子脉搏均
数与一般健康成年男子脉搏均数相同；
H1：μ≠μ0 ，即该山区健康成年男子脉搏均数
与一般健康成年男子脉搏均数不同。 α＝0.05（双侧）
（2）计算t值本例n = 25 , s = 6.5 , 样
本均数=74.2 ,总体均数 =72 , 代入公式
育状况与全国九城市的同期水平不同。
二、两样本均数比较的u检验
该检验也称为独立样本u检验 (independent sample u-test),适用于两样本含量较大（如n1>50且n2>50）时， u值可按下式计算：
u
X1 X 2
S12
S
2 2
n1 n2
例3.5 测得某地20～24岁健康女子100 人收缩压均数为15.27kPa，标准差为 1.16kPa；又测得该地20～24岁健康男子 100人收缩压均数为16.11kPa，标准差为 1.41kPa。问该地20～24岁健康女子和男子
(paired samples t-test)
❖ 先求出各对子的差值d的均值, 若两种处理的效应无差别，理论上差值d 的总体均数应为0。
第八章 t检验
目录
第一节均数的 u 检验第二节均数的 t 检验第三节两总体方差的齐性检验和t＇检验
学习要求
掌握：u检验和t检验的概念，意义，应用条件和计算方法
第一节均数的u检验
一、样本均数与总体均数比较的u检验
❖国外统计书籍及统计软件亦称为单样本u 检验（one sample u-test）。
第二节均数的 t 检验
❖ 当样本含量较小时，t分布和u分布有较大的出入，
所以小样本的样本均数与总体均数的比较以及两
个样本均数的比较要用t检验。
❖ t检验的适用条件：①样本来自正态总体或近似
正态总体单样本t检验（样本均数与总体均数比较t检验）
2.配对样本t检验 3.独立样本t检验（两样本均数比较t检