计量资料的统计推断-t检验

合集下载

统计学-t检验

统计学-t检验


• Three types of Paired Samples.
异 体 配 对
配对样本的类型

配成对子的两个受试对象分别给予两种不同的处理 (如把同窝、同性别和体重相近的动物配成一对;
把同性别、同病情和年龄相近的病人配成一对等);
自 身 配 对

同一受试对象同时分别接受两种不同处理(如同一 动物的左右两侧神经、同一份标本分成两部分);
d 0 d 17.17 t 1475 . sd sd / n 40.33 / 12
(3)
确定P 值,作出统计推断 =n-1=12-1=11 查 t 界值表,得 0.10<P<0.20 ,按 =0.05 水准 不拒绝 H0 ,尚不能认为两种仪器检查的结果 不同。
例3:将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组 给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含 量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?
两独立样本方差的齐性检验

两独立小样本均数的 t 检验,除要求两组数据均应服从正态分布
外,还要求两组数据相应的两总体方差相等,即方差齐性。

即使两总体方差相等,两个样本方差也会有抽样误差,两个样本
方差不等是否能用抽样误差解释?可进行方差齐性检验。
例8 由X线片上测得两组病人的R1值(肺门横径右 侧距, cm),算得结果如下,试检验肺癌病人与矽 肺0期病人的R1值的均数间差异是否明显。 肺癌病人: n1 10, 矽肺0期病人:
4.22 4.40
X2: 4.12
4.95 5.18
7.38 5.92
n1= 18, n2= 16,

T检验-郑金来

T检验-郑金来

18
t 值表规律:
(1) 自由度(υ)一定时,p 与 t 成反比;
(2) 概率(p) 一定时, υ 与 t 成反比;
zhengjinlai@
19
小样本思想

戈塞特:t分布与小样本
由于“有些实验不能多次地进行”,从而“必须 根据少数的事例(小样本)来判断实验结果的正 确性”


与正态分布的关系
Lower Bound Upper Bound
.241 .478
zhengjinlai@
36
Statistics 身 高 N Mean Std. Error of Mean Std. Deviation Percentiles Valid Missing
2.5 97.5
100 0 163.7430 .37998 3.79985 155.9675 170.8850
标; 样本均数的标准差。
SPSS结果中用std. error of mean 表示
zhengjinlai@
10
标准误示意图
X1 S1
μσ
X2 S2 XI Si Xn Sn
σx
X服从什么分布?
zhengjinlai@
二、(均数)标准误
sx
s n
意义:反映抽样误差的大小。标准误越小,
zhengjinlai@
15
zhengjinlai@
16
t 分布(与u 分布 比较的特点)
zhengjinlai@
17
t 值表
横坐标:自由度, υ 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。
zhengjinlai@
zhengjinlai@

数值变量的统计推断-t检验

数值变量的统计推断-t检验

例3 25例糖尿病患者随机分成两组,
甲组单纯用药物治疗,乙组采用药物
治疗合并饮食疗法,2个月后测空腹
血糖,如表所示,问二组患者血糖值
是否相同?
表 25 名糖尿病患者两种疗法治疗后 2 个月血糖值(mmol/L) 编 号 1 2 3 4 5 6 7 8 9 10 11 12 甲组血糖值 (X1) 8.4 10.5 12.0 12.0 13.9 15.3 16.7 18.0 18.7 20.7 21.1 15.2 编 号 1 2 3 4 5 6 7 8 9 10 11 12 13 乙组血糖值 (X2) 5.4 6.4 6.4 7.5 7.6 8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.7
表 5-3
编号
两种饲料喂养小白鼠 4 周后体重增重(g)情况
高蛋白组体重增加 量(X1) 编号 低蛋白组体重增加 量(X2) 1 2 3 4 5 6 7 8 9 10 11 12 13 36 38 37 38 36 39 37 35 33 37 39 34 36
1 2 3 4 5 6 7 8 9 10 11 12
S 6.5次 / 分 , n 30
µ0=72次/分
µ=?
已知总体
n=30,
未知总体
x 74 .2 次/分 S 6.0 次/分
假设检验的基本步骤
Ⅰ 建立检验假设,确定检验水准 Ⅱ 选择统计方法,计算检验统计量 Ⅲ 确定P值,作出推断结论
Ⅰ、建立检验假设,确定检验水准
假设有两种:
(1)用H0表示 : 即检验假设,常称为无效假设。
样本对总体有较好代表性,对比组间有较好组间均衡性—随 机抽样和随机分组; 样本来自正态分布总体,配对t检验要求差值服从正态分布, 实际应用时单峰对称分布也可以;大样本时,用u 检验,且

《计量资料的统计推断》的复习思考题

《计量资料的统计推断》的复习思考题

《计量资料的统计推断》的复习思考题1.什么是统计推断?统计推断包括哪两方面内容?2.什么样的分布是t分布?对称分布、正态分布、t分布和标准正态分布有何区别和联系?3.什么是标准误?标准差和标准误有什么区别和联系?4.什么是总体均数的可信区间?某指标的95%正常值范围和95%可信区间有何区别何联系?5.显著性检验的目的意义是什么?基本原理是什么?前提条件有哪些?6.什么情况下可认为具有可比性?举例说明日常生活中常犯的没有可比性时进行比较的错误。

7.显著性检验的一般步骤有哪些?8.显著性检验时,假设有几种?哪几种?如何假设?9.假设检验时,如何选择进行单侧或双侧检验?10.什么是检验水准/显著性水平?一般是多少?如何根据实际情况来确定检验水准?11.假设检验时的“P值”是什么?举例说明。

12.统计学结论和实际意义有何异同?13.什么情况下应该作u/z检验?什么情况下应该作t检验?14.举例说明成组设计和配对设计有何区别。

15.有人说,“只要是比较两个均数,都可以作t检验。

”你认为这种说法对吗?为什么?16.什么是I类错误?什么是II类错误?为什么显著性检验时会犯这两类错误?这两类错误各有什么特点?相互之间有什么关系?17.什么是把握度?科学研究时如何才能使把握度达到一定的水平?18.为什么说统计学结论是概率性的,既不绝对肯定,也不绝对否定?19.随机抽取某品种2月龄苗猪25头,测得其平均体重为20kg,标准差为3kg。

试估计该品种2月龄苗猪的体重。

20.随机测得100听某批某种罐头净重量平均为344.0g,标准差为4.43g。

试估计该批该种罐头的净重量和正常值范围。

21.某鱼场按常规方法所育鲢鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm。

为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm。

试问新方法能否使一月龄鲢鱼苗体长更长?22.某名优绿茶含水量标准为不超过5.5%。

第5章t检验

第5章t检验

1. 建立检验假设,确定检验水准 H0: σ12= σ 22 两组体重的总体方差相等 H1: σ12≠ σ22 两组体重的总体方差不等 α=0.05 2. 计算检验统计量 已知:n1=12 X1=45.75 S12=17.659 n2=13 X2=36.538 S22=3.269
S1 (较大) 17.659 F 2 5.402 S 2(较小) 3.269
注: P<0.01 差别有高度统计学意义 (P越小,越有理由拒绝H0)。
第三节
配对样本t检验
d 0 d t Sd Sd / n
配对设计主要有以下两种形式:
①同源配对: 同一受试对象处理前后的数据;同一受 试对象两个部位的数据;同一样品用两 种方法(仪器)检验的结果; ②异源配对: 配对的两个受试对象分别接受两种处理 后的数据。
第四节 两独立样本 t 检验 Two independent sample t-test • 又称成组t检验 • 适用于完全随机设计的两样本均数的比 较
将受试对象完全 随机地分配到两 组中
一、总体方差相等时的两独立样本 t 检验
应用条件:1. 两样本所代表的总体服从正态分布
2. 两总体方差具有齐性
s1 s12 17.659 2 sx 1.472 1 n n1 12 1
2 s2 s2 3.269 2 sx 2.179 2 n n2 12 2 2
2
三、完全随机分组两组几何均数比较的t检验
宜用几何平均数表示集中水平的资料,不服从 正态分布,但是测量值的对数值服从正态分布, 如抗体滴度的资料。此时可对lgx进行t检验。
t
' 2 2 S x t (1 ) S x t ( 2 )

医学统计学分析计算题-答案 (1)

医学统计学分析计算题-答案 (1)

第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。

(3) 试估计该地健康成年男、女红细胞数的均数。

(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。

女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。

(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。

男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。

样本含量均超过100,可视为大样本。

σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。

医学统计学计量资料的统计推断

医学统计学计量资料的统计推断

医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。

由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。

一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。

2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。

标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。

标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。

当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。

医学统计学第八章-t检验

医学统计学第八章-t检验
随机数:494 567
随机数:206 126
……
试验
对照
试验
对照
对照
试验
对子号
试验组
对照组
1
门诊6
门诊1
2
门诊4
门诊2
3
门诊3
门诊5
……
……
试验组与对照组的两个观察对象均按照一定的条件配成对子, 同一对子中的“混杂”因素在二者间几乎相同;而在不同对子 间这些“混杂”因素则有可能差别很大
01
02
03
单样本资料的t检验
单样本资料的t检验
P/ 2
P / 2
t39
0
-2.023
2.023
-1.294
1.294
1/2α
1/2 α
由于t=-1.294>t0.05/2,35=-2.023,因此虽然无法准确得出P值,但仍然可以推断P>0.05(经过计算机软件得出结果P=0.203 )
在a=0.05的水准上,不拒绝H0,尚不认为农村新生儿的出生体重与该地平均水平不同。
2
样本对应的总体均数等于3.36,仅仅是由于抽样误差所致这种差别;
3
非抽样误差,二者的确有别?
4
两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。
单样本资料的t检验
H0:=3.36,农村新儿体重与该地平均水平相同
H1:≠3.36,二者不同 (有可能高也有可能低,总之不相等即可)
检验水准a=0.05(双侧)
02
假设检验与区间估计的关系
2.018
前面阐述了方差齐性的情况下,如何进行两个样本均数比较的t检验
如果方差不齐,很多学者建议在这样的情况下采用自由度校正的方法计算t分布的概率,或者直接采用非参数检验
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t分布 特征
f(t)
ν─>∞(标准正态曲线) ν =5 ν =1
-5
-4
-3
-2
-1
0
1
不同自由度下的t 分布图
2
3
4
5
• 自由度ν 不同,曲线形态不同,t分布是一簇曲线。 • 自由度ν 越大,t分布越接近于正态分布;当自由度 ν 逼近∞时,t分布趋向于标准正态分布。
t
概率、自由度与t值关系 ——t界值
140 138 140 135 135 120 147 114 138 120
治疗矽肺患者血红蛋白量(克%)
编号
1
治疗前
113
治疗后
140
治疗前后差数d
27
2
3 4 5 6
150
150 135 128 100
138
140 135 135 120
-12
-10 0 7 20
7
8 9 10
110
120 130 123
配对样本均数t检验——实例分析
• 例: 有12名接种卡介苗的儿童,8周后用 两批不同的结核菌素,一批是标准结核菌 素,一批是新制结核菌素,分别注射在儿 童的前臂,两种结核菌素的皮肤浸润反应 平均直径(mm)如表5-1所示,问两种结核菌 素的反应性有无差别?
表 5-1
12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 编号 1 2 3 4 5 6 7 8 9 10 11 12 合计 标准品 12.0 14.5 15.5 12.0 13.0 12.0 10.5 7.5 9.0 15.0 13.0 10.5 新制品 10.0 10.0 12.5 13.0 10.0 5.5 8.5 6.5 5.5 8.0 6.5 9.5 差值 d 2.0 4.5 3.0 -1.0 3.0 6.5 2.0 1.0 3.5 7.0 6.5 1.0 39(d) d2 4.00 20.25 9.00 1.00 9.00 42.25 4.00 1.00 12.25 49.20 42.25 1.00 195(d2)
• 例:以往通过大规模调查已知某地新生儿出生 体重为3.30kg.从该地难产儿中随机抽取35名新 生儿作为研究样本,平均出生体重为3.42kg,标 准差为0.40kg,问该地难产儿出生体重是否与一 般新生儿体重不同?
• 本例已知总体均数0=3.30kg,但总体标准差 未知,n=35为小样本,S=0.40kg • 故选用单样本t检验。
• 如两种疗法治疗糖尿病的疗效比较
25例糖尿病患者 随机分成两组, 总体 甲组单纯用药物 治疗,乙组采用 药物治疗合并饮 食疗法,二个月 后测空腹血糖 (mmol/L) 问两种 样本 疗法治疗后患者 血糖值是否相同?
药物治疗
1
? =
推 断
药物治疗合 并饮食疗法
2
甲组 n1=12
X 1 =15.21
t0.05,9=1.833
• 自由度n-135-134 ,查“t界值表”,得双 侧t0.05/2,34=2.032
t检验与Z检验
(t test and z test)
一、单个样本的t检验 二、配对设计计量资料比较的t检验 三、两独立样本资料均数比较的t检验 四、Z检验 五、t’检验
第一节 单组样本t检验
配对设计概述
• 应用配对设计可以减少实验的误差和控制非处理因素,提 高统计处理的效率。 • 配对设计处理分配方式主要有三种情况: ①两个同质受试对象分别接受两种处理,如把同窝、同 性别和体重相近的动物配成一对,或把同性别和年龄 相近的相同病情病人配成一对; ②同一受试对象或同一标本的两个部分,随机分配接受 两种不同处理; ③自身对比(self-contrast)。即将同一受试对象处理 (实验或治疗)前后的结果进行比较,如对高血压患 者治疗前后、运动员体育运动前后的某一生理指标进 行比较。
William Sealey Gosset
(1876.6—1937.10)
t分布——t值与t分布的引入
样本均数正态分布
N(, )
2 X
u X
N(,2)
观察值正态分布
-3
-2
-1
0
1
2
3
-3
-2
-1

0
1
2
3
X
t
t分布
X SX
z u S代替
X X
u z
X
t 分布曲线
t , t
配对样本均数t检验——检验步骤
例: 应用克矽平治疗矽肺患者10名, 治疗前后血红蛋白的含量如下表所示,问 该药是否引起血红蛋白含量的变化?
克矽平治疗矽肺患者治疗前后 血红蛋白含量(g/L) 编号 治疗前 治疗后
1 2 3 4 5 6 7 8 9 10
113 150 150 135 128 100 110 120 130 123
• 配对样本均数t检验简称配对t检验(paired t test),又称 非独立两样本均数t检验,适用于配对设计计量资料均数的
比较
• 目的:检验两相关样本均数所代表的未知总体均数是否有 差别 • 配对设计(paired design)是将受试对象按某些重要特征 相近的原则配成对子,每对中的两个个体随机地给予两种 处理
单侧
P(t t , )
或 P(t t , )
双侧
P( t t/
2 ,
) P t t/ 2 ) ( ,
概率、自由度与t值关系 ——t界值
• 一定自由度和概率下的t值 t, ,t/2, 可通
过查t界值表——附表C2(p560)获得; • 例如=9,单侧=0.05 ,查“t界值表”得单侧
• 又称单样本均数t检验(one sample t test),适用 于样本均数与已知总体均数μ 0的比较,其比较目 的是检验样本均数所代表的总体均数μ 是否与已 知总体均数μ 0有差别。
• 已知总体均数μ 0一般为标准值、理论值或经大量 观察得到的较稳定的指标值。 • 单样t检验的应用条件是总体标准未知的小样本 资料(如n<50),且服从正态分布。
一、单样本t 检验
(one sample t-test)
t
X 0 SX
自由度ν= n-1
单个样本 t 检验原理
在 H0 : = 0的假定下, 可以认为样本是从已知总 体中抽取的,根据t分布 的原理,单个样本t检验 的公式为:
未知总体 已知总体

0
样本
X
自由度=n-1
单个样本t检验——实例分析
医学统计学
医学统计学
t 检验——问题提出
• 假设检验是通过两组或多组的样本统计量的差别 或样本统计量与总体参数的差异来推断他们相应 的总体参数是否相同; • 医疗卫生实践中最常见的是计量资料两组比较的 问题;
• t检验 (t test, student t test)和z检验(z test)是用于计量资料两组比较的最常用的假设检 验方法
• 标准正态分布中z值大小与尾部面积(概率)有 关,以 z (单侧)和 z/2(双侧)表示; • 在t分布中,当自由度一定时,越小,|t|越大; • 在一定时,自由度越小,|t|越大,大于z值 • 在t分布中,t值与、的大小有关; • 在单侧时(尾部面积取单侧)t 界值表示为t, , 双侧时表示为t/2, ,其意义为
单个样本t检验——检验步骤
• 1. 建立检验假设,确定检验水准
H0:0,该地难产儿与一般新生儿平均出生
体重相同;
H1:0,该地难产儿与一般新生儿平均出生
体重不同;
0.05。
• 2. 计算检验统计量
在μ =μ 0成立的前提条件下,计算统计量为:
单个样本t检验——检验步骤
X 0 X 0 3.42 3.30 t 1.77 S SX 0.40 / 35 n
二、配对资料比较的t 检验 ( paired sample t test )
2、目的:判断不同的处理间是否有差别?
即:差值的总体均数为0
3、公式:
t
d 0 Sd

d Sd
ν = n-1
配对样本均数t检验原理
• 配对设计的资料具有对子内数据一一对应的特征, 研究者应关心是对子的效应差值而不是各自的效 应值。 • 进行配对t检验时,首选应计算各对数据间的差值d, 将d作为变量计算均数。 • 配对样本t检验的基本原理是假设两种处理的效应 相同,理论上差值d的总体均数μd 为0;现有的不 等于0差值样本均数可以来自μd = 0的总体,也可以 来μd ≠ 0的总体。
3. 确定P值,做出推断结论 本例自由度n-135-134,查附表C2,得
t0.05/2,34=2.032。 因为t t0.05/2,34,故P0.05,表明差异无统计 学意义,按 0.05水准不拒绝H0,根据现有样
本信息,尚不能认为该地难产儿与一般新生儿平 均出生体重不同。
第二节 配对资料比较的t检验
39, d
2
195。
配对样本均数t检验——检验步骤
– 先计算差数的标准差
Sd
d
2
d
n 1 n
2

392 195
12 12 1
2.4909
– 计算差值的标准误
2.4909 Sd 0.7191 n 3.464 Sd
– 按公式计算,得:
d 3.25 t 4.5195 Sd 0.7191
S 16.4574 Sd 5.2043 n 10
d 6.8 t 1.307 Sd 5.2043
3.确定
P 值,作出推断结论
自由度df =10-1= 9 , 查t 临界值(C2,p560)得:
0.20< P <0.40,按α=0.05水准 不拒绝H0,差异无统计学意义。 根据目前资料尚不能认为克矽平 对血红蛋白含量有影响。
相关文档
最新文档