第九章第二节(t检验法)

合集下载

第九章 方差分析

第九章  方差分析

第九章方差分析前面介绍了两个样本均数比较的t检验,那么多个样本均数的比较应该采用什么方法?方差分析(analysis of variance, ANOV A)是20世纪20年代发展起来的一种统计方法,由英国著名统计学家R.A.Fisher提出,又称F检验,是通过对数据变异的分析来推断两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

本章首先介绍方差分析的基本思想和应用条件,然后结合研究设计类型分别介绍各类方差分析方法。

第一节方差分析的基本思想和应用条件一、方差分析的基本思想方差分析的基本思想是把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

例9.1 为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。

喂养一周后,测定大鼠红细胞数(×1012/L),试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?表9.1 喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料合计X 4.78 4.65 6.80 4.65 6.92 5.913.984.447.284.04 6.167.51 3.445.997.51 3.776.677.743.65 5.298.194.91 4.707.154.795.058.185.316.01 5.534.055.677.795.16 4.688.03in12 12 12 36 (n)i X ∑ 52.53 66.23 87.62 206.38(X ∑)i X4.385.52 7.30 5.73 (X ) 2i X ∑ 234.2783373.2851647.73121255.2946(2X ∑)表9.1按完全随机设计获得的36个数据(X )中包含以下三种变异: 1. 总变异 36只大鼠喂养一周后测定红细胞数X 各不相同,即X 与总均数X 不同,这种变异称为总变异(total variation)。

爱爱医资源-9. t检验

爱爱医资源-9. t检验

1. 建立假设,确定显著性水平 H0: m =3.30(难产儿与一般新生儿平均体重相同) H1: m > 3.30(难产儿平均体重大于一般新生儿)
a =0.05(单侧检验----右侧检验)
2. 计算统计量
X m0 3.42 3.30 t = =1.77, 34 S / n 0.40 / 35
图* 双侧t检验的检验水准a
图** 单侧t检验的检验水准a
总体均数的假设检验:
单侧检验比双侧检验更易得到拒绝H0的结论。
配对设计资料的 t 检验
1. 配成对子的两个受试个体分别随机的分配 两种不同的处理
异源配对
如把同窝、同性别和体重相近的动物配成一对; 把同性别、同病情和年龄相近的病人配成一对等;
a = 0.05(双侧检验)
2. 计算统计量
Sd
2 2 d ( d ) /n
n 1
4.1721 4.792 /12 0.453 12 1
d md d 0.399 t 3.051, 11 Sd Sd / n 0.453/ 12
3. 确定P值,作出统计决策
u变换 u X m
u
X m
X ~N ( m , X ) N (0,1)
X
X 未知,用 X 的估计值S X :
X ~N ( m , X ) t ( ) t变换
t X m X m SX S/ n
总体均数m的(1 a )可信区间:X ta / 2, S XBiblioteka 3. 确定P值,作出统计决策
界值t0.05,34 =1.691,|t|>t0.05,34 ,得P<0.05,按
a0.05检验水准拒绝H0 ,接受H1 ,差别有统计学意

9.4 t检验和u检验03

9.4 t检验和u检验03
⑶ 假设检验的确切 P 值;
⑷ 有关总体参数的 95%置信区间。
3
假设检验应注意的问题:
(1)资料必须合乎随机化抽样原则;
样本 总体, 样本要有代表性和均衡性
随机 ≠ “随便”
(2)选用的假设检验方法应符合其应用条件;
资料性质、设计类型、样本量、分布类型等
u检验和 t 检验
4
(3)实际差别大小与统计意义的区别,
18
练习5
某地检查健康男性工人625人的红细胞计数,得均
数为4.8×1012/L,标准差为0.5×1012/L . 1) 根据此资料估计该地健康男性工人的红细胞计数 的95%参考值范围。 2) 根据此资料估计该地健康男性工人的红细胞计数
平均水平。
3) 以上例说明参考值范围与置信区间的含义。
19
练习5讨论要点:
11
(3)确定 P 值,判断结果
P<0.05
单侧P值
0.05
0.025 -1.75 -1.98 -1.66
12
0
1.75
t 值和对应 P值图
• 按照单侧α=0.05的水平,拒绝H0,接受H1.
• 可以认为社会经济落后地区新生儿出生体重低于 一般水平。
• 拒绝H0 ,可能犯I类错误:发现该落后地区医院 的新生儿体重低于3.1kg,但事实上该医院的新生 儿体重是3.1kg。
• 可否据此资料得到社会经济落后地区的新生儿平均体
重低于一般水平的结论?
10
练习1讨论要点:
(1)建立假设,确定检验水准
H 0 : 3.1
H1 : 3.1
0.05(单侧)
(2)选择检验方法,计算检验统计量
2.96 3.10 t 1.75, 0.80 / 100

市场调查与预测第九章

市场调查与预测第九章

p p z P
0 p P

0
0
0
n
(二)独立样本的两比率差分的检验
四、拟合优度(Goodness of Fit) (一)单个样本的x2检验 对单个样本进行x2检验时,可选用统计量:
2

k

i 1
(Qi
E Ei
i)
2
式中:为第i类的观察值(观察频数),为第i
计量数据的线性相关分析使用皮氏(Pearson)积
矩法,用R表示。
R
n XY ( X )(Y)
n
X
2

(
X
)2

nY
2

(
Y
)
2
(二)顺序量度的相关分析:斯彼尔曼(Spearman)相

n
6
d
i
2
1
R n s
i 1
3n
式中:di——各对数据的等级差别; n——样本的 数据总数。
SSb 组间离差平方和,是各实验处理下样本均值与总体均值之间的差 异,是系统误差。

df b :组间自由度
df : 组内自由度 w
df : 总自由度 t
(三) 单因素方差分析
单因素方差分析经常被用来分析实验结果。下面 通过例子加以说明。【例9-10】.doc
(四) 多因素方差分析 1、无交互影响的双因素方差分析 小案例9-1 2、有交互影响的双因素方差分析 小案例9-2
聚类分析分为Q型聚类分析和R型聚类分析。Q型 聚类分析是对样品进行分类,R型聚类分析是对变 量进行分类。
(一)聚类分析在市场调研中的应用
(1)市场细分 (2)了解购买行为 (3)开发新产品 (4)选择实验性市场 (5)简化数据 (二)聚类分析的基本步骤

09 第九章 非参数检验

09 第九章  非参数检验

通过查阅正态分布表来把握观察的显著性水平, 进而做出否定或保留虚无假设的统计决断。
第三节 中位数检验
一、两个样本中位数差异的检验
二、多个样本中位数差异的检验
中位数检验法是通过对来自两个或多个独立总体的 两个或几个样本的中位数的研究,以判断这两个或 多个总体取值的平均状况是否存在显著性的差异。 其基本思想是假设这两个或多个总体具有相同的分 布律,那么它们的取值将具有相同的平均状态。 中位数检验法的具体做法是:先将几组数 据 X1 、 X 2 、… X k 合并成一个容量为 N n1 n2 nk 的样本,再找出这个样本的中位数 Md 。然后统计出 X1 中大于中位数的数据个数 a ,小于或等于中位数 的数据个数 b ;X 2 中大于中位数的数据个数 c ,小 于或等于中位数的数据个数 d ,…,即分别统计出 每个样本中大于和小于等于中位数的数据个数,再 进行“ r c ”表的 2 检验。
一、小样本的情况
当两个独立样本的容量都小于10,进行秩和检验的 步骤一般为: (1)编排秩次:将两列变量 X1 、X 2 共计 n1 n2 个数据 混合起来,由小到大编排秩次。最小的一个数据的 秩次为1,最大的一个数据的秩次为 n1 n2 。对若干 个数值相等的数据,则取它们相应的秩次的中位数。 (2)求秩和:累计容量较小的样本中的 n1 个数据的 秩次之和,并且记为 T 。 (3)把握显著性水平与统计决断:根据两个独立样本 的容量 n1 和 n2 ,以及显著性水平 ,查阅秩和检验 表。将实际求得的秩和 与表中相应的理论临界值 (下限 T1 和上限 T2 )做比较。如果由样本资料得到 T 的实际秩和 T T1 或 T T2 ,则可以在 显著性水平 上否定无差异的虚无假设;如果实际求得的秩和满 足: T1 T T2 ,则应保留虚无假设。

第九章----方差分析

第九章----方差分析

若组间变异明显大于组内变异, 则不能认为组 间变异仅反映随机误差的大小, 处理因素也在起 作用。根据计算出的检验统计量F值, 查界值表 得到相应的P值, 按所取检验水准α作出统计推断 结论。
检验统计量F值服从F分布。
F<Fα,(ν组间, ν组内),则P > α, 不拒绝H0, 还不能认 为各样本所来自的总体均数不同;
1、各样本是相互独立的随机样本, 且来自 正态分布的总体;
2、相互比较的各样本的总体方差相等, 即 具有方差齐性。 独立性、随机性、正态性、方差齐性
五、方差分析的用途
1、用于进行两个或多个样本均数的比较; 2、分析两因素或多因素间的交互作用; 3、用于回归方程的线性假设检验。
六、方差分析的优点
1、不受比较组数的限制,可比较多组均数; 2、可同时分析多个因素的作用; 3、可分析因素间的交互作用.
一、多个样本均数间的比较能否用 t 检 验或 u 检验?为什么?
原因:
五个样本均数进行比较, 每次两个均数作一次 t 检验, 共需作10(C52=10)次 t 检验。若每次比 较的检验水准α=0.05, 则每次比较不犯Ⅰ型错误 的概率为(1-α)=0.95。当这些检验独立进行 时, 则10次比较均不犯Ⅰ型错误的概率为0.9510= 0.5987, 此时犯Ⅰ型错误的概率, 即总的检验水准 α变为1-0.5987=0.4013比0.05大的多。犯Ⅰ型错 误的概率增大, 可能将原本无差别的两个总体推 断为有差别, 误判为有统计意义。因此多重比较 不宜用的 t 检验或 u检验作两两比较。
已知各组均数、标准差和样本含量时F值 的简便计算方法。
当原始数据未知, 只知各组均数、标准差和 样本含量时, 可进行如下计算, 分两种情况: 1、各组样本含量ni相等; 2、各组样本含量ni不等。

医学统计课件人卫6版 第九章 卡方检验

3.医学期刊中常见的:不论表中两个分类变量 是有序还是无序,均用卡方检验进行分析, 这种做法是不妥的,对于有序的R×C表资料 不宜用卡方检验。因为行×列表资料的检验 与分类变量的顺序无关,无论将任何两行( 或两列)频数互换,所得值皆不变,结论相 同。
2020/11/4
行×列表资料 2检验的注意事项
基本公式: 2
(AT)2 T
四格表专用公式 :2(ab)c((add )ba () c2cn)b (d)
2020/11/4
2.计算检验统计量
(2)当总例数 n且4只0 有一个格子 1T5
时:用检验的校正公式或改用四格表资料的 Fisher确切2=(a
(|ad-bn2)c2n|+)b(c+)d(a+)(bc+)d
2020/11/4
二、四格表χ2检验
2检验的步骤:
1.建立检验假设
H:0 1,两总2 体率相等 H 1 : 1 ,两2总体率不等 0.05
2020/11/4
2.计算检验统计量
(1)当总例数 n且4所0 有格子的 时T:5
用检验的基本公式或四格表资料检验的专用公式;
当 P时,改用四格表资料的Fisher确切概率法。
2020/11/4
某医院分别以中医和中西医结合两种疗法治疗 乙型脑炎患者238例,结果如下表。问两种治疗 方法的疗效有无差别?
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 治愈率
人数 人数
(%)
44 74 118 37.3
70 50 120 58.3
114 124 238 47.9
p c (X 1X 2)/n (1 n 2)

医学统计学第九章双变量回归与相关


102
28
(一)回归方程的假设检验
建立样本直线回归方程,只是完成 了统计分析中两变量关系的统计描述,研 究者还须回答它所来自的总体的直线回归 关系是否确实存在,即是否对总体
有 0?
102
29
102
30
如图 9-3 中,无论X 如何取值, Y |X 总在一条 水平线上,即 0 ,总体直线回归方程并不成立, 意即Y 与 X 无直线关系,此时Y|X Y 。然而在一 次随机抽样中,如果所得样本为实心园点所示,则 会得到一个并不等于 0 的样本回归系数b 。b 与 0 相差到多大可以认为具有统计学意义?可用方差 分析或与其等价的 t 检验来回答这一问题。
102
5
第一节 直线回归
102
6
一、直线回归的概念
目的:研究应变量Y对自变量X的数量依 存关系。
特点:统计关系。 X值和Y的均数的关系, 不同于一般数学上的X 和Y的函数 关系。
102
7
例9-1 某地方病研究所调查了8名正常儿童的尿 肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y) 对其年龄(X)的回归方程。
改变b个单位。
102
15
公式(9-1)称为样本回归方程,它 是对两变量总体间线性关系的一个估计。 根据散点图我们可以假定,对于X 各个取 值,相应Y 的总体均数Y|X 在一条直线上 (图 9-2),表示为
Y|X X
102
(9 2)
16
102
17
二、直线回归方程的求法
➢ 残 差 (residual) 或 剩 余 值 , 即实测值Y与假定回归线上
102
36
SS残 即 (Y Yˆ)2 ,为残差平方和。它反应除

方差分析 (共72张PPT)


2.总体变异的构成
总体变异 组间变异: 组内变异:组内变异理论上要求齐性,实际计算取其 均值
3.方差的基本公式
一般总体方差称方差,样本方差称均方 能使变量发生变异的原因很多,这些原因我们都将其称为变异
因素或变异来源。
方差分析就是发现各类变异因素相对重要性的一种方法
方差分析的思路就是:把整个试验(设有 k 个总体)的样本资料作 为一个整体来考虑。
原理是变异的可加性。
即每一个数据与数据的总体平均数差的平方和,可以分解为每一组数 据各自的离差平方和与由各组数据的平均数组成的一组数据的
离差平方和两部分。前者表达的是组内差异,即每组数据中 各个数据之间的差异,也就是个体差异,表达的是抽样误差或 随机误差程度;后者表达的是组间差异,即各组平均数之间的差 异,表达的是实验操纵的差异程度,实验操纵即指自变量的操 纵,这两部分差异之间相互独立。
3、这种两两比较会随着样本组数的增加而加大犯Ⅰ型错的差异显著性检验,若两两比较推 断正确的概率为95%,则所有比较都正确的概率为6=0.74,则降低
了推断的可靠性。
• 几个常用术语:
1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低 ,在试验中具体测
(1).计算平方和:
组间平方和
SB SX n2X n2 71 .5 6 65 8 .1 7 8 20 8 .47
¨ 组内平方和
SW SX 2X n2 7 6 7 41 4 .5 6 4 45 7 .5 7 8
¨ 总平方和
SS T X 2X n2
764414252 876.396
23
(2).计算自由度
因此,方差分析可以帮助我们抓住试验的主要矛盾和技术关键,发 现主要的变异来源,从而抓住主要的、实质性的东西。

教育统计学第九章


2.单、双侧检验的零假设一样, H0: μ = μ0 3.单侧检验的备择假设规定了差异的方向,如左侧 H1:μ <μ0 4.单侧检验更加灵敏、但有条件,双侧检验更为安全、因而多用。
在SPSS中进行检验
例4 会看SPSS
已知样本均数为87.42,标准差为11.44,总体均数为 83.50,差异显著吗?
在SPSS中进行检验
例10 会看SPSS(独立样本)
平均数显著性检验一览
样本数 相关性 — 单样本 — —
独立样本
总体σ 已知 未知 未知 未知 未知 未知
样本大小 检验形式 — 大样本 小样本 大样本 小样本 — Z检验 Z检验 t检验 Z检验 t检验 t检验
双样本
相关样本
作业
页264,题5、6; 页264,题8、9、10(标准差为矫正S)

(一)独立大样本的检验
例5的检验步骤:
(1)提出假设 H0:μ1=μ2 H1:μ1≠μ2 ( 2)选择并计算检验统计量
=1.29
(3)统计决断 P=0.19706>0.05,或:|Z |=1.29<1.96,则P>0.05 在0.05水平上保留H0拒绝H1。 结论:未发现该地区6岁儿童的身高存在显著的性别差异。
二、独立样本均数差异的显著性检验
例5 幼儿身高存在性别差异吗?
男人要比女人高,但男孩比女孩高吗?某地区随机抽 取各50名6岁男孩和女孩,测得男孩平均身高为114cm,标 准差为5cm;女孩平均身高为112.5cm,标准差为6.5cm。 根据该结果能否下结论说:男孩比女孩要高? 检验目的:两个总体(该地区6岁男孩和女孩的身高)之 间是否存在显著差异? 检验原理: 1.先假设总体是相同的,即 H0:μ1=μ2; 2.考察两个样本(各50名6岁男孩女孩)之间的差异是否仅 仅是抽样误差所致; 3.H0为真时难得出现的样本均数差,就是H0不正确的证据。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1
第九章
第二节 t检验法

二.2未知时,均值的假设检验
1. 未知方差2

设总体2,~NX,2未知,
nxxx,,,21

为X的样本.

在得到一组样本值的情况下,
若给出0为某一定数,

问是否有0 。

这个问题称为 在方差2未知的
条件下,
检验假设:00:H 是否成
立的问题。


2

假设0H:0为真,
由于2未知,这时U已不是统计
量,因此,我们很自然地用2的无偏
估计量2s来代替2,选取检验函数

nsxT/
0

为检验0H:0的统计量。

由第七章定理四得

1~/ntnsxT

,

所以在假设0H为真时,
必有1~/0ntnsxT .

类似于前面的讨论,采用双边检
验,对于给定的检验水平,
查1nt表得121nt,

使得 21)}1({21ntTP,
3

于是 1)}1(|{|21ntTP,


)}1(|{|21ntTP

即得)}1(|{|210ntnsxP,

在假设0H为真时,
则)}1(|{|210ntnsx必是一个小概率

事件。
由样本值算出nsxt0,
然后与)1(21nt相比较,做出判断:
若)1(||21ntt,(小概率事件在一次
试验中发生),则拒绝假设0H;

若)1(||21ntt,(小概率事件在一次
试验中没有发生),则接受假设0H.
4

2. 未知方差2,
检验假设0H:0;01:H
(事先算出样本值0x,才提这样
的检验假设)
选取检验用的统计量


1~/ntnsxT

,

所以在0H为真时,

1~/0ntnsxT

.

类似于前面的讨论,采用单边检
验,对于给定的检验水平,查

1nt

表得

11nt


,使得,



1)}1({1ntTP

,

)}1({1ntTP

即得)}1({10ntnsxP,
)}1({10nt
n
s

x


是一个小概率事件;
5

由样本值算出nsxt0,
然后与)1(1nt相比较,做出判断:
若)1(1ntt,则拒绝假设0H,
接受1H ;
若)1(1ntt,(0x ),
则接受假设0H.

3.未知方差2,
检验假设00:H;01:H,
(事先算出样本值有0x,才提这
样的检验假设)
选取检验用的统计量


1~/ntnsxT

,

所以在0H为真时,

1~/0ntnsxT

.

类似于前面的讨论,采用单边检
验,对于给定的检验水平,查

1nt

表得
6


11nt


,使得,



1)}1({1ntTP

,


)1(11ntnt


,



)}1({)}1({1ntTPntTP

,

即得)}1({10ntnsxP,

)}1({10nt
n
s

x


是一个小概率事

件;
由样本值算出nsxt0,然后与

)1(1nt

相比较,做出判断:

若)1(1ntt,则拒绝假设0H,
接受1H ;
若)1(1ntt,(0x ),
则接受假设0H.

以上三种检验法均采用了t分
布,故又名t检验法.
7

通常总体的方差2是未知的,所
以用本法对均值进行检验及求均值

的置信区间更具有更大的使用价
值.

例2 在某砖厂生产的一批砖
中,随机地抽取6块进行抗断强度试
验,测得结果(单位:kg/cm2)如下
32.56 29.66 31.64 30.00
31.87 31.03
设砖的抗断强度服从正态分布,问这
批砖的平均抗断强度是否为32.50
(kg/cm2)?取(=0.05)。
解:(1)假设50.32:0H
(2)计算统计量T的值,

算出13.1,13.31sx,

T=97.26/13.150.3213.31/50.32nsx
(3)当=0.05时,查t分布表得
)1(21nt

=)5(975.0t=2.57
8

(4)比较T与)1(21nt的大小。
现在T>)1(21nt,故拒绝假设0H。

读者可能已发现,这里检验用的
统计量与均值的区间估计所用的统
计量是一致的。事实上,上述检验与
区间估计之间有着密切的联系。例如


的置信度为1的置信区间是满足

不等式)1(/210ntnsx《的值的集合。而假

设H0:0的检验实质上是找出的
置信区间,如果0落在置信区间内,
则接受假设0H;如果落在置信区间
外,就拒绝接受0H。
有的时候,我们还要检验总体的均值


是等于0还是大于0,即要在假设
H0:0或H1:0中做出选择。这
里的H1称为备选假设(也称备择假
设),而把H0称为原假设。(此问题我
们在后面的章节中有进一步的讨论
与分析)
9

例3:抽取某班级28名学生的语文考
试成绩,得样本均值80为,样本标
准差(所谓样本标准差是niixxnS1221,

而样本方差niixxns12211)是为8分,若
全年级语文成绩平均是85分,试问
该班学生语文的平均成绩与全年级
的平均成绩有无差异?并求出该班
学生语文平均成绩的置信区间(假定
该年级语文考试成绩服从正态分布,

05.0


解:本例第一个问题为未知方差,检
验0H:85,故用t检验法,且为双边
检验。


248.3147.8858028/,147.8,37.661,64,80,28,85002220nsxt

sSnns
Sxn

对于05.0,查t(27)分布表,得
052.2)27(21t
,因052.2248.30t,拒绝0H,这
10

表明该班学生的语文平均成绩与全
年级平均成绩存在差异,
由于84.7621tnsx,16.8321tnsx

故该班学生的语文平均成绩的95%置
信区间是(76.84,83.16)

相关文档
最新文档