第6讲 DD-t检验与u检验(2004)

均数差异的假设检验

假设检验的具体方法，通常是以选定的检验统计量来命名的，如t检验要用特定的公式计算检验统计量t值，u检验要用特定的公式计算检验统计量u值。

应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。一、单组完全随机化设计资料均数的t检验和u检验

从一个总体中完全随机地抽取一部分个体进行研究，这样的设计称为单组完全随机化设计（completely randomized design of single group）。

例题1：根据大量调查，已知健康成年男子脉搏均数为72次/分，某医生在某一山区随机抽查了25名健康成年男子，求得其脉搏均数为74.2次/分，标准差为6.0次/分，能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数？这两个均数不等有两个可能：（1）由于抽样误差所致；（2）由于环境条件的影响。如何作出判断呢？在统计上是通过假设检验来回答这个问题。以下介绍建设检验（t检验）的思想方法与步骤。

1、

建立检验假设和确定检验水准

H0：μ1=μ0（=72次/分）：H1：μ1≠μ0（=72次/分）：α=0.05

本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别？

μ是未知的，可以假设μ等于某一定值μ0，μ与μ0的差等于零，这样的假设称为无差异假设或零假设(null hypothesis) 记为H0：μ1=μ0

表示该山区的环境条件对脉搏数无影响，他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符

号为H1

，它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上，因为H0比较单纯明确，而H1却包含着各种情况。

检验水准(size of test )亦称显著性水准（significance level）,符号为α，在实际工作中常取0.05 或0.01。

2、选定检验方法和计算统计量

本例：n=25, -

x=74.2次/分，S=6.0次/分。

检验统计量公式为：

-n , 0

=-=νμx

s x t

将以上数据代入公式，得：

1-25 , 1.833 25/0.60

.722.74===-=

νt

要根据研究类型和统计推断目的选用不同检验方法，不同检验方法有相应的检验统计量，本例的检验统计量t 服从 ν=n-1 的 t 分布。建设检验方法通常是以检验统计量来命名的，故，本例检验称为t 检验。 3、确定P 值和作出推断结论

查t 界值表，得出结论为，按α=0.05水准，拒绝H 0 ，接受H 1 认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。

关于检验水准是取0.05、0.01或其他数值，要根据不同的实验而定。α取值较小，有利于提高“阳性”统计检验结果的可靠性；α取值较大，有利于发现研究总体可能存在的差异，但可靠性降低。较好的做法是精确地计算出P 值，这会对人们认识你所作的实验有很大的参考价值。二、随机化配对设计资料均数的t 检验

配对设计资料分三种情况：（1）配成对子的同对受试对象分别给予两种不同的处理；（2）同一受试对象分别接受两种不同处理；（3）同一受试对象处理前后的比较。同对或同一受试对象分别接受两种不同处理结果的比较，其目的是推断两种处理的效果有无差别；自身处理前后结果的比较，其目的是推断某种处理有无作用。因此，应该首先计算出各对差值d 的均数。当两种处理结果无差别或某种处理不起作用时，理论上差值 d 的总体均数μd =0。故可将配对设计资料的假设检验视为样本均数与总体均数μd =0的比较，配对设计资料以小样本居多，故常用t 检验。其计算公式为：

-n , /

νμ

d d

d t s s

例题2、将大白鼠配成8对，每对分别饲以正常饲料和缺乏维生素E 饲料，测得两组大白鼠肝中维生素A 的含量如下表，试比较两组大白鼠中维生素A 的含量

有无差别。

表不同饲料组大白鼠肝中维生素A 的含量（U/g ）

大白鼠配对号正常饲料组维生素E 缺乏组差数，d

d 2

1 3550 2450 1100 1210000

2 2000 2400 -400 160000

3 3000 1800 1200 1440000

4 3950 3200 750 562500

5 3800 3250 550 302500

6 3750 2700 1050 1102500

7 3450 2500 950 902500

8 3050 1750 1300 1690000 合计

----

6500

7370000

1) H 0: μd =0, H 1: μd ≠ 0, α=0.05 2)

计算统计量

7 4.2070, 193.12980-812.5 /)/(1298.193)

18(88

/)6500(7370000)

1(/)(d

S (U/g)

812.5 8

6500222

d ===-=

=-?-=

--==

===

∑∑∑νμn

S d t g U n n n d n S n

d d d d

3）确定P 值下结论

查t 界值表（双側），t > t 0.01, 7 =3.499, P<0.01 结论：按 α＝0.01 水准，拒绝H 0，接受H 1。

4）题目结论：可以认为两种饲料喂养的大白鼠肝中维生素Ａ的含量有差别，正常饲料组比缺乏维生素Ｅ饲料组的含量要高。

例3：胃癌或巨型胃溃疡13人，在实行全胃切除术前后的体重（kg ）如下：试比较手术前后体重有无变化？

时间 1 2 3 4 5 6 7 8 9 10 11 12 13

术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 50.0 41.0 51.5 72.2

d 9.50 3.50 6.00 6.50 -9.50 7.50 13.0 –6.0 -0.5 7.00 3.00 1.50 14.70

1、H 0: μd =0, H 1: μd ≠ 0, α=0.05

2、计算统计量

, 2.27 1.9044.323

)

(1.904 S (kg)

323.4132.56d =====

===

∑νt kg n

S n

d d d

3、确定P 值下结论

查t 界值表（双側），t > t 0.05, 12 =2.179, P<0.05 结论：按 α＝0.05 水准，拒绝H 0，接受H 1。 4、题目结论：可以认为术前后体重有显著性差别。

三、两组完全随机化设计资料均数的t 检验与u 检验 1、t 检验

将受试对象完全随机地分配到两组中，这两组分别接受不同的处理。这样的设计称为两组完全随机化设计（completely randomized design of two groups ）。

有些研究设计既不能作自身对比，也不便于配对。如实验中只有把受试动物杀死后才能获得所需数据，则不可能对动物在处理前后各进行一次测定；再如比较两种治疗方法对同一疾病的疗效，每个患者一般只能接受一种方法的治疗，把受试患者配成若干对在实际工作中又非常困难，这时只能进行两组间均数的比较。在两组比较的资料中，每个观察对象都应按照随机的原则进行分组，两组样本量可以相同，也可以不同，但只有在两组例数相同时检验效率才最高。统计量计算公式为：

x 212121S X

)

()(x

x X S X X t ---=---=

μμ

221-+=n n ν

???

? ??++-+-+-=

+=∑∑∑∑-21212

222

212121

1112

/)(/)()1

221n n n n n X x n x x

n n S S c x x

)1()1()1()1(2122

22112-+--+-=

n n S n S n S c

例题某医院研究乳酸脱氢同工酶（LDH ）测定对心肌梗死的诊断价值时，曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH 测定值的差别，结果如下，试问LDH 测定值在两组间有无差别？

患者（X 1） 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0 健康人（X 2） 20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 131.0

（1）、H 0：μ1=μ2 H 1：μ1≠μ2 α=0.05

本例：

.6S ,01.31X ,59.10025X ,10.310X ,1064.9S ,48.43X ,30.19742X ,80.434X ,10222

22112111==========∑∑∑∑n n

（2）、计算统计量：

将上述数据代入公式，得：

2-1010 ,3506.37217

.301.3148.43(%)

7217.3)10

101(2101010/10.31059.1002510/8.434230.1974222

1=+==-=

=+-+-+-=-νt S x x

（3）、确定P 界作出结论本例 t > t 0.05,18 =3.197, P<0.05

（4）、结论：按α=0.05 水准，拒绝H 0，接受H 1。可以认为乳酸脱氢同工酶测定值在心肌梗死与健康人之间有差别，心肌梗死患者的含量比健康人的要高。

如果例3用随机样本设计的t 检验计算得到如下结果：

0875

.7S 8615.51X 132585

.7S 5385.47X 13222111======、、、、n n

2-1313 ,536.18145

.2323

.48145

.2861

.51538.47)

(8145.2)13

131(213130875.71-135857.21-13222

1=+===

=+-++=-νt kg S x x ）（）（

查t 界值表（双側），t < t 0.05, 24 =2.064, P > 0.05

结论：按 α＝0.05 水准，接受H 0, 可以认为术前后体重有显著性差别。

2、 U 检验（两大样本均数的假设检验）

以两个正态或非正态总体独立地抽取含量分别为n 1 和 n 2 的样本，当n 1 和 n 2均较大时，比如均大于100时，那么样本均数的和与差的分布也服从正态分布，即：

)n ( ),(~)(22

1212121??????+-±σσμμn N X X

故当两样本均数较多时，即使总体分布呈偏离正态，其样本均数的分布仍近似正态分布，且这时用S 估计σ的误差较小，故可用u 检验，即用正态分布的原理作两个均数间的假设检验。

关于非正态分布资料均数差别的检验

医学上有许多资料是服从正态分布的，但有不少资料不是正态分布，例如血清抗体滴度、传染病潜伏期、动物对毒物的耐受量等。由于t 分布以原始资料呈正态分部为依据，因此非正态分布资料用t 检验是有些问题的。但当资料的分布与正态分布略有偏倚时对结果的影响不会影响太大，所以在略有偏倚时t 检验仍是可以使用的。

当资料与正态分布偏倚较大时，可有以下两种处理方法。 1）当n 较大时，由于样本均数在n 较大时仍可近似正态分布，

)n ( ),(~)(22

1212121??????+-±σσμμn N X X

且这时用S 估计σ的误差较小。一般当每组例数大于100时仍可用下式作统计检验：

1X X S S X X U +-=

因U 近似正态分布，判断的标准是： ∣U ∣<1.96, P>0.05, 差别无统计意义；

∣U ∣≥1.96, P<0.05, 差别有统计意义； ∣U ∣≥2.58, P<0.01, 差别有高度统计意义。

2）当n 较小时，可将数据进行转换使其近似正态后再作检验。例如传染并的潜伏期，血清抗体滴度等资料经对数转换后近似正态分布，然后在对数条件下计算均数、标准差、标准误（不求反对数），并作t 检验。

例题某医院在心肾内科普查工作中，测得40~50岁年龄组男性193人的β脂值蛋白平均数为397.5(mg%)，标准差为104.30(mg%); 女性128人的β脂蛋白平均数为357.89(mg%),标准差为89.67(mg%); 问男性与女性β脂蛋白平均数有无差别？

（1）H 0：μ1=μ2 H 1：μ1≠μ2 α=0.05 （2）检验统计量公式为：

121212

12121)

()

()(n S n S X X n n X X u +-=

---=

σσμμ

将上述数据代入公式得：

636.3128

.8919330.104)89.35759.397(2

=+-==

（3）96.105.0=>u u P<0.05 结论：按α=0.05 水准，拒绝H 0，接受H 1。认为男性与女性β脂蛋白平均数有差别，男性高于女性。

第6讲 DD-t检验与u检验(2004)

均数差异的假设检验假设检验的具体方法，通常是以选定的检验统计量来命名的，如t检验要用特定的公式计算检验统计量t值，u检验要用特定的公式计算检验统计量u值。应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。一、单组完全随机化设计资料均数的t检验和u检验从一个总体中完全随机地抽取一部分个体进行研究，这样的设计称为单组完全随机化设计（completely randomized design of single group）。例题1：根据大量调查，已知健康成年男子脉搏均数为72次/分，某医生在某一山区随机抽查了25名健康成年男子，求得其脉搏均数为74.2次/分，标准差为6.0次/分，能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数？这两个均数不等有两个可能：（1）由于抽样误差所致；（2）由于环境条件的影响。如何作出判断呢？在统计上是通过假设检验来回答这个问题。以下介绍建设检验（t检验）的思想方法与步骤。 1、建立检验假设和确定检验水准 H0：μ1=μ0（=72次/分）：H1：μ1≠μ0（=72次/分）：α=0.05 本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别？ μ是未知的，可以假设μ等于某一定值μ0，μ与μ0的差等于零，这样的假设称为无差异假设或零假设(null hypothesis) 记为H0：μ1=μ0 表示该山区的环境条件对脉搏数无影响，他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符号为H1 ，它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上，因为H0比较单纯明确，而H1却包含着各种情况。检验水准(size of test )亦称显著性水准（significance level）,符号为α，在实际工作中常取0.05 或0.01。 2、选定检验方法和计算统计量本例：n=25, - x=74.2次/分，S=6.0次/分。检验统计量公式为：

假设检验的基本步骤

————————————————————————————————作者：————————————————————————————————日期：

假设检验的基本步骤 (三)假设检验的基本步骤统计推断１.建立假设检验,确定检验水准 H０和H1假设都是对总体特征的检验假设，相互联系且对立。Ｈ0总是假设样本差别来自抽样误差，无效／零假设 H1是来自非抽样误差，有单双侧之分，备择假设。检验水准，a=0.0５检验水准的含义２．选定检验方法,计算检验统计量选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题，一般计量资料用t检验和u检验; 计数资料用χ2检验和ｕ检验。 3.确定Ｐ值,作出统计推理 P≤ａ，拒绝H0,接受H１ P＞a,按a=0.05水准,不拒绝H0，无统计学意义或显著性差异假设检验结论有概率性，无论使拒绝或不拒绝Ｈ0,都有可能发生错误 (四）两均数的假设检验（各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论) ｕ检验适用条件 t检验适用条件 t检验和u检验 1.样本均数与总体均数比较 2.配对资料的比较/成组设计的两样本均数的比较配对设计的情况：3点 3. 两个样本均数的比较 (1）两个大样本均数比较的u检验（2)两个小样本均数比较的t检验 (五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误） 1.两类错误拒绝正确的H０称Ⅰ型错误－弃真，用检验水准α表示,α＝０.０５,犯I型错误概率为0．05，理论上平均每1０0次抽样有5次发生此类错误；接受错误的H0称Ⅱ型错误－存伪。用β表示，(１-β)为检验效能或把握度，意义为两总体有差异，按α水准检出差别的能力，1－β＝０.9,若两总体确有差别，理论上平均每１00次抽样有90次得出有差别的结论。两者的关系:α愈大β愈小;反之α愈小β愈大。 2．假设检验中的注意事项（1)随机化：代表性和均衡可比性 (2）选用适当的检验方法 (３）正确理解统计学意义 (4）结论不绝对 (5）单侧与双侧检验的选择四.分类变量资料的统计描述

8第八章独立样本t检验-刘红云版心理统计教材课后习题

练习题 1.描述一个适合做独立测量t检验的研究的主要特征。独立测量t检验的估计标准误测量的是什么？ 2.单样本t检验解决的问题是什么？它与独立样本t检验有何不同？ 3.描述方差齐性的前提，并说明它为什么对于独立测量t检验很重要？ 4.从某个人多次视反应时测量结果随机抽出40个数据，再从其听反应时的多次测量结果中随机抽取40个数据，进行视、听反应时差异检验时应选择何种方法，为什么？ 5.一个样本的SS=63，第二个样本SS=45。 a.假定两个样本的n=10，找到每个样本的方差，计算合并方差。你能发现合并方差确实在两个样本方差的正中间。 b.现在假设第一个样本n=10，第二个样本n=16，找到每个样本的方差，计算合并方差。你能发现合并方差更接近大样本的方差（n=16）。 6.12名被试作为实验组，经过训练后测量深度知觉，结果误差的平均μ1=4㎝，标准差S1=2㎝;另外12名被试作为控制组不加任何训练，测量结果μ2=6.5㎝，S1=2.5㎝，问训练是否明显减小了深度知觉的误差？ 7.一些因素影响了独立测量t检验的值。一些因素影响了t值的分子，一些影响了分母中估计标准误的大小。对于下面每一项，指出这些因素影响了t值的分子还是分母，并确定这个因素会增大t值（远离0)还是减小t值（接近0）。在每个例子里，假定所有其他的因素保持不变。 a.增加两个样本均值差异。 b.增加两个样本量。 c.增加样本方差。 8.在独立测量假设检验中，两个样本均值的差异被用来检验关于两个总体均值的假设。样本均值差异不是完全等于总体均值差异的，估计标准误测量了平均来说可能有多少合理的差异。对于下面的情景，计算样本均值差异的估计标准误。 a.第一个样本n=8，SS=416；第二个样本n=8，SS=480。 b.第一个样本n=8，SS=170；第二个样本n=4，SS=70。 9.在一个考察专业学习表现的研究中，Bahrick和Hall（1991)测试了两组被试离开高中50年后他们的代数知识。一组被试接受了大学数学课程，另一组在大学中没有更高级的数学课程。下表的数据表示了与他们研究显示的结果。数据显示两组之间有显著差异吗？使用α=0.05的双侧检验。没有学习大学数学学习大学数学 n=4 n=8 ?x=42 ?x=50 SS=100 SS=140

7假设检验基础与t检验练习题

第七章假设检验基础 1.第Ⅰ类错误的概念是： A.H0是不不对的，统计检验结果未拒绝H0 B.H0是对的，统计检验结果未拒绝H0 C.H0是不不对的，统计检验结果拒绝H0 D.H0是对的，统计检验结果拒绝H0 2.关于假设检验，下?面说法正确的是： A.单侧检验优于双侧检验 B.如果P＞α，则接受H0犯错误的可能性很?小 C.采?用配对检验还是两样本检验是由实验设计?方案所决定的 D.检验?水准α只能取0.05 3.两样本均数?比较的t检验，差别有统计意义时，P越?小，说明： A.两样本均数差别越?大 B.两总体均数差别越?大 C.越有理理由认为两样本均数不不同 D.越有理理由认为两总体均数不不同 4.两?小样本均数?比较，当?方差不不?齐时，可选择： A.t’检验 B.t检验 C.F检验 D.χ2检验 5.两样本均数?比较时，在其他条件相同情况下，下列列选项中检验效能最?大的是： A.α=0.05，n1=n2=20 B.α=0.01，n1=n2=30 C.α=0.05，n1=n2=30 D.α=0.01，n1=n2=20 E.α=0.05，n1=20，n2=30 6.t检验的应?用条件是、、。 7.简述假设检验步骤。

8.已知正常?人?乙酰胆碱酯酶的平均值为1.44单位，现测得43例例慢性?气管炎患者的?乙酰胆碱酯酶平均值为2.17单位，标准差为0.74单位，问慢性?气管炎患者的平均?乙酰胆碱酯酶与正常?人有?无差异？ 9.某地随机抽取40岁正常男?子20名和40岁正常?女女?子15名，测定红细胞计数，男?女女样本均数和样本标准差分别为=4.66，s 1=0.47和=4.18，s2=0.45，试判断40岁正常男?女女红细胞计数总体均数是否相等。 10.某研究者为?比较?耳垂?血和?手指?血的?白细胞数，调查12名成年年?人，同时采取?耳垂?血和?手指?血?见下表，试?比较两者的?白细胞数有?无不不同。表成?人?耳垂?血和?手指?血?白细胞数(10g/L) 编号?耳垂?血?手指?血 19.7 6.7 2 6.2 5.4 37.0 5.7 4 5.3 5.0 58.17.5 69.98.3 7 4.7 4.6 8 5.8 4.2 97.87.5 108.67.0 11 6.1 5.3 129.910.3