第5讲t检验与u检验(2004).

第5讲t检验与u检验(2004).
第5讲t检验与u检验(2004).

均数差异的假设检验

假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。

应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。一、单组完全随机化设计资料均数的t检验和u检验

从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。

例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。如何作出判断呢?在统计上是通过假设检验来回答这个问题。以下介绍建设检验(t检验)的思想方法与步骤。

1、

建立检验假设和确定检验水准

H0:μ1=μ0(=72次/分):H1:μ1≠μ0(=72次/分):α=0.05

本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?

μ是未知的,可以假设μ等于某一定值μ0,μ与μ0的差等于零,这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:μ1=μ0

表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符

号为H1

它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。

检验水准(size of test )亦称显著性水准(significance level),符号为α,在实际工作中常取0.05 或0.01。

2、选定检验方法和计算统计量

本例:n=25, -

x=74.2次/分,S=6.0次/分。

检验统计量公式为:

1

-n , 0

=-=νμx

s x t

将以上数据代入公式,得:

24

1-25 , 1.833 25/0.60

.722.74===-=

νt

要根据研究类型和统计推断目的选用不同检验方法,不同检验方法有相应的检验统计量,本例的检验统计量t 服从 ν=n-1 的 t 分布。建设检验方法通常是以检验统计量来命名的,故,本例检验称为t 检验。 3、确定P 值和作出推断结论

查t 界值表, 得出结论为,按α=0.05水准,拒绝H 0 ,接受H 1 认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。

关于检验水准是取0.05、0.01或其他数值,要根据不同的实验而定。α取值较小,有利于提高“阳性”统计检验结果的可靠性;α取值较大,有利于发现研究总体可能存在的差异,但可靠性降低。较好的做法是精确地计算出P 值, 这会对人们认识你所作的实验有很大的参考价值。

二、 随机化配对设计资料均数的t 检验

配对设计资料分三种情况:(1)配成对子的同对受试对象分别给予两种不同的处理;(2)同一受试对象分别接受两种不同处理;(3)同一受试对象处理前后的比较。同对或同一受试对象分别接受两种不同处理结果的比较,其目的是推断两种处理的效果有无差别;自身处理前后结果的比较,其目的是推断某种处理有无作用。 因此,应该首先计算出各对差值d 的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值 d 的总体均数μd =0。故可将配对设计资料的假设检验视为样本均数与总体均数μd =0的比较,配对设计资料以小样本居多,故常用t 检验。其计算公式为:

1

-n , /

==

-=

νμ

n

d d

d

d

d t s s

例题2、将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E 饲料,测得两组大白鼠肝中维生素A 的含量如下表,试比较两组大白鼠中维生素A 的含量

有无差别。

表 不同饲料组大白鼠肝中维生素A 的含量(U/g )

大白鼠 配对号 正常饲料组 维生素E 缺乏组 差数,d

d 2 1 3550 2450 1100 1210000 2 2000 2400 -400 160000 3 3000 1800 1200 1440000 4 3950 3200 750 562500 5 3800 3250 550 302500 6 3750 2700 1050 1102500 7 3450 2500 950 902500 8 3050 1750 1300 1690000 合计

----

6500

7370000

1) H 0: μd =0, H 1: μd ≠ 0, α=0.05 2)

计算统计量

7 4.2070, 193.12980-812.5 /)/(1298.193)

18(88

/)6500(7370000)

1(/)(d

S (U/g)

812.5 8

6500222

===-=

=-?-=

--==

===

∑∑∑νμn

S d t g U n n n d n S n

d d d d

d

3)确定P 值下结论

查t 界值表(双側),t > t 0.01, 7 =3.499, P<0.01 结论:按 α=0.01 水准,拒绝H 0,接受H 1。

4)题目结论:可以认为两种饲料喂养的大白鼠肝中维生素A的含量有差别,正常饲料组比缺乏维生素E饲料组的含量要高。

例3:胃癌或巨型胃溃疡13人, 在实行全胃切除术前后的体重(kg )如下:试比较手术前后体重有无变化?

时间 1 2 3 4 5 6 7 8 9 10 11 12 13

术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 50.0 41.0 51.5 72.2

d 9.50 3.50 6.00 6.50 -9.50 7.50 13.0 –6.0 -0.5 7.00 3.00 1.50 14.70 1、H 0: μd =0, H 1: μd ≠ 0, α=0.05 2、计算统计量

12

, 2.27 1.9044.323

)(1.904 S (kg)

323.4132.56d =====

===∑νt kg n

S n

d d d

3、确定P 值下结论

查t 界值表(双側),t > t 0.05, 12 =2.179, P<0.05 结论:按 α=0.05 水准,拒绝H 0,接受H 1。 4、题目结论:可以认为术前后体重有显著性差别。

三、 两组完全随机化设计资料均数的t 检验与u 检验 1、t 检验

将受试对象完全随机地分配到两组中,这两组分别接受不同的处理。这样的设计称为两组完全随机化设计(completely randomized design of two groups )。

有些研究设计既不能作自身对比,也不便于配对。如实验中只有把受试动物杀死后才能获得所需数据,则不可能对动物在处理前后各进行一次测定;再如比较两种治疗方法对同一疾病的疗效,每个患者一般只能接受一种方法的治疗,把受试患者配成若干对在实际工作中又非常困难,这时只能进行两组间均数的比较。在两组比较的资料中,每个观察对象都应按照随机的原则进行分组,两组样

本量可以相同,也可以不同,但只有在两组例数相同时检验效率才最高。 统计量计算公式为:

2

1

2

1

x 212121S X

)

()(x

x

x X S X X t ---=---=

μμ

221-+=n n ν

?

??? ??++-+-+-=

+=∑∑∑∑-21

212

222

212121

2

1112

/)(/)()11(

221n n n n n X x n x x

n n S S c x x

)1()1()1()1(2122

22112-+--+-=

n n S n S n S c

例题 某医院研究乳酸脱氢同工酶(LDH )测定对心肌梗死的诊断价值时,曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH 测定值的差别,结果如下,试问LDH 测定值在两组间有无差别?

患者(X 1) 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0 健康人(X 2) 20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 131.0

(1)、H 0:μ1=μ2 H 1:μ1≠μ2 α=0.05 本例:

74

.6S ,01.31X ,59.10025X ,10.310X ,1064.9S ,48.43X ,30.19742X ,80.434X ,10222

2

22112111==========∑∑∑∑n n

(2)、计算统计量:

将上述数据代入公式,得:

18

2-1010 ,3506.37217

.301.3148.43(%)

7217.3)10

1

101(2101010/10.31059.1002510/8.434230.1974222

1=+==-=

=+-+-+-=-νt S x x

(3)、确定P 界作出结论 本例 t > t 0.05,18 =3.197, P<0.05

(4)、结论: 按α=0.05 水准,拒绝H 0,接受H 1。可以认为乳酸脱氢同工酶测定值在心肌梗死与健康人之间有差别,心肌梗死患者的含量比健康人的要高。

如果例3用随机样本设计的t 检验计算得到如下结果:

0875

.7S 8615.51X 132585

.7S 5385.47X 13222111======、、、、n n

24

2-1313 ,536.18145

.2323

.48145

.2861

.51538.47)

(8145.2)13

1

131(213130875.71-135857.21-13222

1=+===

-=

=+-++=-νt kg S x x )()(

查t 界值表(双側),t < t 0.05, 24 =2.064, P > 0.05

结论:按 α=0.05 水准,接受H 0, 可以认为术前后体重有显著性差别。

2、 U 检验(两大样本均数的假设检验)

以两个正态或非正态总体独立地抽取含量分别为n 1 和 n 2 的样本,当n 1 和 n 2均较大时,比如均大于100时,那么样本均数的和与差的分布也服从正态分布,即:

)n ( ),(~)(22

2

1212121??????+-±σσμμn N X X

故当两样本均数较多时,即使总体分布呈偏离正态,其样本均数的分布仍近似正态分布,且这时用S 估计σ的误差较小,故可用u 检验,即用正态分布的原理作两个均数间的假设检验。

关于非正态分布资料均数差别的检验

医学上有许多资料是服从正态分布的,但有不少资料不是正态分布,例如血清抗体滴度、传染病潜伏期、动物对毒物的耐受量等。由于t 分布以原始资料呈正态分部为依据,因此非正态分布资料用t 检验是有些问题的。但当资料的分布与正态分布略有偏倚时对结果的影响不会影响太大,所以在略有偏倚时t 检验仍是可以使用的。

当资料与正态分布偏倚较大时,可有以下两种处理方法。 1)当n 较大时,由于样本均数在n 较大时仍可近似正态分布,

)n ( ),(~)(22

2

1212121??????+-±σσμμn N X X

且这时用S 估计σ的误差较小。一般当每组例数大于100时仍可用下式作统计检验:

2

22

121

X X S S X X U +-=

因U 近似正态分布,判断的标准是: ∣U ∣<1.96, P>0.05, 差别无统计意义;

∣U ∣≥1.96, P<0.05, 差别有统计意义; ∣U ∣≥2.58, P<0.01, 差别有高度统计意义。

2)当n 较小时,可将数据进行转换使其近似正态后再作检验。例如传染并的潜伏期,血清抗体滴度等资料经对数转换后近似正态分布,然后在对数条件下计算均数、标准差、标准误(不求反对数),并作t 检验。

例题 某医院在心肾内科普查工作中,测得40~50岁年龄组男性193人的β脂值蛋白平均数为397.5(mg%),标准差为104.30(mg%); 女性128人的β脂蛋白平均数为357.89(mg%),标准差为89.67(mg%); 问男性与女性β脂蛋白平均数有无差别?

(1)H 0:μ1=μ2 H 1:μ1≠μ2 α=0.05 (2)检验统计量公式为:

2

2

2

121212

22

1

2

12121)

()

()(n S n S X X n n X X u +-=

+

---=

σσμμ

将上述数据代入公式得:

636.3128

67

.8919330.104)89.35759.397(2

2

=+-==

u

(3)96.105.0=>u u P<0.05 结论: 按α=0.05 水准,拒绝H 0,接受H 1。 认为男性与女性β脂蛋白平均数有差别,男性高于女性。

第三章 假设检验

第三章 假设检验 3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。已知这种元 件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确 定这批元件是否合格。 解: {}01001:1000, H :1000 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5; x=zeros(1,n); x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1:n x2=x2+(x(1,i)-x1)^2;

end x2=x2/n; S=sqrt(x2); 010110 2: 3.25 H :t 3.252, S=0.0117, n=5 0.3419 H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.99512 0 V=t>t (1)0.01,(4) 4.6041, 3.25n t t t H ααα- ??-?? ?? ==<∴Q 本题中,接受认为这批矿砂的镍含量为。 3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S == 2N(,),μσ设总体为正态分布试在水平5%检验假设: 0101() H :0.5% H :0.5%() H :0.04% H :0.0.4% i ii μμσσ≥<≥< {}0.95()0.452% S=0.035%-4.1143 (1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。取检验统计量为X 本题中,代入上式得: 0.452%-0.5% 拒绝域为: V=t >t 本题中,0 1 4.1143H <=∴t 拒绝

医药数理统计第六章习题(检验假设和t检验)

第四章抽样误差与假设检验 练习题 一、单项选择题 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~ 9.1×109/L,其含义是 A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95%

答案:E D C D E 二、计算与分析 1. 为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L ,标准差为1.5g/L ,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案] 样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 101.4X =, 1.5S =,450n =,0.07450 X S n = == 95%可信区间为 下限:/2.101.4 1.960.07101.26X X u S α=-?=-(g/L) 上限:/2.101.4 1.960.07101.54X X u S α+=+?=(g/L) 即该地成年男子红细胞总体均数的95%可信区间为101.26g/L ~101.54g/L 。 2. 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl ,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl ,标准差为30mg/dl 。问题: ①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间; ③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案] ① 均数的标准误可以用来衡量样本均数的抽样误差大小,即 30S =mg/dl,100n = 3.0100 X S n = == ② 样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 207.5X =,30S =,100n =,3X S =,则95%可信区间为 下限:/2.207.5 1.963201.62X X u S α=-?=-(mg/dl )

t检验、u检验、卡方检验、F检验、方差分析

统计中经常会用到各种检验,如何知道何时用什么检验呢,根据结合自己的工作来说一说: t检验有单样本t检验,配对t检验和两样本t检验。 单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。 配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。 u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t 分布),当x为未知分布时应采用秩和检验。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用F检验。 简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。 在t检验中,如果是比较大于小于之类的就用单侧检验,等于之类的问题就用双侧检验。 卡方检验 是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。方差分析 用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。 其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括 单因素方差分析即完全随机设计或成组设计的方差分析(one-way ANOVA):用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因

第五章统计推断

第五章统计推断 ?总体与样本之间的关系 -从总体到样本的研究。 -由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、χ2分布和F分布。?对总体做统计推断的两种途径 –先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis) –通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter) ?本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。 一、假设检验 假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。 小概率原理 在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。 在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α” 例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法? 小概率原理用于显著性检验 例5.2用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.23 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中? 解:1 样本平均数满足何种分布?

t检验和u检验

t检验和u检验 简而言之,t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x 为未知分布时应采用秩和检验。 一、样本均数与总体均数比较的t检验 样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值) 有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。 上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下: 1. 建立假设 H0:µ=µ0=72次/分,H0:µ>µ0,检验水准为单侧0.05。 2. 计算统计量 进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。 3. 确定概率,作出判断 以自由度v(样本含量n减1)查t界值表,0.0250或µd<0,即差值的总体均数不为“0”,检验水准为0.05。 2. 计算统计量 进行配对设计t检验时 t值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。 3. 确定概率,作出判断 以自由度v(对子数减1)查t界值表,若P<0.05,则拒绝H0,接受H1,若P>=0.05,则还不能拒绝H0。

第5讲t检验与u检验(2004).

均数差异的假设检验 假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。 应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。一、单组完全随机化设计资料均数的t检验和u检验 从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。 例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。如何作出判断呢?在统计上是通过假设检验来回答这个问题。以下介绍建设检验(t检验)的思想方法与步骤。 1、 建立检验假设和确定检验水准 H0:μ1=μ0(=72次/分):H1:μ1≠μ0(=72次/分):α=0.05 本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别? μ是未知的,可以假设μ等于某一定值μ0,μ与μ0的差等于零,这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:μ1=μ0 表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符 号为H1 , 它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。 检验水准(size of test )亦称显著性水准(significance level),符号为α,在实际工作中常取0.05 或0.01。 2、选定检验方法和计算统计量 本例:n=25, - x=74.2次/分,S=6.0次/分。 检验统计量公式为:

应用数理统计吴翊李永乐第三章 假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响?(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。 3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件, 测得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分 布,试在显著水平0.05下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。

3.3某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从 一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(2 /cm kg )。设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提高? 解: (1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13 /4020 /u 00 == -= n X σμ (3)否定域{}α->=1u u V (4)给定显著性水平01.0=α时,临界值33.21=-αu (5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。 3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解: 010110 2: 3.25 H :t X 3.252, S=0.0117, n=5 0.3419 H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.99512 0 V=t>t (1)0.01,(4) 4.6041 , 3.25n t t t H ααα- ??-?? ?? ==<∴Q 本题中,接受认为这批矿砂的镍含量为。

T检验_F检验和卡方检验

什么是Z检验? Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数>平均数的差异是否显著。 当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验。 Z检验的步骤 第一步:建立虚无假设,即先假定两个平均数之间没有显著差异。 第二步:计算统计量Z值,对于不同类型的问题选用不同的统计 量计算方法。 1、如果检验一个样本平均数()与一个已知的总体平均数(μ0) 的差异是否显著。其Z值计算公式为: 其中: 是检验样本的平均数; μ0是已知总体的平均数; S是样本的方差; n是样本容量。 2、如果检验来自两个的两组样本平均数的差异性,从而判断它 们各自代表的总体的差异是否显著。其Z值计算公式为: 其中: 是样本1,样本2的平均数; S1,S2是样本1,样本2的标准差; n1,n2是样本1,样本2的容量。 第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据 Z值与差异显著性关系表作出判断。如下表所示: 第四步:根据是以上分析,结合具体情况,作出结论。 Z检验举例 某项教育技术实验,对实验组和控制组的前测和后测的数据分别 如下表所示,比较两组前测和后测是否存在差异。 实验组和控制组的前测和后测数据表

前测实验组 n1 = 50 S1a = 14 控制组 n2 = 48 S2a = 16 后测实验组 n1 = 50 S1b = 8 控制组 n2 = 48 S2b = 14 由于n>30,属于大样本,所以采用Z检验。由于这是检验来自两 个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。 计算前要测Z的值: ∵|Z|=0.658<1.96 ∴ 前测两组差异不显著。 再计算后测Z的值: ∵|Z|= 2.16>1.96 ∴ 后测两组差异显著。 t检验是对各回归系数的显著性所进行的检验,是指在多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验。t检验还可以用来检验样本为来自一元正态分布的总体的期望,即均值;和检验样本为来自二元正态分布的总体的期望是否相等) 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 自由度:v=n – 1 T检验注意事项 要有严密的抽样设计随机、均衡、可比 选用的检验方法必须符合其适用条件(注意:t检验的前提是资料 服从正态分布) 单侧检验和双侧检验 单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ 错误的可能性大。 假设检验的结论不能绝对化 不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类 错误

第五章 准实验设计

第五章准实验设计 第一节单组准实验设计 一、准实验设计 (一)定义:介于真实验和非实验之间的一种设计类型,能在一定程度上控制无关变量,操纵自变量、控制实验处理,但不能随机的选择和分配被试。 准实验设计的应用:人格研究、临床心理的研究、社会心理以及教育心理研究常常采用准实验设计。 准实验设计的特点 不需要随机化程序(与实验或真实验最大的区别);研究者只能选择那些已具有了某种不同程度特征的被试。而不能像真实验那样从总体中随机选取被试或随机分组。 能有效解决生态效度和外部效度问题,但不能从准实验研究结果中作出因 果关系的结论,其主要原因是在研究的变量上缺乏严格控制,因而其内部效度较低。 现场研究中采用最多的是准实验设计,不过准实验并不一定都在现场进行。 例:霍桑实验(照明实验、福利实验、群体实验、谈话实验); ?社会心理学家所说的“霍桑效应”也就是所谓“宣泄效应”。霍桑工厂是美国西部电器公司的一家分厂。为了提高工作效率,这个厂请来包括心理学家在内的各种专家,在约两年的时间内找工人谈话两万余人次,耐心听取工人

对管理的意见和抱怨,让他们尽情地宣泄出来。结果,霍桑厂的工作效率大大提高。这种奇妙的现象就被称作“霍桑效应”。 准实验设计与实验设计的关键区别 ?它和真实验的主要区别在于,准实验中没有运用随机化程序进行被试选择和实验处理;也不能完全主动地操纵自变量。 ?在实验设计中,样本的随机分配形成了具有完全可比性的两个组别:实验组和控制组。 ?准实验设计用对照组取代了实验设计中的控制组。研究者努力创造一个与实验组在所有重要方面都尽可能相似的对照组,但与随机分配产生的控制组而言,它的可比性已经大为逊色了。 时间序列设计 【时间系列设计】 要对实验组做周期性的一系列测量,并在测 量的这一时间系列中间呈现实验变量(X),然后比 较实验变量前后的一系列测量记录是否有显著差异。 (一)模式 O1O2O3O4XO5O6O7O8 (二)应用 坎贝尔关于康涅狄格州的交通死亡人数与实施严 惩制度的关系的研究。 可能出现的结果类型

u检验和t检验

例19.3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,能否据此认为山区成年男子的脉搏高于一般? 据题意,可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25. H0:μ=μ0 H1:μ>μ0 α=0.05(单侧检验)

例19.4 若例19.3中总体标准差σ未知,但样本标准差已求出,s=6.5次/分,余数据同例19.3. 据题意,与例19.3不同之处在于σ未知,可用t检验。 H0:μ=μ0 H1:μ>μ0 α=0.05(单侧检验) 本例自由度v=25-1=24,查t界值表(单侧)(附表19-1)得t0.05(24)=1.711.算得的统计量t=1.692<1.711,P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为该山区成年男子的脉搏高于一般。 二、配对资料的比较

H0:该药治疗前后的舒张压无变化,即μd=0 H1:该药治疗前后的舒张压有变化,即μd≠0 α=0.05

自由度v=n-1=8,查t界值表得t0.05(8)=2.306,t0.01(8)=3.355,本例t=3.714> t0.01(8),P<0.01,按α=0.05检验水准拒绝H0,接受H1,可认为治疗前后舒张压有变化,即该药有降压作用。 三、完全随机设计的两样本均数的比较 亦称成组比较。目的是推断两样本各自代表的总体均数μ1与μ2是否相等。根据样本含量n 的大小,分u检验与t检验。 (一)u检验可用于两样本含量n1、n2、均足够大时,如均大于50或100. 公式(19.9) 算得的统计量为u 值,按表19-3所示关系作出判断。 例19.6某地抽样调查了部分健康成人红细胞数,其中男性360人,均数为4.660×1012/L,标准差为0.575×1012/L;女性255人,均数为4.178×1012/L,标准差为0.291×1012/L,试问该地男、女红细胞数的均数有无差别? H0:μ=μ0 H1:μ≠μ0 α=0.05 今x1=4.660×1012/L,s1=0.575×1012/L,n1=360; x2=4.1781012/L,s2=0.2911012/L,n2=255.

t检验u检验卡方检验F检验方差分析

t检验u检验卡方检验F检验方差分析 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

统计中经常会用到各种检验,如何知道何时用什么检验呢,根据结合自己的工作来说一 t检验有单样本t检验,配对t检验和两样本t检验。 单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。 配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。 u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用F检验。 简单的说就是检验两个样本的方差是否有显着性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。

在t检验中,如果是比较大于小于之类的就用单侧检验,等于之类的问题就用双侧检验。卡方检验 是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。 方差分析 用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysisofvariance,ANOVA)由英国统计学家首先提出,以F命名其统计量,故方差分析又称F检验。 其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括 单因素方差分析即完全随机设计或成组设计的方差分析(one-wayANOVA): 用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completelyrandomdesign)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。两因素方差分析即配伍组设计的方差分析(two-wayANOVA): 用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对象不同时间(或部位)重复多次测量

t检验和u检验 统计学

t检验和u检验统计学

§9.4 t 检验和u 检验 ? 假设检验的方法通常是以选定的检验统计量而命名的,如t 检验和u 检验 ? t 检验(t -test )的应用条件: ①正态性 变量x 服从正态分布 ②方差齐性 两总体方差相等 一、样本均数与总体均数的比较 ? 总体均数 是指已知的理论值或经大量观测所得到的稳定值,记作μ0 例9-15 已知某小样本中含CaCO 3的真值是20.7mg/L 。现用某法重复测定15次,CaCO 3含量(mg/L )如下,问该法测得的均数与真值有无差别? 20.99 20.41 20.62 20.75 20.10 20.00 20.80 20.91 0 1 2 3 4 5 -1 -2 -3 -4 -5 0.0 0.1 0.2 0.3 0.4 ν=3 ν=1 ν=∞ (标准正态分布)

22.60 22.30 20.99 20.41 20.50 23.00 22.60 1.建立假设,确定检验水准 H0:μ=μ0H1:μ≠μ0α=0.05 2.选定检验方法,计算检验统计量t值 x=ΣX/n=316.98/15=21.13 S= () 1 2 2 - ∑ - ∑ n n x x = () 1 15 15 98 . 316 98 . 6711 2 - - =0.98 按公式9-16计算t=15 98 .07. 20 13 . 21- =1.70 3.确定P值,判断结果 ν=n-1=15-1=14 查表9-8 t界值表,t0.05,14=2.145 现t=1.70,1.70<2.145,故P>0.05,按α=0.05水准,不拒绝H0,尚不能认为该法测得的均数与真值不同(统计结论)。 表9-8 t界值表 自由度概率P ν双侧: 0.10 0.05 0.02 0.01 单侧: 0.05 0.025 0.01 0.005 1 6.314 12.706 31.821 63.657 2 2.920 4.30 3 6.965 9.925 3 2.353 3.182 4.541 5.841 4 2.132 2.776 3.747 4.604

计量经济学第三章课后习题详解

2011年各地区的百户拥有家用汽车量等数据 北京 天津 河北 山西 内蒙 古 辽宁 吉林 黑龙 江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 一、研究的目的和要求 经济增长,公共服务、市场价格、交通状况,社会环境、政策因素都会影响中国汽车拥有量。为了研究一些主要因素与家用汽车拥有量的数量关系,选择“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”等变量来进行研究和分析。 为了研究影响2011年各地区的百户拥有家用汽车量差异的主要原因,分析2011年各地区的百户拥有家用汽车量增长的数量规律,预测各地区的百户拥有家用汽车量的增长趋势,需要建立计量经济模型。 二、模型设定 为了探究影响2011年各地区的百户拥有家用汽车量差异的主要原因,选择百户拥有家用汽车量为被解释变量,人均GDP、城镇人口比重、交通工具消费价格指数为解释变量。 首先,建立工作文件、选择数据类型“integer data”、“Start date”中输入“1”,“End date”中

输入“31”,在EViews命令框直接键入“data Y X2 X3 X4”,在对应的“Y X2 X3 X4”下输入或粘贴相应的数据。 探索将模型设定为线性回归模型形式:= 三、估计参数 在命令框中输入“LS Y C X2 X3 X4”,回车即出现下面的回归结果: 根据数据,模型估计的结果写为: t = = = F= n=31 四、模型检验 1.统计检验 (1)拟合优度:由上表中的数据可以得到: =,修正的可决系数为=,这说明模型对样本的拟合一般。说明解释变量“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”联合起来对被解释变量“百户拥有家用汽车量”做了绝大部分的解释。 (2)F检验:针对 :=0,给定显著水平=,在F分布表中查出自由度为k-1=3和n-k=27的临界值 (3,27)=,由上表可知F=>(3,27)=,应拒绝原假设:=0,说明回归方程显 著,即“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”变量联合起来确实对“百户拥有家用汽车量”确实有显著影响。 (3)t检验:分别针对 :=0,给定显著水平=查t分布表得自由度为n-k=31-4=27临界值 (n-k)=(27)=, 与对应的t统计量分别为、、、,其绝对值均大于 (n-k)=(27)=,这说明在显著性水平=下,分别都应当拒绝:=0,也就是说,当在其他解释变量不变的情况下,解释变量“人均地区生产总值”(X2)、“城镇人口比重”(X3)、“交通工具消费价格指数”(X4)分别对被解释变量“百户拥有家用汽车量”(Y)都有显著的影响。 (4)p值判断:与 对应的p值分别为:、、、,均,表明在小于,表明在显著水平=的水平下,对 应解释变量对被解释变量影响显著。 检验的依据: 1>可决系数越大,说明拟 合程度越好。 2>F的值与临界值比较, 若大于临界值,则否定原假设,回归方程是显著的;若小于临界值,则接受原假设,回归方程不显著。 3>t的值与临界值比较, 若大于临界值,则否定原假设,系数都是显著地;若小于临界值,则接受原假设,系数不显著。

相关文档
最新文档