数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总

数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总
数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总

教学单元案例: 参数估计与假设检验

北京化工大学 李志强

教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用

(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;

(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;

(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令

教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟

教学对象:大一各专业皆可用

一、统计问题 引例

例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:

775,816,834,836,858,863,873,877,885,901

问:新产品亩产是否超过了800斤?

例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2

σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)

求2

σ的95%置信区间。

例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .

(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.

二 统计的基本概念: 总体、个体和样本

(1)总体与样本

总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体

比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.

简单随机样本

对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:

一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.

按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.

从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.

从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.

(2)样本函数与统计量

设n x x x ,,,21 为总体的一个样本,称

??= (n x x x ,,,21 )

为样本函数,其中?为一个连续函数。如果?中不包含任何未知参数,则称?(n x x x ,,,21 )为一个统计量。

2、统计量

(1)常用统计量

样本均值

.11

∑==n

i i x n x

样本方差

∑=--=n

i i

x x n S 1

2

2.)(11 (与概率论中的方差定义不同)

样本标准差

.)(111

2∑=--=n

i i x x n S 样本k 阶原点矩

∑===n i k

i k k x n M 1

.,2,1,1

样本k 阶中心矩

∑==-='n

i k i k

k x x n M 1

.,3,2,)(1 (二阶中心矩∑=-=n i i X X n S 1

2

2

)(1*与概率论中的方差定义相同)

例6.2:用测温仪对一物体的温度测量5次,其结果为(℃):1250,1265,1245,1260,1275,求统计计量X ,S 2

和S 的观察值.,,2s s x 和

(2)统计量的期望和方差

μ=)(X E ,n

X D 2

)(σ=

22)(σ=S E ,2

21)*(σn

n S E -=

, 其中∑=-=n i i X X n S 1

2

2

)(1*,为二阶中心矩。

)(~,,,21x F X X X n ,i.i.d ,独立同分布。无限总体抽样。

(3) 随机数生成

在Matlab 中各种随机数可以认为是独立同分布的,即简单随机样本。以下罗列在Matlab 中的实现方法。

)1,0U(~,,,21n X X X ,均匀分布样本

n=10;x=rand(1,n)

),U(~,,,21b a X X X n

n=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a

)1,0N(~,,,21n X X X ,正态分布样本

n=10;x=randn(1,n)

),N(~,,,221b a X X X n

mu=80.2;sigma=7.6;m=1;n=10; x=normrnd(mu,sigma,m,n)

上面首先对总体均值赋值mu=80.2;再对标准差赋值sigma=7.6; m=1;n=10;分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab 自带的函数normrnd 生成正态分布的随机数。

类似地可生成m 行n 列的随机矩阵,服从指定的分布。生成随机数的函数后缀都是rnd ,前缀为分布的名称。常用分布的随机数产生方法罗列如下,注意使用前先要对参数赋值。

x=betarnd(a,b,m,n) 参数为a,b 的beta 分布; x=binornd(N,p,m,n) 参数为N,p 的二项分布; x=chi2rnd(N,m,n) 自由度为N 的2χ分布; x=exprnd(mu,m,n) 总体期望为mu 的指数分布; x=frnd(n1,n2,m,n) 自由度为n1与n2的F 分布; x=gamrnd(a,b,m,n) 参数为a,b 的Γ分布;

x=lognrnd(mu,sigma,m,n) 参数为mu 与sigma 的对数正态分布; x=poissrnd(mu,m,n) 总体均值为mu 的Poisson 分布; x=trnd(N,m,n) 自由度为N 的T 分布; Matlab 统计工具箱中还有一些其它分布,不再一一列举。

3、三个抽样分布(χ2

、t 、F 分布)

1.3 三个常用分布

以下罗列出数理统计中三个重要分布的概念与性质。

1.3.1 2χ分布

定义1.2 设一维连续型随机变量X 的密度函数为

??

???≤>Γ=--0

,00,e )

2/(21

)(2122

/x x x n x f x n n n (1-2)

则称X 服从自由度为n 的2χ分布,记为)(~2n X χ。

0510152025303540

0.02

0.04

0.06

0.08

0.1

0.12

0.14

图1-2 2χ分布密度函数示意图

(1)期望与方差:n X =E ,n X 2=D

(2)来源:若)1,0N(~,,,21n X X X 独立同分布,则

)(~22

2221n X X X n χ+++

(3)可加性:若)(~

121n Y χ,)(~222n Y χ,且两者独立,则有

)(~21221n n Y Y ++χ

(4)重要结论:若),N(~,,,221σμn X X X ,则

)1(~)()1(22

1

2

2

2

--=

-∑=n X X

S n n

i i

χσσ

以下给出了自由度为5,10,20的2

χ分布的密度函数,如图1-2所示。

1.3.2 t 分布

定义1.3 设一维连续型随机变量X 的密度函数为

2

1

2

1)2

()21

(

)(+-

???

? ??+Γ+Γ=n n n x n n

n x f π (1-3)

则称X 服从自由度为n 的t 分布,记为)(~n t X 。

-3

-2-10123

00.05

0.10.150.20.250.30.35

0.4

图1-3 t 分布密度函数与标准正态分布密度函数

(1)密度函数特点:与标准正态分布类似,方差较大。∞→n 时,

2

2e

21)(x n x f -

=

→π

?(标准正态分布密度函数)

(2)来源:设)1,0N(~X ,)(~

2n Y χ,且两者独立,则

)(~/n t n

Y X

(3)重要结论:设),N(~,,,221σμn X X X ,则

)1(~/--=

n t n

S X T μ

1.3.3 F 分布

定义1.4 设一维连续型随机变量X 的密度函数为

???????≤>?

??

? ??+=+--0

,

00,1)(22112211

x x x n n cx x f n n n (1-4) 其中常数

22121211

)2

()2()2(

n

n

n n n n n c ???? ??ΓΓ+Γ= 则称X 服从第一自由度1n ,第二自由度2n 的F 分布,记为),(~21n n F X 。

(1)密度函数特点:在1=x 附近密度函数取值较大,为单峰非对称的。当两个自由度都很大时,X 取值以较大概率集中在1=x 附近。以下画出了)12,8(F 的密度函数

00.51 1.52 2.53

图1-4 F 分布密度函数

(2)来源:设)(~

12n X χ,)(~22n Y χ,且两者独立,则

),(~//212

1

n n F n Y n X F =

(3)重要结论:设1,,21n X X X 为来自总体),(2

11σμN 的简单随机样本,2

,,,21n Y Y Y 为来自总体),(222σμN 的简单随机样本,且两者独立。又设两个样本方差分别为21S 与2

2S ,则

)1,1(~//2122

212

2

21--=n n F S S F σσ

三、点估计的两种方法

(1)矩法

所谓矩法就是利用样本各阶原点矩代替相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体X 的分布中包含有未知数m θθθ,,,21 ,则其分布函数可以表成

).,,,;(21m x F θθθ 显示它的k 阶原点矩),,2,1)((m k X E v k k ==中也包含了未知参数

m θθθ,,,21 ,即),,,(21m k k v v θθθ =。又设n x x x ,,,21 为总体X 的n 个样本值,其

样本的k 阶原点矩为

∑=∧

=n i k

i k x n v 1

1

).,,2,1(m k =

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有

??????

?

?

??

?

???

?===∑∑∑=∧∧∧=∧∧∧=∧∧

∧n i m i m m n i i m n i i m x n v x n v x n v 121122121

211.1),,,(,1),,,(,

1),,,(θθθθθθθθθ 由上面的m 个方程中,解出的m 个未知参数),,,(21∧

∧∧m θθθ 即为参数(m θθθ,,,21 )的矩估计量。

例7.1:设总体)(~λP X ,求对λ的矩估计量。

(2)最大似然法

所谓最大似然法就是当我们用样本的函数值估计总体参数时,应使得当参数取这些值时,所观测到的样本出现的概率为最大。

当总体X 为连续型随机变量时,设其分布密度为),,,;(21m x f θθθ ,其中

m θθθ,,,2

1 为未知参数。又设n x x x ,,,2

1 为总体的一个样本,称

),,,;(),,,(1

1122∏==n

i m i m n x f L θθθθθθ

为样本的似然函数,简记为L n . 当总体X 为离型随机变量时,设其分布律为),,,;(}{21m x p x X P θθθ ==,则

),,,;(),,,;,,,(1

111222∏==n

i m i m n x p x x x L θθθθθθ

为样本的似然函数。

若似然函数),,,;,,,(2211m n x x x L θθθ 在m ∧

∧∧θθθ,,,2

1 处取到最大值,则称

m ∧

∧∧

θθθ,,,2

1 分别为m θθθ,,,21 的最大似然估计值,相应的统计量称为最大似然估计量。

我们把使L n 达到最大的m ∧

∧∧θθθ,,,2

1 分别作为m θθθ,,,21 的估计量的方法称为最大似然

估计法。 由于ln x 是一个递增函数,所以L n 与ln L n 同时达到最大值。我们称

m i L i

i i

n

,,2,1,0ln ==??∧

=θθθ

为似然方程。由多元微分学可知,由似然方程可以求出),,2,1)(,,,(21m i x x x n i i ==∧

θθ为i θ的最大似然估计量。 容易看出,使得L n 达到最大的i ∧

θ也可以使这组样本值出现的可能性最大。

2、估计量的评选标准

(1)无偏性

定义1.5 设总体X 含有未知参数θ,n X X X ,,,21 为来自总体的简单随机样本,又

设),,,(??21n X X X θθ=为θ的一个估计量。若在给定范围内无论θ如何取值,总有θθ

θ=)?(E ,则称θ?为θ的一个无偏估计量;若θθθ≠)?(E ,则称θ?为θ的一个有偏估计量。 注意无偏估计的含义是:由于样本的随机性,估计值有时候偏大,有时候偏小,多次估计的平均值才能靠近真实的未知参数值。

若总体X 的均值E (X )和方差D (X )存在,则样本均值x 和样本方差S 2分别为E (X )和 D (X )的无偏估计,即

E (x )=E (X ), E (S 2)=D (X )。

无论无偏估计还是有偏估计,可以统一使用“均方误差”MSE 评价:

22)]?(E [)?(D )?(E )?MS E(θθθθθθθ

θθ-+=-= (2-1) 对于无偏估计,0)]?(E [2=-θθθ,但)?(D θθ

可能很大,果真如此,它就不是一个好的估计量。反之,对于有偏估计,虽然0)]?(E [2≠-θθθ,但如果与)?(D θθ

相加之后)?MSE(θ仍然较小,则它就是一个较好的估计量。

例 2.1 设总体)(~

2n X χ,2021,,,X X X 为来自总体的简单随机样本,欲估计总

体均值μ(注意n 未知),比较以下三个点估计量的好坏:

211100101?X X -=μ

,)(2

1

?)11()10(2X X +=μ,X =3?μ 解 本例题给出了利用MSE 评价点估计量的随机模拟方法。由于)(2n χ的总体均值为

n ,因此我们可以先取定一个固定值,例如50==μn ,然后在这个参数已知且固定的总

体中抽取容量为20的样本,分别用样本值依照三种方法分别计算估计值(注意谁也别偷看底牌50==μn ),看看哪种方法误差大,哪种方法误差小。一次估计的比较一般不能说明问题,正如低手射击也可能命中10环,高手射击也可能命中9环。如果连续射击1万次,比较总环数(或平均环数),多者一定是高手。同理,如果抽取容量为20的样本10000=N 次,分别计算

∑=-≈N

k i i k N 1

20])(?[1)?MSE(μμμ

小者为好。

N=10000; m=5; n=20; mse1=0; mse2=0; mse3=0; for k=1:N

x=chi2rnd(m,1,n); m1=101*x(1)-100*x(2); m2=median(x); m3=mean(x);

mes1=mse1+(m1-m)^2; mes2=mse2+(m2-m)^2; mes3=mse3+(m3-m)^2; end

mse1=mes1/N mse2=mes2/N mse3=mes3/N

以上程序保存为ex21.m ,命令窗口中键入ex21,运算结果为

mse1 = 58.1581 mse2 = 7.8351e-005 mse3 = 9.4469e-006

可见第一个虽为无偏估计量,但MSE 极大,表现很差。第二个虽为有偏估计,但表现与第三个相差不多,也是较好的估计量。另外,重复运行ex21,每次的结果是不同的,但优劣表现几乎是一致的。

例2.2 设5021,,,X X X 为来自],0[θ上服从均匀分布的总体的简单随机样本,容易

得到未知参数的矩估计量X 2?1=θ,最大似然估计量),,,max(?50

212X X X =θ,试用随机模拟的方法比较两者的优劣。

解 不妨设5=θ,以下程序给出了两者的评价。

s=5; N=10000;

mse1=0; mse2=0; for k=1:N

x=5.*rand(1,50); s1=2*mean(x); s2=max(x);

mse1=mse1+(s1-s)^2; mse2=mse2+(s2-s)^2; end

mse1=mse1/N; mse2=mse2/N; [mse1,mse2]

参考运行结果: 0.1655 0.0186

本例中,最大似然估计精度较高。注意矩法估计量是无偏估计,本例中最大似然估计量显然是有偏估计,且一定是偏小的。 (2)有效性

设),,,,(2111n x x x ∧

=θθ和),,,,(2122n x x x ∧

=θθ是未知参数θ的两个无偏估计

量。若21)(∧∧<θθD D ,则称21∧

∧θθ比有效。

例7.2:设n x x x ,,,,21 是总体的一个样本,试证下列式子并比较有效性。

(1);21103513211x x x ++=

μ (2);125

41313212x x x +

+=∧μ (3).12

1

43313213x x x -

+=∧μ

(3)一致性(相合性)

设n ∧

θ是θ的一串估计量,如果对于任意的正数ε,都有

,0)|(|lim =>-∧

→εθθn n P

则称n ∧

θ为θ的一致估计量(或相合估计量)。

3、 区间估计

所谓区间估计,就是用两个估计量1?θ与2?θ估计未知参数θ,使得随机区间)?,?(2

1θθ能够包含未知参数的概率为指定的α-1。即:

αθθθθ-≥<<1)??(2

1P 称满足上述条件的区间)?,?(21θθ为θ的置信区间,称α-1为置信水平。1?θ称为置信下限,2

?θ称为置信上限。 3.1 单正态总体均值的置信区间

(1)方差2

02σσ=已知情形

查表求2

αu 满足:对于)1,0N(~ξ,2

)(2

α

ξα=

>u P 。(上分位数 )

对于总体),(20σμN 中的样本n X X X ,,,21 ,μ的置信区间为:

),

(2

2

αασσu n

X u n

X +

-

(2-4)

其中2

αu 可以用norminv(1-a /2)计算。

例2.3 设

1.1,

2.2, 3,3, 4.4, 5.5

为来自正态总体)3.2,N(2μ的简单随机样本,求μ的置信水平为95%的置信区间。

解 以下用Matlab 命令计算:

x=[1.1,2.2,3.3,4.4,5.5]; n=length(x); m=mean(x); c=2.3/sqrt(n); d=c*norminv(0.975); a=m-d; b=m+d; [a,b]

计算结果为 1.2840 5.3160 (2)方差2

σ未知情形

对于总体),(2σμN 中的样本n X X X ,,,21 ,μ的置信区间为:

),(2

2

ααt n S

X t n S X +

-

(2-4) 其中2

αt 为自由度1-n 的t 分布临界值。

数据同上,继续利用Matlab 计算

S=std(x); dd=S*tinv(0.975,4)/sqrt(n); aa=m-dd; bb=m+dd; [aa,bb]

结果为 1.1404 5.4596

3.2 单正态总体方差的置信区间

由于)1(~)(1

21

22

--=

∑=n X X

W n

i i

χσ,查表求临界值1c 与2c ,使得

α-=<<1)21(c W c P

则2

σ的置信区间为

))1(1

1

,)1(2

1

(

22S n c S n c -?-? (2-5) 其中查表可用chi2inv 进行。数据同上,以下求2

σ的置信区间。

c1=chi2inv(0.025,4); c2=chi2inv(0.975,4);

T=(n-1)*var(x); aaa=T/c2; bbb=T/c1; [aaa,bbb]

计算结果为 1.0859 24.9784

3.3 两正态总体均值差的置信区间

(1)方差已知情形

设),N(~,,,21121σμm X X X ,),N(~,,,2

2221σμn Y Y Y ,两样本独立,此时

21μμ-的置信区间为

???

? ??++-+--n m u Y X n m u Y X 2221222212,σσσσαα

(2-6) 这里我们已经知道2

αu 可用norminv(0.975)求得,Matlab 计算很容易。

(2)方差未知但相等:22

221σσσ==

此时21μμ-的置信区间为

?

??

?

??+-?--C t Y X C t Y X 22,αα (2-7) 其中2)1()1(112

2

21-+-+-+

=n m S n S m n m C ,而2

αt 依照自由度2-+n m 计算。 3.4 两正态总体方差比的置信区间

此时,查自由度为)1,1(--n m 的F 分布临界值表,使得

α-=<<1)21(c F c P

则2

221/σσ的置信区间为:

???

? ?

?1/,2/2

2212221c S S c S S (2-7) 例2.4 设两台车床加工同一零件,各加工8件,长度的误差为: A :-0.12 -0.80 -0.05 -0.04 -0.01 0.05 0.07 0.21 B :-1.50 -0.80 -0.40 -0.10 0.20 0.61 0.82 1.24 求方差比的置信区间。

解 用Matlab 计算如下:

x=[-0.12,-0.80,-0.05,-0.04,-0.01,0.05,0.07,0.21]; y=[-1.50,-0.80,-0.40,-0.10,0.20,0.61, 0.82,1.24];

v1=var(x); v2=var(y);

c1=finv(0.025,7,7); c2=finv(0.975,7,7); a=(v1/v2)/c2; b=(v1/v2)/c1; [a,b] 计算结果为: 0.0229 0.5720

方差比小于1的概率至少达到了95%,说明车床A 的精度明显高。

三 假设检验(换令一个讲)

3.1 假设检验的基本概念

例3.1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:

775,816,834,836,858,863,873,877,885,901

问:新产品亩产是否超过了800斤?

假设检验就是概率意义上的反证法。要证明命题H 1:800>μ,可以首先假设H 0:

800=μ。本体中容易计算样本均值超过800了,有没有可能超过800的原因是由于抽样的

随机性引起的?是否总体均值根本没有变化?我们看如下的统计量:

n

S X T /800-=

容易看出,如果新品种确有增产效应,T 应偏大,不利于H 0,取05.0=α,查表求临界值

αt ,使得αα=>)(t T P ,即构造不利于H 0,有利于H 1的小概率事件,如果在一次试验中

该小概率事件发生了,就有理由拒绝H 0,认为H 1成立。

严格逻辑意义上的反证法思路如下:欲证H 1成立,先假设其否命题H 0成立,然后找出逻辑意义上的矛盾,从而推翻H 0成立,严格证明H 1成立。假设检验的思路类似,只不过引出的不是矛盾,而是小概率事件在一次实验中发生。

我们称想要证明的命题H 1为备择假设,对立的命题H 0称为原假设,面对样本,我们必须表态是接受原假设还是拒绝原假设,这有可能出现两类错误。如果客观上原假设的确成立,面对样本的异常我们拒绝了原假设,这种“以真为假”的错误我们称为第一类错误,发

生的概率用α表示;如果客观上备择假设成立,我们却接受了原假设,这种“以假为真”的错误我们称为第二类错误,用发生的概率用β表示。假设假设检验一般首先控制第一类错误,即:当我们拒绝原假设时有比较充足的理由,犯错误的概率不超过预设的α,称α为显著性水平。常用的显著性水平有

01.0,05.0,1.0=α

这种预设显著性水平α的假设检验也称为显著性检验,以后我们提到的假设检验都是显著性检验。对于显著性检验,当接受原假设时,可以认为是拒绝的证据不足。

3.2 正态总体参数的假设检验

3.2.1 单正态总体均值的假设检验

设n X X X ,,,21 为来自正态总体),N(2σμ简单随机样本,0μ为我们关心的已知的值,原假设为:

H 0:0μμ=

(1)方差已知情形 此时,检验统计量为n

X U /0

σμ-=,H 0成立时)1,0N(~U ,依据备择假设的不同提法,

分三种情况分别给出拒绝域。

1)双侧检验 备择假设H 1:0μμ≠

拒绝域:2

||αu U >

这种情形我们关心的是总体均值是否发生了变化,增多减少都是我们同等关注的。例如要研究某种药物的副作用,是否引起血压的变化,变大变小都是副作用,如果实验证明了确有副作用,就该停产或慎用。

2)单侧检验(右侧) 备择假设H 1:0μμ>

拒绝域:αu U >

这种情形我们关心的是总体均值是否有增加效应,例如小麦亩产。无增产效应或者减产都是我们不希望看到的,我们希望证明的是增产了。

3)单侧检验(左侧) 备择假设H 1:0μμ<

拒绝域:αu U -<

这种情形我们希望看到总体均值变小了。每匹布上疵点的个数。新工艺后是否有减少。 (2)方差未知情形 原假设H 0:0μμ=

此时,检验统计量为n

S X T /0μ-=

,H 0成立时)1(~-n t T ,依据备择假设的不同提法,

分三种情况分别给出拒绝域。

1)双侧检验 备择假设H 1:0μμ≠

拒绝域:2

||αt T >

2)单侧检验(右侧) 备择假设H 1:0μμ> 拒绝域:αt T > 3)单侧检验(左侧) 备择假设H 1:0μμ<

拒绝域:αt T -<

其实,上一章中区间估计与这里的双侧检验本质上是相同的:区间套中0μ接受原假设,没套中则拒绝原假设。只不过检验统计量的计算更简单些。类似于单侧检验,也可以有单侧区间估计。

3.2.2 单正态总体方差的假设检验

设n X X X ,,,21 为来自正态总体),N(2

σμ简单随机样本,0σ为我们关心的已知的值,原假设为H 0:0σσ=,检验统计量为

2

1

2

2

2

2)()1(σ

σ

χ∑=-=

-=

n

i i

X X

S

n

当H 0成立时,)1(~

22-n χχ,由此可查)1(2-n χ临界值表,构造拒绝域。

(1)双侧检验 此时备择假设为H 1:0σσ≠,也就是说,我们希望通过样本找到总

体方差比较2

0σ有明显变化的证据,无论变大变小都是我们希望证明的。

此时取临界值1c 与2c ,使得2

)1(2

α

χ=

≤c P ,2

)1(2

α

χ=

>c P ,拒绝域为:1

2c <χ(方差变小了),或者22

c >χ(方差变大了)。

当n 已经赋值的时候,执行如下Matlab 命令可得到临界值。

a=0.05, n=20, c1=chi2inv(a/2,n-1), c2=chi2inv(1-a/2,n-1),

(2)单侧检验(右侧) 此时备择假设为H 1:0σσ>,也就是说,我们关心的是方差是否变大了。此时临界值为c 满足αχ=>)(2

c P ,可用

c=chi2inv(1-a,n-1)

(3)单侧检验(左侧) 此时备择假设为H 1:0σσ<,也就是说,我们关心的是方差是否变小了。此时临界值为c 满足αχ=<)(2c P ,可用

c=chi2inv(a,n-1)

3.2.3 两正态总体均值的假设检验

设m X X X ,,,21 为来自正态总体),N(2

11σμ的简单随机样本,n Y Y Y ,,,21 为来自正

态总体),N(2

22σμ的简单随机样本,且两样本独立。为比较两个总体的期望,提出如下原假

设:

H 0:21μμ=

与前面类似,备择假设有双侧、单侧(左侧、右侧)等提法。

(1)方差已知情形 此时检验统计量为n

m

Y

X U 22

2

1

σ

σ

+

-=

,当H 0成立时U 服从标准正态分布,临界值αu ,

2

αu 含义及计算方法同前。

1)双侧检验 H 1:21μμ≠,拒绝域:2

||αu U >

2)右侧检验 H 1:21μμ>,拒绝域:αu U > 3)左侧检验 H 1:21μμ<,拒绝域:αu U -<

(2)方差未知但相等情形22

221σσσ==

此时原假设仍为H 0:21μμ=,备择假设同样有三种提法。检验统计量为:

n

m mn

S n S m n m Y X T +-+--+-=2

2

21)1()1()

2()

( 当H 0成立时)2(~-+n m t T ,由此得临界值αt ,2

αt 。

1)双侧检验 H 1:21μμ≠,拒绝域:2

||αt T >

2)右侧检验 H 1:21μμ>,拒绝域:αt T > 3)左侧检验 H 1:21μμ<,拒绝域:αt T -<

3.2.4 两正态总体方差的假设检验

设m X X X ,,,21 为来自正态总体),N(2

11σμ的简单随机样本,n Y Y Y ,,,21 为来自正态总体),N(2

22σμ的简单随机样本,且两样本独立。为比较两个总体的方差,提出如下原假设:

H 0:2

22

1σσ=

与前面类似,备择假设有双侧、单侧(左侧、右侧)等提法。此时检验统计量为2

22

1/S S F =,

当H 0成立时,)1,1(~--n m F F ,在Matlab 中,如果m,n 已经赋值,例如m=8,n=10则

c1=finv(0.025,7,9),c2=finv(0.975,7,9)

分别给出了05.0=α时的两个临界值,双侧检验的拒绝域为1c F <或2c F >。

c3=finv(0.05,7,9)

给出了左侧检验临界值,3c F <时拒绝原假设,认为备择假设H 1:2

221σσ<成立。

c4=finv(0.95,7,9)

给出了右侧检验临界值,4c F >时拒绝原假设,认为备择假设H 1:2221σσ>成立。

3.2.5 大样本非正态总体均值的假设检验

设n X X X ,,,21 为来自非正态总体的简单随机样本,设总体均值μ与总体方差2

σ有限,原假设

H 0:0μμ=

此时可以将n

S X U /μ-=

作为近似的检验统计量,当样本容量很大时(例如100),由

中心极限定理知H 0成立时U 近似服从标准正态分布,可以仿照3.2.1小节中的算法检验如下三个备择假设:

H 1:0μμ≠

; H 1:0μμ>; H 1:0μμ<

设m X X X ,,,21 为来自非正态总体的简单随机样本,n Y Y Y ,,,21 为来自非正态总体的简单随机样本,且两样本独立。两个总体有有限的均值与方差,均值为1μ与2μ,为比较两个总体的期望,提出如下原假设:

H 0:21μμ=

与前面类似,备择假设有双侧、单侧(左侧、右侧)等提法。此时可以将

n

S m S Y X U 22

21

+-=

近似作为检验统计量,当两个样本容量都很大时(例如100),由中心极限定理知H 0成立时U 近似服从标准正态分布,可以仿照3.2.3小节中的算法检验如下三个备择假设:

H 1:21μμ≠; H 1:21μμ>; H 1:21μμ<

3.5 总体分布的假设检验

设n X X X ,,,21 为来自总体)(x F 的简单随机样本,)(0x F 为已知的一个固定的分布函数,要进行如下的检验:

H 0:)()(0x F x F = H 1:)()(0x F x F ≠

对此检验问题,有两种常用的方法。

对总体分布进行假设检验,一般要求样本容量较大,例如至少100。

3.5.1 2χ检验

取正整数2/n m ≈

,将样本排序为)()2()1(n X X X ≤≤≤ ,将区间

],[)()1(n X X 1+m 等分,分点为

][1

)1()()1(X X m i

X t n i -++=, m i ,,2,1 =

这m 个分点将),(+∞-∞分割为1+m 个小区间,

],(11t -∞=?,],(212t t =?, ,],(1m m m t t -=?,),(1+∞=?+m m t

记i v 为落入i ?的样本点的个数,显然

n v m i i =∑+=1

1,

称n

v i

为X 落入i ?的频率。)(i i X p ?∈=P 表示H 0成立时X 落入i ?的概率,即

)(101t F p =,

)()(10202t F t F p -=, ,)()(100--=m m m t F t F p ,

)(101m m t F p -=+

检验统计量取为:

∑+=+=-=??? ??-=112

1

12

)

(m i i

i i m i i i i np np v p n p n v V 可以证明,当H 0成立时V 近似服从自由度为m 的2

χ分布,对于显著性水平α,取临界值

v0=chi2inv(1-alpha,m)

当V>v0时,拒绝H 0。

四单因素方差分析

5.1.1 方差分析的基本概念

在实际问题中,人们常常需要在不同的条件下对所研究的对象进行对比试验,从而得到若干组数据(样本)。方差分析就是一种分析、处理多组实验数据间均值差异的显著性的统计方法。其主要任务是,通过对数据的分析处理,搞清楚各实验条件对实验结果的影响,以便更有效地指导实践,提高经济效益或者科研水平。

在统计中,人们称受控制的条件为因素,因素所处的状态称为水平。

如果只让一个因素变动,取该因素的多个不同水平进行试验,而其他因素保持不变,称该试验为单因素试验。例如小麦种植产量,只考虑“品种”这一因素,研究4个不同品种产量的差异,其它诸如施肥方案、灌溉方案等因素保持一致,就是一个4水平单因素试验。

(整理)sas第九章 t检验和方差分析.

第九章 t 检验和方差分析 在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。样本差异可能是由抽样误差所致,也可能是由本质的不同所致。应用统计学方法来处理这类问题,称为“差异的显著性检验”。若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。 第一节 t 检验 9.1.1 简介 t 检验是用于两组数据均值间差异的显著性检验。它常用于以下场合: 1.样本均值与总体(理论)均值差别的显著性检验 检验所测得的一组连续资料是否抽样于均值已知的总体 根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。 SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。 2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验) 比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。 SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。 3.两样本均值差异的显著性检验 作两样本均值差异比较的两组原始资料各自独立,没有成对关系。两组样本所包含的个数可以相等,也可以不相等。每组观测值都是来自正态总体的样本。 设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为: (1)方差齐(相等)时: ) /1/1(212 21n n s x x t +-= )2/(])1()1[(212 222112-+-+-=n n s n s n s

3[1]3总体方差的假设检验

§3 检验母体方差 3.1 检验正态母体的方差 ——2 χ检验 母体),(~2σμN X ,2 ,σμ均未知,试对 2 σ与2 0σ有无显著差异作假设检验. ①在母体上作 假设 ?=2 020:σσH 2021:σσ≠H ②检验统计量 )1( ~ )1(22 02 2 --=*n S n H χσχ ③给定显著水平α,如图存在 )1(22 1-- n α χ 和)1(2 2 -n αχ,使 2 )}1({)}1({2 2 222 12α χχχ χαα = ->=-<- n P n P 故取拒绝域 } )1()1(),,,{(2 2 222 12 21->-<=- n n x x x W n αα χχχ χ或

④决策:当抽样结果是 W x x x n ∈),,,(21 时,拒绝0 H ,认为2 σ与2 0σ有 显著差异;否则接受0 H ,认为2 σ与20 σ无 显著差异. 例3.3.1 某细纱车间纺出的一种细纱支数的标准差2.10=σ,现从某日纺出的一批细纱中随机抽出16缕进行支数测 量,算得子样标准差1.2* =s ,问:纱的均 匀度有无显著变化(取05.0=α)?假定 母体分布是正态的。 解: 设该日纺出的纱的支数 ),(~2 σμN X ,2 ,σμ均未知, 作假设?=2.1:20σH 2.1:21 ≠σH 检验统计量)1(~ )1(22 22 --= *n S n H χσ χ 给定显著水平α,拒绝域为 } )1()1(),,,{(2 2 222 1221->-<=-n n x x x W n ααχχχχ或

这时16=n ,2.10=σ,1.2* =s ,从而94.452 =χ,又05.0=α,查表得 262.6)15()1(975.02 1==-- χχ α n , 488.27)15()1(025.02 ==-χχαn , 可见)1(2 2 ->n αχχ,故应拒绝0H ,认为 这天细纱的均匀度有显著变化。 例3.3.2 ),(~2 σμN X , 2 ,σμ均未知, 当45>n ,作如下假设检验 ?=2 2 0:σσH 2021:σσ≠H 检验统计量取为2 02 2 )1(σχ *-= S n ,证明:给 定显著水平α,则拒绝域为 } )1(2)1({})1(2)1({2 22 2ααχχu n n u n n W ---≤-+-≥= . 证明:作假设?=2020:σσH 2 021:σσ≠H , 0H 成立时检验统计量

案例库 项目八假设检验 回归分析与方差分析

项目八假设检验、回归分析与方差分析 实验3 方差分析 实验目的学习利用Mathematica求单因素方差分析的方法. 基本命令 1.调用线性回归软件包的命令<

中,向量Y是因变量,也称作响应变量.矩阵X称作设计矩阵, ?是参数向量??是误差向量? ????????DesignedRegress也是作一元和多元线性回归的命令, 它的应用范围更广些. 其格式与命令Regress的格式略有不同: DesignedRegress[设计矩阵X,因变量Y的值集合, RegressionReport ->{选项1, 选项2, 选项3,…}] RegressionReport(回归报告)可以包含:ParameterCITable(参数?的置信区间表???? ?PredictedResponse (因变量的预测值), MeanPredictionCITable(均值的预测区间), FitResiduals(拟合的残差), SummaryReport(总结性报告)等, 但不含BestFit. 实验准备—将方差分析问题纳入线性回归问题 在线性回归中, 把总的平方和分解为回归平方和与误差平方和之和, 并在输出中给出了方差分析表. 而在方差分析问题

中, 也把总的平方和分解为模型平方和与误差平方和之和, 其方法与线性回归中的方法相同. 因此只要把方差分析问题转化为线性模型的问题, 就可以利用线性回归中的设计回归命令DesignedRegress 做方差分析. 单因素试验方差分析的模型是 ?? ? ??==+=. ,,2,1;,,2,1,),,0(~,2s j n i N Y j ij ij ij j ij ΛΛ独立各εσεεμ (3.1) 上式也可改写成 ?? ? ??===+-+==+=.,,2,1;,,2,1,),,0(~; ,,3,2,)(, ,,2,1,2111111s j n i N s j Y n i Y j ij ij ij j ij i i ΛΛΛΛ独立各εσεεμμμεμ (3.2) 给定具体数据后, 还可(2.2)式写成线性模型的形式:

最新多元统计分析第三章 假设检验与方差分析

多元统计分析第三章假设检验与方差分析

第3章 多元正态总体的假设检验与方差分析 从本章开始,我们开始转入多元统计方法和统计模型的学习。统计学分析处理的对象是带有随机性的数据。按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。 所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。 统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。 3.1一元正态总体情形的回顾 一、 假设检验 在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。 1、显著性检验 为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2 σμN 的样本,我们要检验假设 100:,:μμμμ≠=H H (3.1) 原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。 当2 σ已知时,用统计量n X z σ μ -=

t检验与方差分析

第六章数值变量资料的统计分析 数值变量资料又称计量资料,通常是指每个观察单位某项指标量的大小,一般具有计量单位。这类资料按分析的内容一般可分为两种:一种是比较几种处理之间的效应,简单地讲就是比较各处理组观察值均数、方差的大小;另一种是寻找指标间的关系,即某个(或某些)指标的取值是否受其它指标的影响。本章主要介绍不同设计类型的数值变量资料的比较。 §6.1 样本均数与总体均数比较的 t 检验 t检验亦称 student's t 检验,主要用于下列三种情况:(1)样本均数与总体均数比较;(2)配对数值变量资料的比较;(3)两样本均数的比较。 Stata用于样本均数与总体均数比较的 t 检验的命令是: ttest 变量名= #val 这里,#val 表示总体均数。 命令中可以选用 if 语句和 in 语句对要分析的内容加一些条件限制。 对已知样本含量、均数和标准差的资料,欲将其与某总体均数进行比较,Stata 还提供了更为简洁的命令是: ttesti #obs #mean #sd #val 这里,#obs 表示样本含量,#mean 表示样本均数,#sd 表示样本标准差, #val 表示总体均数。 §6.2 两样本均数比较的t检验 一、配对设计t检验 医学研究中常将受试对象配成对子,对每对中的两个受试对象分别给予两种不同的处理,观察两种处理的结果是否一致,称为配对(设计)研究。有时以同一个受试对象先后给予两种不同的处理,观察两种处理的结果是否相同,这种配对称为自身配对。配对设计的优点是能消除或部分消除个体间的差异,使比较的结果更能真实地反映处理的效应。 配对t检验首先计算每对结果之差值,再将差值均数与0作比较。如两种处理的效应相同,则差值与0没有显著性差异。 检验假设 H0为:两种处理的效应是相同,或总体差值均数为 0。 stata用于配对样本t检验的命令是: Ttest变量1=变量2 这里,这里“变量 1”和“变量 2”是成对输入的配对样本。 ttest 命令容许使用[if 表达式]和[in范围]条件限制。 或者: gen d=0 ttest d=0 二、成组设计t检验

正态总体均值及方差的假设检验表

正态总体均值及方差的假设检验表: 单正态总体均值及方差的假设检验表(显著性水平α) 1 a n ~N (0,1)2 01 a S n ~t 2 2 02 1 0n i n i a ~ 2或 2 21 2 n 2 2n 2 21 n 20 ~ 22 21 1 2 n 2 21n 21 1 n

2 212 12 n n ~N (0,1) 2 1 2 11W S n n ~ 2 , 22 1122 122 n S n S n n 22 22 21112 2 1 2 1i i n i i a a n ~12,F n n 2 或 2 2 221 n S n ~21,1n 1 2或 2

Z =ξ-η~N (a 1-a 2,21σ+2 2σ),Z i =ξi -ηi . 2 21 2 Z n ) 2 1 S n ~ 2

单正态总体均值及方差的区间估计(置信度1-α) 已知 1 a n ~N (0,1)0 1 1 , n n u u n n 1 a S n ~t , 1 1 t t n n 2 02 1 n i n i a ~ 001 122, 12 2 i i i i n n a a 20 ~ 21 ,12 2 n

2个正态总体均值差及方差比的区间估计(置信度1-α) 12 212 12 a n n ~N (0,1) 2212 12 u n n 112 11W a S n n 22 n t 1 22 12 11W n n t S n n )2 a ξ-12 ,1 ,2 2 n n A F A 2 112 222 2 11n S n S ~ 2 2 21112W n S n S n n 212 1212 2 2 1 n i i n i i n a A n a ,2 122 2 21111n n S B n n S . (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)

假设检验与方差分析

实验四 假设检验 实验目的:通过此实验熟练掌握如何利用假设检验工具根据不同条件 选择相应检验工具进行检验,有助于学习者理解假设检验的过程及结果 实验要求:能够运用Excel 对总体均值进行假设检验,学会针对实际 背景提出原假设和备择假设来检验实际问题,并根据检验结果作出符合统计学原理和实际情况的判断和结论,加深对统计学方法的广泛应用背景的理解 假设检验与区间估计两者之间存在密切的关系,二者用的是同一个样本、同一个统计量、同一种分布,所以也可以用区间估计进行假设检验,两者结论是一致的。在Excel 中进行假设检验,除可按区间估计过程用公式和逆函数计算外,还备有专用的假设检验工具,包括Z —检验工具、T —检验工具和F —检验工具。使用这些工具,可以直接根据样本数据进行计算,一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。实验四主要介绍假设检验工具的使用。 一、假设检验的一般过程 假设检验主要是根据计算出的检验统计量与相应临界值比较,作出拒绝或接受原假设的决定。 根据全国汽车经销商协会报道,旧车的平均销售价格是10192美元。堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的100辆旧车。结果样本平均价格是9300美元,样本标准差是4500美元。在0.05的显著性水平下,检验H 0:10192≥μ H 1:10192<μ。问:假设检验的结论是什么?这名经理接下来可能会采取什么行动? 本例由于样本容量比较大,其均值近似服从正态分布,总体方差未知,需要用样本标准差来代替,选择T 统计量进行检验。T 统计量的计算公式如下:

)1(~1 0--= -n t n s x t n μ 单击任一空单元格,输入“=(9300-10192)/(4500/SQRT(100))”,回车确认,得出t 统计量为-1.982。单击另一空单元格,输入“=TINV(0.025,99)”,回车确认,得出t 分布的右临界值为2.276。因为276.2982.1<-,所以不拒绝原假设,认为此旧车经销处旧汽车平均销售价格不小于10192美元。那么接下来这名经理会采取什么相应行动?(请读者思考)。 本例主要介绍了假设检验的一般过程,利用Excel 的公式和函数求出相应的统计量值和临界值,最后作出结论。 二、假设检验工具的使用 接下来介绍如何使用Excel 的假设检验工具。使用这一工具应该注意二点:第一,由于现实世界和生活中大量的数据服从正态分布,Excel 的假设检验工具是按正态总体设计的(以下各例未特殊说明,认为其服从或近似服从正态分布);第二,Excel 的假设检验工具主要用于检验两总体之间有无显著差异。具体来讲,Z —检验工具是对方差或标准差已知的两总体均值进行差异性检验;T —检验工具是对方差和标准差未知的两总体均值进行差异性检验,其中包括等方差假设检验、异方差假设检验和成对双样本检验;F —检验工具是对总体的标准差进行检验。 (一)Z —检验工具的使用 国际航空运输协会对商务旅行者进行调查以确定大西洋两岸过关机场的等级分数。假定:要求50名商务旅行者组成的随机样本给迈阿密机场打分,另50名商务旅行者组成的随机样本给洛杉机机场打分,最高等级为10分。两个样本数据如下: 迈阿密机场得分数据: 6 4 6 8 7 7 6 3 3 8 10 4 8 7 8 7 5 9 5 8 4 3 8 5 5 4 4 4 8 4 5 6 2 5 9 9 8 4 8 9 9 5 9 7 8 3 10 8 9 6 洛杉机机场得分数据: 10 9 6 7 8 7 9 8 10 7 6 5 7 3 5 6 8 7 10 8 4 7 8 6 9 9 5 3 1 8 9 6 8 5 4 6 10 9 8 3 2 7 9 5 3 10 3 5 10 8 假定两总体的等级标准差已知(这里用样本标准差代替总体标准差),

t检验和方差分析的前提条件及应用误区精编版

t检验和方差分析的前提条件及应用误区 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。 若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t 检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。

T检验及其与方差分析的区别

T检验及其与方差分析的 区别 Last revision on 21 December 2020

T检验及其与方差分析的区别 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。 t 检验:1.单因素设计的小样本(n<50)计量资料 2.样本来自正态分布总体 3.总体标准差未知 4.两样本均数比较时,要求两样本相应的总体方差相等 ?根据研究设计t检验可由三种形式: –单个样本的t检验 –配对样本均数t检验(非独立两样本均数t检验) –两个独立样本均数t检验 (1)单个样本t检验 ?又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差 别。 ?已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。 ?单样t检验的应用条件是总体标准未知的小样本资料( 如n<50),且服从正态分布。(2)配对样本均数t检验 ?配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。

?配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。 ?应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。 ?配对设计处理分配方式主要有三种情况: ①两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对; ②同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例资料; ③自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。 (3)两独立样本t检验 两独立样本t 检验(two independent samples t-test),又称成组t 检验。 ?适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。 ?完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。 ?两独立样本t检验要求两样本所代表的总体服从正态分布N(μ1,σ12)和N(μ2,σ 2),且两总体方差σ12、σ22相等,即方差齐性(homogeneity of variance, 2 homoscedasticity)。 ?若两总体方差不等,即方差不齐,可采用t’检验,或进行变量变换,或用秩和检验方法处理。 t 检验中的注意事项 1.假设检验结论正确的前提作假设检验用的样本资料,必须能代表相应的总

数理统计--参数估计、假设检验、方差分析(李志强) (3)

教学单元案例: 参数估计与假设检验 北京化工大学 李志强 教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用 (1)理解总体、样本和统计量等基本概念;了解常用的抽样分布; (2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法; (6)了解求区间估计、假设检验和方差分析的MA TLAB 命令 。 教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟 教学对象:大一各专业皆可用 一、统计问题 引例 例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为: 775,816,834,836,858,863,873,877,885,901 问:新产品亩产是否超过了800斤? 例2 设有一组来自正态总体),(2 σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2 σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii) 求2σ的95%置信区间。 例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5 只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~ 2σμi i N X . (1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.

t检验、u检验、卡方检验、F检验、方差分析

统计中经常会用到各种检验,如何知道何时用什么检验呢,根据结合自己的工作来说一说: t检验有单样本t检验,配对t检验和两样本t检验。 单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。 配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。 u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t 分布),当x为未知分布时应采用秩和检验。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用F检验。 简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。 在t检验中,如果是比较大于小于之类的就用单侧检验,等于之类的问题就用双侧检验。 卡方检验 是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。方差分析 用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。 其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括 单因素方差分析即完全随机设计或成组设计的方差分析(one-way ANOVA):用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因

假设检验及方差分析

实验四 假设检验 实验目的:通过此实验熟练掌握如何利用假设检验工具根据不同条件 选择相应检验工具进行检验,有助于学习者理解假设检验的过程及结果 实验要求:能够运用Excel 对总体均值进行假设检验,学会针对实际 背景提出原假设和备择假设来检验实际问题,并根据检验结果作出符合统计学原理和实际情况的判断和结论,加深对统计学方法的广泛应用背景的理解 假设检验与区间估计两者之间存在密切的关系,二者用的是同一个样本、同一个统计量、同一种分布,所以也可以用区间估计进行假设检验,两者结论是一致的。在Excel 中进行假设检验,除可按区间估计过程用公式和逆函数计算外,还备有专用的假设检验工具,包括Z —检验工具、T —检验工具和F —检验工具。使用这些工具,可以直接根据样本数据进行计算,一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。实验四主要介绍假设检验工具的使用。 一、假设检验的一般过程 假设检验主要是根据计算出的检验统计量与相应临界值比较,作出拒绝或接受原假设的决定。 根据全国汽车经销商协会报道,旧车的平均销售价格是10192美元。堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的100辆旧车。结果样本平均价格是9300美元,样本标准差是4500美元。在0.05的显著性水平下,检验H 0:10192≥μ H 1:10192<μ。问:假设检验的结论是什么?这名经理接下来可能会采取什么行动? 本例由于样本容量比较大,其均值近似服从正态分布,总体方差未知,需要用样本标准差来代替,选择T 统计量进行检验。T 统计量的计算公式如下: 单击任一空单元格,输入“=(9300-10192)/(4500/SQRT(100))”,回车确认,得出t 统计量为-1.982。单击另一空单元格,输入“=TINV(0.025,99)”,

方差分析与假设检验实验报告二

云南大学滇池学院 方差分析与假设检验实验报告二 学生姓名:方炜学号:20092123080专业:软件工程 一、实验目的和要求: 1、初步了解SPSS的基本命令; 2、掌握方差分析和假设检验。 二、实验内容: 1、为比较5中品牌的合成木板的耐久性,对每个品牌取4个样本作摩擦试验测量磨损量,得以下数据: (1)它们的耐久性有无明显差异? (2)有选择的作两品牌的比较,能得出什么结果?

2、将土质基本相同的一块耕地分成5块,每块又分成均等的4小块。在每块地内把4个品 种的小麦分钟在4小块内,每小块的播种量相同,测得收获量如下: 考察地块和品种对小麦的收获量有无显著影响?并在必要时作进一步比较。 3、为了研究合成纤维收缩率和拉伸倍数对纤维弹性的影响进行了一些试验。收缩率取0,4, 8,12四个水平;拉伸倍数取460,520,580,640四个水平,对二者的每个组合重复作两次试验,所得数据如下:

(1)收缩率,拉伸倍数及其交互作用对弹性有无显著影响? (2)使弹性达到最大的生产条件是什么? 三、实验结果与分析: 1、运行结果截图: 1、结果分析: (1)、Sig<0.05,耐久性有明显差异 (2)、由样本分析,品牌3分为一类;品牌1,2,5分为一类;品牌4分为一类。而品牌3和品牌4差距最大,品牌3的耐久性最差,品牌4的耐久性最好。 2、运行结果截图:

2、结果分析: (1)、地块(A组)Sig>0.05对小麦的收获量无显著影响,品种(B组)Sig<0.05对小麦的收获量有显著影响。 (2)、由图得,地块4最适合种小麦,地块1最不适合种小麦;而品种2的小麦收获量最大,品种4的小麦收获量最小。 3、运行结果截图:

8.假设检验和方差分析

假设检验和方差分析 目录 一.正态总体均值的检验 (1) 1.单个总体 (1) 2.两个总体 (2) 3.成对数据的t 检验 (3) 二.正态总体方差的检验——方差齐次检验 (3) 三.方差分析 (4) 1.单因素方差分析 (4) 2.均值的多重比较 (6) 3.方差分析前提的三个条件: (8) 4.双因素方差分析 (9) 一.正态总体均值的检验 R 中函数为:t.test() ,使用格式为: t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...) 其中,x 、y 是由数据构成的向量(如果只提供x ,则作单个正态总体的均值检验;提供x 和y 做两个总体的均值检验)。alternative 表示备择假设,two.sided (缺省)表示双边检验(10:H μμ≠),less 表示单边检验(10:H μμ<),greater 表示单边检验(10:H μμ>)。mu 表示原假设0μ,conf.level 是置信水平,即1α-,通常是0.95。var.equal 是逻辑变量,若var.equal=T 表示认为两样本方差相同,若var.equal=F 表示认为两样本。paired 是逻辑变量,表示是否进行配对样本t 检验,默认为不配对。 注意:假设检验的基本思想是:为了检验一个“假设”是否成立,就现假定这个“假设”是成立的。从这个假定也看产生的后果,如果导致一个不合理的现象出现,那么就表明原先的假定不成立,如果没有导出不合理的现象发生,则不能拒绝原来的假设,称原假设是相容的。这里的“不合理”,并不是形式逻辑中的绝对矛盾,而是基于人们实践中广泛采用的一个原则:小概率事件在一次观察中可以认为基本不会发生。 选择备择假设的原则:事先有一定信任度或者出于某种考虑是否要加以“保护”。 1.单个总体 例1:某种元件的寿命x (小时),服从正态分布2 (,)N μσ,其中μ,2σ均未知,16只原件的寿命(单位:小时)如下,问是否有理由认为元件的平均寿命大于225小时。

T检验及其与方差分析的区别.docx

T检验及其与方差分析的区别 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。 t 检验:1.单因素设计的小样本(n<50)计量资料 2.样本来自正态分布总体 3.总体标准差未知 4.两样本均数比较时,要求两样本相应的总体方差相等 ?根据研究设计t检验可由三种形式: –单个样本的t检验 –配对样本均数t检验(非独立两样本均数t检验) –两个独立样本均数t检验 (1)单个样本t检验 ?又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。 ?已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。 ?单样t检验的应用条件是总体标准 未知的小样本资料( 如n<50),且服从正态分布。(2)配对样本均数t检验 ?配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。 ?配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。 ?应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。 ?配对设计处理分配方式主要有三种情况: ①两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对; ②同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料; ③自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。 (3)两独立样本t检验 两独立样本t 检验(two independent samples t-test),又称成组t 检验。 ?适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。 ?完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。 ?两独立样本t检验要求两样本所代表的总体服从正态分布N(μ1,σ12)和N(μ2,σ 2),且两总体方差σ12、σ22相等,即方差齐性(homogeneity of variance, 2 homoscedasticity)。 ?若两总体方差不等,即方差不齐,可采用t’检验,或进行变量变换,或用秩和检验方法处理。 t 检验中的注意事项 1.假设检验结论正确的前提作假设检验用的样本资料,必须能代表相应的总体,同时各

07第七章 假设检验与方差分析 习题答案

第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u ,n x σμ0 -,标准正态; ),(),(2/2/+∞--∞n z n z σ σ αα 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0 μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5. C 6. B 7. C 8. A 9. D 10. A 11. D 12. C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。 1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。 ( × ) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t 检验均可使用,且两者检验结果一致。 ( √ ) 3. 方差分析中,组间离差平方和总是大于组内离差平方和。( × ) 不一定 4. 在假设检验中,如果在显著性水平0.05下拒绝了 00:μμ≤H ,则在同一水平一定可以拒绝假设00:μμ=H 。( × ) 不一定 5. 为检验k 个总体均值是否显著不同,也可以用t 检验,且与方差分析相比,犯第一类错误的概率不变。( × ) 会增加 6. 方差分析中,若拒绝了零假设,则认为各个总体均值均有显著性差异。( × ) 不完全相等 六、简答题 根据题意,用简明扼要的语言回答问题。 1. 假设检验与统计估计有何区别与联系? 【答题要点】 假设检验是在给定显著性水平下,计算出拒绝域,并根据样本统计量信息来做出是否拒

最新sas第九章 t检验和方差分析

s a s第九章t检验和 方差分析

第九章 t 检验和方差分析 在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。样本差异可能是由抽样误差所致,也可能是由本质的不同所致。应用统计学方法来处理这类问题,称为“差异的显著性检验”。若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。 第一节 t 检验 9.1.1 简介 t 检验是用于两组数据均值间差异的显著性检验。它常用于以下场合: 1.样本均值与总体(理论)均值差别的显著性检验 检验所测得的一组连续资料是否抽样于均值已知的总体 根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。 SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。 2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验) 比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。 SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。 3.两样本均值差异的显著性检验 作两样本均值差异比较的两组原始资料各自独立,没有成对关系。两组样本所包含的个数可以相等,也可以不相等。每组观测值都是来自正态总体的样本。 设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为: (1)方差齐(相等)时: ) /1/1(212 21n n s x x t +-= )2/(])1()1[(212 222112-+-+-=n n s n s n s

假设检验项目假设检验回归分析与方差分析

项目八 假设检验、回归分析与方差分析 实验1 假设检验 实验目的 掌握用Mathematica 作单正态总体均值、方差的假设检验, 双正态总体的均值差、方差比的假设检验方法, 了解用Mathematica 作分布拟合函数检验的方法. 基本命令 1.调用假设检验软件包的命令<False(或True), Known Variance->None (或方差的已知值20σ), SignificanceLevel->检验的显著性水平α,FullReport->True] 该命令无论对总体的均值是已知还是未知的情形均适用. 命令MeanTest 有几个重要的选项. 选项Twosided->False 缺省时作单边检验. 选项 Known Variance->None 时为方差未知, 所作的检验为t 检验. 选项Known Variance->20σ时 为方差已知(20σ是已知方差的值), 所作的检验为u 检验. 选项Known Variance->None 缺省 时作方差未知的假设检验. 选项SignificanceLevel->0.05表示选定检验的水平为0.05. 选项FullReport->True 表示全面报告检验结果. 3.检验双正态总体均值差的命令MeanDifferenceTest 命令的基本格式为 MeanDifferenceTest[样本1的观察值,样本2的观察值, 0H 中的均值21μμ-,选项1,选项2,…] 其中选项TwoSided->False(或True), SignificanceLevel->检验的显著性水平α, FullReport->True 的用法同命令MeanTest 中的用法. 选项EqualVariances->False(或True)表示两个正态总体的方差不相等(或相等). 4.检验单正态总体方差的命令VarianceTest 命令的基本格式为 VarianceTest[样本观察值,0H 中的方差20σ的值,选项1,选项2,…] 该命令的选项与命令MeanTest 中的选项相同. 5.检验双正态总体方差比的命令VarianceRatioTest 命令的基本格式为

3.3总体方差的假设检验

§3 检验母体方差 3.1检验正态母体的方差——2 χ检验 母体),(~2σμN X ,2 ,σμ均未知,试对 2 σ与2 0σ有无显著差异作假设检验. ① 在 母体上作 假设 ?=2 2 0:σσH 2 021:σσ≠H ②检验统计量)1( ~ )1(2 20 2 20 --=*n S n H χσχ ③给定显著水平α,如图存在 )1(22 1-- n α χ 和)1(2 2 -n αχ,使 2 )}1({)}1({2 2 22 2 12α χχχ χαα = ->=-<- n P n P 故取拒绝域 } )1()1(),,,{(2 2 222 1221->-<=-n n x x x W n ααχχχχ或

④决策:当抽样结果是 W x x x n ∈),,,(21 时,拒绝0H ,认为2 σ与20σ有 显著差异;否则接受0H ,认为2 σ与20 σ无 显著差异. 例3.3.1 某细纱车间纺出的一种细纱支数X 的标准差2.10=σ,现从某日纺出的一批细纱中随机抽出16缕进行支数 测量,算得子样标准差1.2*=s ,问:纱的 均匀度有无显著变化(取05.0=α)?假 定母体X 的分布是正态的。 解: 设该日纺出的纱的支数 ),(~2 σμN X ,2 ,σ μ均未知, 作假设?=2202.1:σH 2 21 2.1:≠σH 检验统计量)1(~ )1(22 022 --=*n S n H χσχ 给定显著水平α,拒绝域为 } )1()1(),,,{(2 2 222 1221->-<=-n n x x x W n ααχχχχ或

这时16=n ,2.10=σ,1.2* =s ,从而 94.452 =χ,又05.0=α,查表得 262.6)15()1(22975 .02 1==-- χχαn , 488.27)15()1(22 025 .02 ==-χχαn , 可见)1(2 2->n αχχ,故应拒绝0H ,认为 这天细纱的均匀度有显著变化。 例3.3.2 ),(~2 σμN X , 2 ,σμ均未知, 当45>n ,作如下假设检验 ?=2020:σσH 2021:σσ≠H 检验统计量取为2 02 2 )1(σχ*-= S n ,证明:给 定显著水平α,则拒绝域为 } )1(2)1({})1(2)1({2 22 2ααχχu n n u n n W ---≤-+-≥= . 证明:作假设?=2020:σσH 2 021:σσ≠H , 0H 成立时检验统计量

相关文档
最新文档