统计量的分布

合集下载

63常用统计量的分布

63常用统计量的分布

§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。

望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。

统计量及其分布

统计量及其分布
2 最小,其中c为任意给定常数。 ( x x ) i
样本均值的抽样分布 (例题分析)
【例】设一个总体含有4 个个体,分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下。
总体均值和方差

总体的频数分布
X
i 1
N
i
N
N
2.5
2
2 ( X ) i i 1
0.02 0 2 1 0.1
21 Φ0.2
0.8414
(4) 样本 k 阶(原点)矩
1 n k Ak X i , k 1, 2, ; n i 1
1 n k 其观察值 k x i , k 1, 2, . n i 1
n n 1 2 1 2 2 E( S ) E X i nX (Xi X ) E n 1 i 1 n 1 i 1
2
1 n 2 2 E ( X i ) nE ( X ) n 1 i 1 2 1 n 2 2 2 ( ) n 2 n 1 i 1 n
n

k 1
n
2

2
n
,
定理 设总体X的期望E(X) = ,方差D(X) = 2,X1, X2,…,Xn为总体X的样本, X,S2分别为样本均值 和样本方差,则
E( X ) E( X )
D( X ) 2 D( X ) n n
E( S 2 ) D( X ) 2
思考:在分组样本场合,样本均值如何计算? 二者结果相同吗?
x1 f1 x n f n 其中 x n

统计量的分布

统计量的分布

S12
2 1
S22
2 2
~
F(n1 1, n2 1)
U—分布 正态总体样本均值的分布
设总体 X ~ N , 2 , X1, X2,..., Xn 是 X 的一
个样本, 则样本均值服从正态分布
U
X
1 n
n i1
Xi
~
N
0,1
n n
X
1 n
n i 1
Xi
~
N
,
2
n
2 ——分布
量和样本方差;且两个样本相互独立,则统计量
证明
S12 S22
由已知条12件知22
~
F(n1 1, n2 1)
且(n相1 互112独)S立12 ,~由F2(n分1 布 1的),定义(n有2
1)S22
2
2
~
2(n2
1)
(n1 1)S12
2 1
(n2 1)S22
2 2
(n1 1) (n2 1)
在附表5、6、7中所列的值都比较小,当 较大
时,可用下面公式
F1(n1, n2)
1 F(n2, n1)
例如,F0.99(18, 2)
1 F0.01(2,18)
1 6.01
≈0.166
F 分布的双侧分位数
称满足条件
P F
F12(n1, n2)
P F
F 2
(n1,
n2)
2
的F 1
2
(n1,
n2),
P{ X x 2} ,
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x

三大抽样分布(1)概率论与数理统计习题 概率论与数理统计)

三大抽样分布(1)概率论与数理统计习题 概率论与数理统计)


x2 x2

~ F (1,1)
4. 正态总体的样本均值与样本方差的分布
正态总体 N ( , 2 ) 的样本均值和样本方差
有以下两个重要定理.
定理一
设 X1, X 2, , X n 是来自正态总体N (, 2 )
的样本, X 是样本均值, 则有
(1) X ~ N (, 2 / n).即 X ~ N (0,1)
样本, X , S 2 分别是样本均值和样本方差, 则有
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
2
~ 2(n 1),
且两者独立, 由 t 分布的定义知
X (n 1)S 2 ~ t(n 1). / n 2(n 1)
n
2
πn

1
n 2


1

t2 n


n1 2


,
t
t 分布的概率密度曲线如图
显然图形是关于
t 0对称的.
当 n 充分大时, 其
图形类似于标准正
态变量概率密度的
图形. 因为lim h(t)
1
t2
e 2,
n

所以当 n 足够大时 t 分布近似于 N (0,1) 分布,
1,
因为 1 F
~ F (n2 , n1 ),
所以
P
1 F

F1
(n2
,
n1
)

1


,
比较后得
F1
(n2 ,

统计量及其分布

统计量及其分布

思考题
设 X1, X2 , … , Xn 是取自正态总体 N (, 2 ),
的一个样本,求 E( XS 2 ) ?
定理 2 设 X1, X2 , … , Xn 是取自正态总体 N (, 2 )
的样本,X 和S 分别为样本均值和样本均方差,则有
1) X ~ N(0, 1); / n
2) X ~ t(n 1).
nx 2 ];
③ s
1 n 1
n i 1
( xi
x )2
;

ak
1 n
n i 1
xik ,
k 1, 2
;
⑤ bk
1 n
n
(xi x )k ,
i 1
k
1, 2
.
例1 设总体X 的期望为 E(X ) , 方差为 D(X ) 2 其样本为 X1, X2, , Xn , 求E(X ), D(X ), E(S 2) .
为t分布的上 分位点。
t1 (n) t (n)
若 0.5,直接查表;若 0.5, t (n) t1 (n).
当 n 45 , t (n) z .
(3) F-分布
设随机变量X与Y相互独立,且 X ~ 2 (n1), Y ~ 2 (n2 ),
则随机变量
F
X Y
/ n1 / n2
所服从的分布是自由度为 (n1, n2 )
~
F (2,
2)
作 业 17
P137: 4 P147: 4
1.6664.
解:因为
(n 1)
2
S
2
~ 2(n 1)
15S 2
2
~ 2(15)
P
S
2 2
1.6664

正态总体统计量的分布

正态总体统计量的分布

§5.5 正态总体统计量的分布1. 单个正态总体的统计量的分布从总体X 中抽取容量为n 的样本n X X X ,,,21 ,样本均值与样本方差分别是()212111,1∑∑==--==n i i n i i X X n S X n X . 定理1 设总体X 服从正态分布()2,σμN ,则样本均值X 服从正态分布⎪⎪⎭⎫ ⎝⎛nN 2,σμ,即⎪⎪⎭⎫ ⎝⎛n N X 2,~σμ证 因为随机变量n X X X ,,,21 相互独立,并且与总体X 服从相同的正态分布()2,σμN ,所以由§4。

3中的定理知,它们的线性组合X 服从正态分布⎪⎪⎭⎫ ⎝⎛nN 2,σμ。

定理2 设总体X 服从正态分布()2,σμN ,则统计量nX u σμ-=服从标准正态分布()1,0N ,即()1,0~N nX u σμ-=由定理1结论的标准化即得到定理2. 定理3 设总体X 服从正态分布()2,σμN ,则统计量()∑=-=ni iX X12221σχ服从自由度为n 的2χ分布,即()()n X Xni i21222~1χσχ∑=-=证 注意到()2,~σμN X i ,则()n i N X i ,,2,1 ,1,0~ =-σμ又上述统计量相互独立,并按照2χ分布的定义可得结果。

定理4 设总体X 服从正态分布()2,σμN ,则 (1)样本均值X 与样本方差2S 相互独立; (2)统计量()2221σχS n -=服从自由度为1-n 的2χ分布,即()()1~12222--=n S n χσχ证明略。

定理5 设总体X 服从正态分布()2,σμN ,则统计量nSX t μ-=服从自由度为1-n 的t 分布,即()1~--=n t nSX t μ证 由定理2知,统计量()1,0~N nX u σμ-=又由定理4知,统计量()()1~12222--=n S n χσχ因为X 与2S 相互独立,所以u 与2χ也相互独立,于是根据t 分布的定义得结论。

§1.4 顺序统计量的分布

§1.4 顺序统计量的分布

§1.4 顺序统计量≤≤≤=1212(1)(2)()1212()()(1)(2)()12(,,,) (,,,),(,,,)(,,,),(1,2,,), (,,,)(,,1.4.1 ,n n n n n k k n X X X X x x x x x x X X X x x x X x k n X X X X X 设是从总体中抽取的一个样本,是其一个观测值将观测值按由小到大的次序重新排列为一、顺序统计量的定义当取值为时定义取值为由此得到的称为样本 定义(1)(2)()) (,,,)..n n X x x x 的对应的成为其顺序统计量观察值≤≤≤≤===-称为样本的特别地,称为 称为 称为由于每个都是样本的函数,所以都是随机变量第个顺序统计量最小顺序统计量最大顺序统计量. 一般它们不相互独立.设总体的分布为样本极差.例1注:: ()12(1)1()1()()(1)()12(1)(2)():(,,,)min .max .(,,,),,,.k n i i nn i i nn n k n n X X X X X X X X R X X X X X X X k X X X 仅取的离散均匀分布,其分布列为0, 1, 2----=--<<<=-><=-≤-=-+-=---⎰设总体分布为为样本,则的联合密度函数为 令 由可以推出 则该分布参例数为 12(1)()21,()(1)(1)()122(0,1),,,,(,)(,)(1)(),0 1.,001()(1)[3()](1)(1).(1n n n n n n r n R n X U X X X X X f y z n n z y y z R x x R X X R R f r n n y r y dyn n r r n 的贝塔分布.,2)。

统计量的分布

统计量的分布

=0 n
n
(Xi X)Xi nX
i1
i1
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
2
(
n
) 的值只与有关.
例如,当n=21,=0.05时,由附表可查得
02.05(21) 32.67 即 P2 (2 1 ) 3 2 .6 7 0 .0 5 .
2分布的双侧分位数
的把数满足12P 2( n),2 22(1 2 n )2称(n 为) 2f分(P x布) 的2 双 侧 2 2 分(n 位) 数2
查表 x 0 时 , (x ) 的 值 可 以 查 表
x 0 时 , ( x ) 1 (x )
例 X ~N(0,1)
P ( 1X2) ( 2 ) ( 1 ) 0 . 9 7 7 2 0 . 8 4 1 3 0 . 1 3 5 9 P (X1) ( 1 ) 1 ( 1 ) 1 0 . 8 4 1 3 0 . 1 5 8 7
P{Xx2},
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x
标准正态分布的分位数
在实际问题中, 常取0.1、0.05、0.01.
常用到下面几个临界值:
u0.05 =1.645, u0.05/2=1.96,
u0.01 =2.326 u0.01/2=2.575
2分布的数学期望与方差
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
2分布的可加性
设 1 2~2 (n 1 ),
2 2~2 (n 2),

2 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3准则
X~N(,2)
X的取值几乎都落入以为中心,以3为半径 的区间内。这是因为:
P 3 X 3 ( 3 ) ( 3 )
( 3 ) [ 1 ( 3 ) ] 2 ( 3 ) 1 0 . 9 9 7 4
F(x) 0.9974
X3
是小概率事件
3
3
概率分布的分位数(分位点)
2
(n1)
X Sn T~t(n1)
定理3 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分别
t 分布的数学期望与方差
设T~t (n),则E(T)=0,D(T)= nn2. (n2)
定理2
设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则统计量
TX~t(n1)
Sn
证 由于 X 与S 2相互独立,且
UXn ~ N(0,1),
(n1)S2
2
~2(n1)
由定义得
X
n
(n1)S2
的一个样本, 则称统计量 2X1 2X2 2LXn 2服从自
由度为n的 2 分布,记作 2 ~ 2(n)
自由度是指独立随机变量的个数, df n
2 ( n ) 分布的密度函数为
f
(y)
2n
1
2n
2
yn
e 21 y
2,
y0
0,
y0
(n1)n!
2 ( n ) 分布密度函数的图形
f(y)
0.5 0.4
解 成绩X服从 N ,2
PX90120.0228 PX60830.1588
526
526
录取率为 155 0.2947
526
可得 P X 9 0 1 9 0 1 0 .0 2 2 8 0 .9 7 7 2
PX60 600.1588

6010.15880.8412
查表得 90 2.0
定义 对总体X和给定的 (0<<1),若存在x,
使P{X≥x} =, 则称x为X分布的上侧分位数或
上侧临界值. 如图.
y
P{X≥x} =
x f(x)dx
o
x x
y
若存在数1、2,使
P{X≥1}=P{X≤2}
2
则称1、2为X分布的双
2
2 o
侧分位数或双侧临界值.
x
1
2
2
1 x
x 2
双侧 分位数或双侧临界值的特例

Xi
~
N(0,1)且各
X
i
相互独立,
由定义得
n
2i n1Xi2i1(X i2)2~2(n).
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
(1)式的自由度为什么是n-1?
Distribution Function 分布函数的定义
设X为一随机变量,则对任意实数x, (X<x)是一个随机事件,称
F(x)P(Xx)
为随机变量X的分布函数
F(x)是一个普
通的函数!
定义域为 (-∞,+∞); 值域为 [0,1]。
分布函数表示事件的概率
引进分布函数F(x)后,事件的概率都 可以用F(x)的函数值来表示。
n=1
0.3
0.2 n=4
0.1
n=10
0 1 3 5 7 9 11 13 15 17 x

其图形随自由度的 不同而有所改变.
P2(n ) 2(n )
2分布表
2分布的上分位数
满足
的数
P 2 ( n )为2 (n 2)分 布的 2 (n )f (y) 2 (n )f(y )d y
上分位数或上侧临界值,
n
从表面上看, (X i X )2是n个正态随机变量 X i X 的平方和, i1
但实际上它们不是独立的, 它们之间有一种线性约束关系:
=0 n
n
(Xi X)Xi nX
i1
i1
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(1)式的自由度是n-1.
b
P{axb}a f(x)dx
则称X为连续型随机变量, f (x) 称为X 的概 率密度函数,简称概率密度或密度函数.
x
分布函数 F(x) f (t)dt
密度函数在区间上的积分 = 随机变量在区间上取值的概率
P {x1Xx2}xx 12 f(x)dx
x1
x2
概率密度函数的性质 非负性
统计量的分布称为抽样分布。
由于正态总体是最常见的总体,因此主要讨论正态 总体下的抽样分布。
由于这些抽样分布的论证要用到较多的数学知识, 故在本节中,主要给出有关结论。
概率密度函数
Probability density function p.d.f.
定义 设X为一随机变量,若存在非负实函数 f (x) , 使对任意实数 a < b ,有
或双侧临界值. 见图.
2
(
n
)
为 2分布的上2
显然, 分位数.
2
2
2
2 1
2
(
n
)

2分布的上1
2
O
分位数.
2 1
2
(
n
)
2
2(n )
x
如当n=8, =0.05时,
122(n)02.975(8)2.18
2(n)02.025(8) 17.53 2
2分布的数学期望与方差
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
P(X<b)=F(b) P(X≥b)=1﹣ P(X<b)=1 - F(b) P(a≤X<b)=F(b) ﹣ F(a) P(a≤X<b)=P(X < b)-P(X<a)= F(b)- F(a)
密度函数和分布函数的关系 积分关系
x
F(x) f(x)dx
x
F(x)P{Xx} f (x)dx
查表 x 0 时 , (x ) 的 值 可 以 查 表
x 0 时 , ( x ) 1 (x )
例 X ~N(0,1)
P ( 1X2) ( 2 ) ( 1 ) 0 . 9 7 7 2 0 . 8 4 1 3 0 . 1 3 5 9 P (X1) ( 1 ) 1 ( 1 ) 1 0 . 8 4 1 3 0 . 1 5 8 7
2分布的可加性
设 1 2~2 (n 1 ),
2 2~2 (n 2),

12 ,
2 2
相互独立,
则 122 2~2(n1n2)
性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
n
(Xi )2
的样本,则 i1 2
~ 2(n)
证明 由已知,有
Xi~N( , 2)且X1,X2,…,Xn相互独立,
1y
2
中间高 两边低
-
+ x
对称性 单调性 拐点
关于 x = 对称
(- ,)升,(,+ )降
(,
1
1
e 2);
2
f最大 ()
1
2
μ,σ对密度曲线的影响

1 21 1 22
相同,不同
图形相似,位置平移
2
1 0.75 2 1.25
不同,相同 越小,图形越陡; 越大,图形越平缓
随机变量的分布函数
f(x) 0 , x ( , )
规范性
f (x)
f (x)dx 1
P { x }1
正态分布 Normal Distribution
若连续型随机变量X的概率密度为
f(x) 1
(x)2
e22
2
,(0)为 常 数
则称X服从参数为 ,2 正 态 分 布 , 记 为
X ~N(,2)
正态分布的密度函数的性质与图形
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
与以下补充性质的结论比较:
性质 设(X1,X2,…,Xn)为取自正态总体
n
(Xi )2
X~N( , 2)的样本,则 i1 2
当X的分布关于y轴对称时, 若存在 x 2 , 使
P{Xx2},
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x
标准正态分布的分位数
在实际问题中, 常取0.1、0.05、0.01.
常用到下面几个临界值:
u0.05 =1.645, u0.05/2=1.96,
u0.01 =2.326 u0.01/2=2.575
其几何意义见图所示.
其中f(y)是 2-分布的概率密度. O
2
(
n
)
x
显然,在自由度n取定以后,
2
(
n
) 的值只与有关.
例如,当n=21,=0.05时,由附表可查得
02.05(21) 32.67 即 P2 (2 1 ) 3 2 .6 7 0 .0 5 .
2分布的双侧分位数
的把数满足12P 2( n),2 22(1 2 n )2称(n 为) 2f分(P x布) 的2 双 侧 2 2 分(n 位) 数2
相关文档
最新文档