(完整版)三大分布及其分位数
概率论-分布及其分位数

U—分布 正态总体样本均值的分布
设总体 X ~ N , 2 , X1, X2,..., Xn 是 X 的一
个样本, 则样本均值服从正态分布X1 nFra bibliotekn i 1
Xi
~
N
,
2
n
U
X
1 n
n i1
Xi
~
N 0,1
n n
概率分布的分位数(分位点)
定义 对总体X和给定的 (0<<1),若存在x,
f(y)
上分位数或上侧临界值,
其几何意义见图5-5所示.
其中f(y)是 2-分布的概率密度. O
图5-5 2(n) x
显然,在自由度n取定以后,2(n)的值只与有关.
例如,当n=21,=0.05时,由附表3(P254)可查得,
02.05(21) 32.67 即 P 2(21) 32.67 0.05.
即 t(n)≈u , n>45.
一般的t分布临界值表中,详列至n=30,当 n>30就用标准正态分布N(0, 1)来近似.
四、F分布
定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且
与相互独立,则称随机变量
F
X Y
n1 n2
服从第一自由度为n1,第二自由度为n2的F分布,
记作 F~F(n1,n2).
02.1(9)≈查 14.684.
故
表
≈
14.684x
16 9
≈26.105
n2) F 2
图6-4
(n1,
n2)
x
例 设总体X~N( , 42), X1,X2,…,X10是n=10简
单随机样本, S2为样本方差,已知P{S2>}=0.1,求
概率论与数理统计 7.2 数理统计中的三大分布

7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
三大分布

0.4
f n ( x)
N(0,1) n = 10 n=5 n=2 n=1
0.3
0.2
0.1
0 -3
-2
-1
0
1
2
x
3
t-分布的概率密度函数
t分布的性质
1.以0为中心,左右对称的单峰分布; 2.t分布是一簇曲线,其形态变化与n(确 切地说与自由度ν)大小有关。自由度ν越 小,t分布曲线越低平;自由度ν越大,t分 布曲线越接近标准正态分布(u分布)曲线
2 2
2
F
X / n1
n n Γ ( 1 2 2 ) n1 n1 n2 f n1 , n 2 ( x ) Γ ( 2 ) Γ ( 2 ) n 2
n1 n 2
x 0,
n1 2
1
n1 1 x n2
t
n (x ) s
~ t ( n 1)来自 结论二:F sx1 , x2 , , x m
sx / 1
2 2 y
2
/
2 2
~ F ( m 1, n 1)
设 的样本,且此两样本相互独立,记
sx
2
2 y N ( 1 , 1 ) 的样本,1 , y 2 , , y n 是来自
sx / 1
2
2
( n 1) s
2 2
s /
2 y
2 2
~ F ( m 1, n 1)
所以
结论三:
( x y ) ( 1 2 ) sw 1 m n 1
~ t ( m n 2)
sw
( m 1) s ( n 1) s
统计三大分布

n1 n 2 2
,
x0 x0
,
(6-17)
图6.4是四组不同参数下该密度函数的图像.
1.0
n1 20 , n 2 10 n1 5 , n 2 10 n1 5 , n 2 5 n1 1, n 2 5
0.8
0.6
0.4
0.2
0.0 0 1 2 3 4 5
x
ቤተ መጻሕፍቲ ባይዱ图 6.4
F 分布的概率密度函数
另外,由定义6.3,立即有以下结论: 1 若F ~ F ( n1 , n 2 ) ,则 F ~ F ( n , n ) . 1 这个结论可用于计算分布 F ~ F ( n , n ) 的 -上侧 分位数 F ( n 1 , n 2 ). 具体地说,我们有 1 F (n , n ) . (6-18) F (n , n ) 事实上,由 F ~ F ( n 1 , n 2 ) 、 1 ~ F ( n , n ) 以及上 F 侧分位数的定义可推出
(n)
2
x
图 6.2
对不太大的n,如 n 值,而对较大的n,则可用(6-11)近似计 算 2 ( n ) n 2 n U , (6-12) 其中U 是标准正态分布N ( 0 , 1) 的 -上侧分位 数,可通过附表2查出.
2
60,可用附表3查 ( n ) 的
三、F -分布
定义6.3 设 X ~ ( n 1 ), Y ~ ( n 2 )且X与Y独立,则称
2 2
X /n (6-16) F Y /n 所服从的分布是自由度为 ( n 1 , n 2 ) 的F-分布, 记作F ~ F ( n 1 , n 2 ) ,这是为纪念英国著名统计学家费歇 (R.A. Fisher,1890-1962)而命名的.F-分布也 是数理统计的一个重要分布. 注意到(6-16)的商结构,则根据随机变量商的 密度计算公式(3-34)可求得F-分布 F ( n 1 , n 2 ) 的概率密度函数为(过程从略,详见[3, 4])
第3节 常用统计分布(三个常用分布)

例2
设X
~
N
(
,
2
),
Y
2
~
2 (n),且X ,Y相互独立,
试求 T X 的概率分布.
Yn
解 因为X ~ N(, 2),所以 X ~ N(0,1)
又Y
2
~
2 (n),且X ,Y独立,则
X
与Y
2
独立,
由定理得
T (X ) / X ~ t(n) (Y / 2) / n Y n
n
事实上,它们受到一个条件的约束:
Xi nX
i 1
n
i 1
Xi
X
1
n
(
i 1
Xi
nX )
1
0
0.
例1
设X1 ,
X 2 ,
,
X
为
6
来
自
正
态
总
体N
(0,1)的
一
组
样
本,
求C1
,
C
使
2
得
Y C1( X1 X 2 )2 C2( X 3 X4 X5 X6 )2
服 从 2分 布.
解
X1
2
4
则C1 1 2 ,C2 1 4 .
3. t 分布 定义 设 X ~ N (0, 1), Y ~ 2 (n), 且 X , Y
独立,则称随机变量 T X 服从自由度为 n Y /n
的 t 分布, 记为T ~ t(n).
t 分布又称学生氏(Student)分布. t(n) 分布的概率密度函数为
2. 2分布(卡方分布)
定义、设 X1, X 2 ,L , X n 相互独立,同服从 N (0, 1)
统计三大分布

根据独立随机变量商的密度公式(3-32),
可以证明(过程从略):(6-13)中的
Tn
概率密度函数为
根据独立随机变量商的密度公式(3-32),可
以证明(过程从略):(6-13)中 Tn 的概率
密度函数为
, x . fn(x)
Γ(
n1 2
)
n
Γ(
n 2
)
1
x2 n
n1 2
(6-14)
另外,t -分布具有以下性质:
变量不小于该数的概率为 . 比如,若记 2-
变量
2 n
的
-上侧分位数为,则满足(见图
6.2).
fn (x)
2 (n)
x
图 6.2
对不太大的n,如
n
60,可用附表3查
2
(n)
的
值,而对较大的n,则可用(6-11)近似计
算
2 (n) n 2n U , (6-12)
其中U 是标准正态分布N(0,1)的 -上侧分位
数,可通过附表2查出.
二、t -分布
定则 自义称由6.2度T为设n nX的Y~XtN/ -n(0分,1)布,Y,(6~记-123作()n)所,Tn 服X~ t与从(n)Y的.独t分-立分布,布是
也称为学生分布,是英国统计学家戈塞特 (Goset,1876-1937)在1908年“Student”
的笔名首次发表的,这个分布在数理统计 中也占有重要的地位.
,则
顺便指出,自由度为1的t -分布也称为柯西
(Cauchy)分布,它以其数学期望和方差
均不存在而闻名(见例4.3).
记t -分布t(n) 的 -上侧分位数为t (n),附表4
给出了不同n和 所对应的t (n) 数值. 另外,
三种分布介绍(正态分布,伯努利分布,泊松分布)

1、正态分布正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
当μ=0,σ=1时,正态分布就成为标准正态分布N(0,1)。
概率密度函数为:正态分布的密度函数的特点是:关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,图像是一条位于x轴上方的钟形曲线。
2、伯努利分布如果随机变量X只取0和1两个值,并且相应的概率为:则称随机变量X服从参数为p的伯努利分布,若令q=1一p,则X的概率函数可写为:伯努利分布(二点分布)的期望E(X)=p,D(X)=p(1-p)。
(其中,离散数据的方差计算公式为D(X)=E{[X-E(X)]^2})n重伯努利分布(二项分布)的期望E(X)=np,D(X)=np(1-p)。
3、泊松分布在统计学上,只要某类事件满足三个条件,它就服从"泊松分布"。
三个条件分别是:①事件X的发生是小概率事件②事件X的发生是随机而且互相独立的③事件X发生的概率相对稳定。
泊松分布的公式为:各个参数的含义:单位时间(或单位面积)内随机事件的平均发生率,即P(X=k)事件X发生k次的概率,λ表示事件X稳定发生的概率。
当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似。
设X~B(n,p),当n很大,p很小,且λ=np适中时,有P(x=k)≈λ^k/k! ·e^(-λ),推导过程如下所示:为第二重要极限公式,上面的推到会涉及到。
数学中三种分布

1.分布若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution),其中参数n称为自由度,正如正态分布中均值或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。
记为或者卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,分布近似为正态分布。
对于任意正整数k, 自由度为k的卡方分布是一个随机变量X的机率分布。
[1]2.特点概率密度函数其中,是伽玛函数。
期望和方差分布的均值为自由度n,记为E() = n。
分布的方差为2倍的自由度(2n),记为D() = 2n。
3. 性质1)分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数n 的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1.2) 分布的均值与方差可以看出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若互相独立,则:服从分布,自由度为;服从分布,自由度为3概率表分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在χ2分布中得对每个分布定制相应的概率值,这通过χ2分布表中列出不同的自由度来表示,在χ2分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是χ2值以上χ2分布曲线以下的概率。
由于χ2分布概率表中要列出很多χ2分布的概率值,所以χ2分布中所给出的P 值就不象标准正态分布中那样给出了400个不同的P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查χ2分布概率表时,按自由度及相应的概率去找到对应的χ2值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§1.5 常用的分布及其分位数
卡平方分布、t分布及F分布都是由正态分布所 导出的分布,它们与正态分布一起,是试验统计 中常用的分布。
1. 卡方分布
当X1、X2、…、Xn相互独立且都服从N(0,1)时,Z XFra bibliotek2 i
的分布称为自由度等于n的x2(n)分布, 记作 Z~ x2(n)(n).它的分布密度
3. F分布
若X与Y相互独立,且X~x2 (n),Y~x2 (m),则
ZX Y nm
的分布称为第一自由度等于n、第二自由度等于m的 F分布,记作Z~F (n, m),它的分布密度
2020/8/9
4
研究生概率统计讲义
p(
z
)
n
n
2m
m 2
n 2
nm 2
m 2
•
n 1
z2
nm
(mnz) 2
10
研究生概率统计讲义 5)F分布的α分位数记作Fα(n , m) Fα(n , m)>0,当X~F (n , m)时,P{X<Fα(n , m)}=α
2020/8/9
11
2020/8/9
7
研究生概率统计讲义
2020/8/9
8
研究生概率统计讲义 3)卡平方分布的α分位数记作x2α(n)。
P{X< x2α(n)}=α
2020/8/9
9
研究生概率统计讲义 4)t 分布的α分位数记作tα(n)
当X~t (n)时,P{X<t α(n)}=α,且与标准正态分布 相类似。
2020/8/9
2020/8/9
6
研究生概率统计讲义
因为1-F(λ)=α,F(λ)=1-α,所以上侧α分位数λ就 是1-α分位数 x 1-α;
F(λ1)=0.5α,1-F(λ2)=0.5α,所以双侧α分位数
λ1就是0.5α分位数 x 0.5α,双侧α分位数λ2就是
1-0.5α分位数
x
。
1-0.5α
2)标准正态分布的α分位数记作 uα,0.5α分位数 记作u 0.5α,1-0.5α分位数记作u 1-0.5α。
用的需要,有三种不同的称呼,即α分位数、上侧α分 位数与双侧α分位数,它们的定义如下:
当随机变量X的分布函数为 F(x),实数α满足0 <α<1 时,α分位数是使P{X< xα}=F(xα)=α的数xα。
上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ,
双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使 P{X>λ2}=1-F(λ2)=0.5α的数λ2。
i
2020/8/9
1
研究生概率统计讲义
p(
z)
2
n 2
1
n 2
x
n 2
1
e
z 2
,
z0
0,
otherw ise,
x2(n)分布是非对称分布,具有可加性,也叫再生性, 即当Y与Z相互独立,且Y~ x2(n),Z~ x2(m), 则Y+Z~x2 (n+m)。
2020/8/9
2
研究生概率统计讲义
的分布称为自由
度等于n的t分布,记作Z ~ t (n),它的分布密度
2020/8/9
p(z) =
(
n+1 2
)
n
(
n 2
)
1+
z2 n
-
n+1 2
3
研究生概率统计讲义
请注意:t分布的分布密度也是偶函数, 且当n>30时,t分布与标准正态分布N(0,1)的密度 曲线几乎重叠为一。这时, t分布的分布函数值 查N(0,1)的分布函数值表便可以得到。
2. t分布
定义:若连续型随机变量X具有概率密度函数
f(x)
(k 1) 2
(1
x2
k 1
) 2 , x (, )
k ( k ) k
2
t分布是英国统计学家W.S.Gosset(1908)提出,笔名
Student,故又称Student分布.
X~N(0,1),Y~x2 (n),则Z =
X Y /n
,
0,
z0 otherw ise
请注意:F分布也是非对称分布,它的分布密度与自 由度的次序有关,当Z~F (n, m)时,1/ Z ~F (m ,n)。
4. t分布与F分布的关系
若X~t(n),则Y=X2~F(1,n)。
2020/8/9
5
研究生概率统计讲义
5. 常用分布的分位数
1)分位数的定义 分位数或临界值与随机变量的分布函数有关,根据应