常用统计分布
63常用统计量的分布

§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。
望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。
常见统计分布

t
上侧 临界值 t ( n) 可以根据自由度n 和 概 率 查 t 分布表求得. 查表时要先看清楚表头的 名称或概率表达式,若为上侧临界值表,则可以
直接查用. 若为双侧临界值表,则需换算后查用.
由于 t 分布具有对称性, 称 P ( T t ( n)) 2
2
2
t (n)
2
2
F
Y n2
服从自由度为n1及 n2 的F分布,n1称为第 一自由度,n2称为第二自由度,记作 F~F(n1,n2) .
1 Y n2 由定义可见,F X n ~F(n2,n1) 1
F分布
性质1 若X~F(m,n), 则1/X~F(n,m) 性质2 若X ~t(n),则X2~F(1,n)
E(X) n , D(X) 2n
例1 : 设总体X ~ N(0,1), 从总体中抽取容量为 6的样本 X 1 , X 2 , X 6设 Y ( X 1 X 2 X 3 ) 2 ( X 4 X 5 X 6 ) 2 试确定常数C, 使CY服从 2分布.
(2)分位数
2 2
有时把u , u 统称为临界值.
2
2.
2分布
(1)定义
分布是由正态分布派生出来的一种分布.
2
定义: 设 X 1, X 2 ,, X n 相互独立, 都服从正态
分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布. 2 2 记为 ~ (n)
2
X X2 Xn
2 分布的密度函数与自由 度 n 有关,n 可以
看作参数.
f ( x)
n1
n4
n 10
10 15 20
[课件]概率与统计 6.2 常用统计分布
![[课件]概率与统计 6.2 常用统计分布](https://img.taocdn.com/s3/m/1b84a2116c175f0e7cd1370c.png)
2 Y = ∑ Xi 2 i =n +1 1
电子科技大学
n +n2 1
常用统计分布
则
Y +Y = ∑ 1 2
n +n2 1 i =1
2 Xi
相互独立, 且Xi , i=1,2,…,n1+n2 相互独立,Xi~N(0,1), 从而 Y1+Y2~ χ2 (n1+n2).
电子科技大学
常用统计分布
总体, 总体,个体 简单随机样本 正态总体的 2个抽样定理 个抽样定理
统计量
样本均值 样本方差 样本矩(样本相关系数) 样本矩(样本相关系数)
统计量的分布
χ2分布
t 分布 F分布 分布
分位数 结构定理
电子科技大学
常用统计分布
设随机变量X 服从正态分布N(0,1), 对给 例6.2.1 设随机变量 服从正态分布 定的α(0<α<1),数uα满足 , 定的 , P{X > uα} = α
电子科技大学
T~t(n) ~
又称学生氏分布--第一个研究者以 又称学生氏分布--第一个研究者以Student --第一个研究者
常用统计分布
定理6.2.2 设随机变量 Y 相互独立 X 设随机变量X, 相互独立, 定理 ~N(0,1),Y~ χ2(n),则 , ~ ,
X T= ~ t(n) Yn
即随机变量 T 服从自由度为 n 的 t 分布 服从自由度为 分布.
电子科技大学
常用统计分布
χ2分布的三条性质: 分布的三条性质 三条性质:
性质1. 数字特征 数字特征) 性质 (数字特征 设 χ2 ~ χ2(n) ,则有 E( χ2 ) = n , 证明 D( χ2 ) = 2n
13种常见的统计分布

为常数,故首选威布尔分布
理解
是指数分布的一种推广形式
在药学和生存率研究中,常出现一些变量不符合正态、对
数正态及其它常用模型分布
例如能力的高低,学生成绩的好坏等都属于正态分布
集中性:正态曲线的高峰位于正中央,即均数所在的位置
理解
对称性:正态曲线以均数为中心,左右对称,曲线两端永远 不与横轴相交 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧 逐渐均匀下降 正态分布有两个参数,即均数μ 和标准差σ,可记作N(μ ,σ)
7
属性
Chi-square Distribution
连续型分布 检验资料的实际频数与理论频数是否相等
若n个相互独立的随机变量ξ ₁、ξ ₂、……、ξ n ,均服从标准
理解
正态分布则这 n 个服从标准正态分布的随机变量的平方和构 成一新的随机变量,其分布规律称为卡方分布 卡方分布是由正态分布构造而成的一个新的分布,当自由度 n很大时, 分布近似为正态分布
9
属性
F分布 F Distribution
连续型分布 用于方差的齐性检验和方差分析
理解
10
属性
Γ分布 Γ Distrቤተ መጻሕፍቲ ባይዱbution or Gamma Distribution
连续型分布 正偏态分布,常用于正偏态分布的拟合
11
属性
圆形分布 Circular Distribution
连续型分布 用于描述以方向、位置、周期性(环形)时间、角度等为测度
单位的数字特征
应用
医学领域内一些现象是以方向或时间度量,具有周期性特点, 如某疾病在一年内各月份的发生数、胎儿在一昼夜间各时点 分娩的频度 有些数据本身就是以角度来表示:如脑电阴图的上升角,气 象环境的风向玫瑰图 这些数据不能用通常的均数、标准差描述
4.3常用的统计分布

一、分位数 定义4.4 给定随机变量X,对给定的实数α, ( 0 1), 如果实数 F 满足条件 P{ X F } 则称 F 为X的分布的 水平α的上侧分位数. P X F 1 P{ X F }
X 当X是连续型随机变量时, ~ f ( x )
X i ~ N 0, 0.52 , 解
7
i 1
X 1 , X 2 ,..., X 7 相互独立,
Xi 0 ~ N ( 0, 1 ) 0.5
X1 0 X 2 0 X7 0 也相互独立. , , ..., 0.5 0.5 0.5 7 7 X 0 2 2 2 Xi i 4 ~ (7) i 1 i 1 0.5
的F分布, 记为 X ~ F ( m, n )
m 称为第一自由度, n 称为第二自由度.
X ~ F ( m , n ), 即 X ~ f ( x; m, n)
1 m m m , n n n x 2 2 f ( x; m , n) 0,
给定的
2
2 1
( n ) ( n)
2
2
( n )
2
2
2 分布 可用正态分布近似. 当n较大时,
当n≤45时, 分布 的上侧分位数 有表可查.
2
例 设 X ~ 2 (13),
P282
2 0.05 (13) 22.362 P X 1 0.05, 1
1 推论 若随机变量 X ~ F ( m, n ), 则 ~ F ( n, m ) X
3. F分布的 水平α的上侧分位数
常见统计分布及其特点

常见统计分布及其特点统计分布是描述数据集合中数据分布情况的一种方法。
统计学中存在着很多常见的统计分布,每个分布都具有其独特的特点和应用领域。
以下是一些常见的统计分布及其特点的介绍。
1. 正态分布(Normal Distribution)正态分布是最常见的分布之一,也被称为高斯分布。
它的特点是呈钟形曲线,对称分布,均值和标准差完全决定了其形状。
正态分布有广泛的应用,尤其在自然科学和社会科学中。
2. 二项分布(Binomial Distribution)二项分布是指在一系列独立的试验中,每次试验只有两个可能的结果:成功或失败。
每次试验的成功概率由固定的参数p确定。
二项分布的特点是具有两个参数n和p,其中n为试验的次数,p为每次试验的成功概率。
二项分布在生物学、医学、工程等领域中经常被使用。
3. 泊松分布(Poisson Distribution)泊松分布用于描述单位时间内事件发生的次数的概率分布。
这个分布有一个参数λ,表示单位时间内事件的平均发生率。
泊松分布的特点是时间间隔内事件的数量是不确定的,但平均发生率λ是已知的。
泊松分布在物理学、生物学、通信技术等领域中被广泛应用。
4. 均匀分布(Uniform Distribution)均匀分布是指在一个有限的区间内,每个数出现的概率相等。
均匀分布的特点是概率密度函数在区间内是常数。
均匀分布在模拟、随机数生成等领域中经常被使用。
5. 指数分布(Exponential Distribution)指数分布用于描述一个事件发生之间的时间间隔的概率分布。
指数分布的特点是具有一个参数λ,表示事件的平均发生率。
指数分布在可靠性工程、生物学、等领域中被广泛应用。
6. t分布(t Distribution)t分布是用于小样本情况下的假设检验和置信区间估计的重要分布。
与正态分布相比,t分布的尾部更厚,更适合于小样本情况的推断。
t分布在统计学中常用于处理样本容量较小的情况。
7. F分布(F Distribution)F分布是用于分组之间方差的比较的一种分布。
统计学分布类型

统计学分布类型
统计学分布是根据数据分析所有可能的可能的量的范围,把它们分类成多个分组,并建立相应的概率函数,以描述这些变量出现的可能性。
统计学分布由以下几种类型:
1、正态分布:正态分布是最常见的统计学分布,又称钟形曲线。
它具有两个参数:平均值μ和标准差σ,针对一些机器运行正态分布可以用来模拟变量的分布情况;
2、均匀分布:均匀分布是指变量的概率分布在一个给定的范围内是均匀的,它由两个参数:最小值a和最大值b决定;
3、伽马分布:伽马分布又称卡方分布,是描述连续随机变量采样期望值与其标准差之比的分布。
它包含一个参数,即期望值与标准差之比γ;
4、负指数分布:负指数分布也称指数分布,是一个经典的概率分布,它可以解释一系列以负指数或非负指数的累积概率分布,它包含一个参数λ,它是和具体分布有关的常数;
5、卡方分布:卡方分布是一种统计分布,又称伽马分布,是描述连续随机变量采样期望值与其标准差之比的分布。
卡方分布由一个参数ν决定,变量ν是采样期望与标准差之比;。
统计学常用分布

统计学常用分布一、引言在统计学中,分布是描述数据变化规律和概率的重要工具。
不同的数据类型和问题背景需要采用不同的分布来描述。
本篇文章将介绍统计学中常用的几种分布,包括正态分布、二项分布与泊松分布、指数分布与对数正态分布、卡方分布与t分布等。
二、正态分布正态分布是最常见的连续概率分布之一,它在自然现象、工程技术和社会科学等领域都有广泛的应用。
正态分布的曲线呈钟形,数据值集中在均值附近,随着远离均值,概率逐渐减小。
正态分布在统计学中具有重要地位,许多统计方法和模型都以正态分布为基础。
三、二项分布与泊松分布1.二项分布:二项分布是用来描述伯努利试验中的随机事件的概率分布,其中每次试验只有两种可能的结果,并且每次试验都是独立的。
二项分布适用于计数数据,尤其在生物实验和可靠性工程等领域有广泛应用。
2.泊松分布:泊松分布是二项分布在伯努利试验次数趋于无穷时的极限形式,常用于描述单位时间内随机事件的次数。
泊松分布在概率论和统计学中具有重要地位,广泛应用于保险、通信和生物医学等领域。
四、指数分布与对数正态分布1.指数分布:指数分布描述的是随机事件之间的独立间隔时间或者随机变量的概率分布。
指数分布常用于描述寿命测试和等待时间等问题,例如电话呼叫的间隔时间和电子元件的寿命等。
2.对数正态分布:对数正态分布在统计学中用于描述那些其自然对数呈正态分布的随机变量。
许多生物学、经济学和社会科学中的数据都服从对数正态分布,例如人的身高、体重以及股票价格等。
五、卡方分布与t分布1.卡方分布:卡方分布在统计学中主要用于描述离散型概率分布。
卡方分布是通过对两个独立的随机变量进行平方和运算得到的,常用于拟合检验和置信区间的计算。
2.t分布:t分布在统计学中广泛应用于样本数据的参数估计和假设检验。
相比于正态分布,t分布在数据量较小或参数偏离正态性时具有更好的稳定性。
t分布在金融、生物医学和可靠性工程等领域有广泛应用。
六、结论在统计学中,不同的数据类型和问题背景需要采用不同的分布来描述。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据正态分布的对称性知
u1 u .
2) t 分布的上侧分位数 t (n)
对于给定的 , 0 1, 称满足条件
P{t t (n)}
h(t)dt
t (n)
的点 t (n) 为 t(n) 分布的上 分位点.
可以通过查表求
得上分位点的值.
由分布的对称性知
y
1
特例: 1) N (0,1):u1 u
x
O
x
x
2) t(n) : t1 (n) t (n)
1) 正态分布的上侧分位数u:
设 X 服从标准正态分布 N (0,1),
分位数 u 满足 P{ X u }
1
e
x2 2
dx
2π u
则其上侧
~
N
(n,2n).
2. t 分布
(1)定义5.7 设 X ~ N (0, 1), Y ~ 2(n), 且 X , Y
独立,则称随机变量 T X Y /n
服从自由度为n的 t 分布, 记为T ~ t(n).
t 分布又称学生氏(Student)分布.
(2) t(n) 分布的概率密度函数为
h(t)
(n2 4)
3) 设F ~ F (n1, n2 ),则当n2 4时,对任意x有
lim P{F E(F ) x} x
1
e
t2 2
dt
n1
D(F )
2
这说明F分布极限分布也是正态分布.
二、概率分布的分位数
1. 定义
定义5.9 对于总体X和给定的 (0 1),
n
2
1
πn n
1
t2 n
n1
2
,
2
t分布的概率密度曲线如图
显然图形是关于
t 0对称的.
当n充分大时, 其图 形类似于标准正态 变量概率密度的图 形.
t
因为lim h(t)
1
t2
e 2,
n
2π
所以当n足够大时t分布近似于N (0,1)分布,
2
,
y0
0,
其它
F分布的概率密度 曲线如图
(3) F分布有以下性质
1) 若F ~ F (n1, n2 ),
则1 F
~
F (n2,
n1 ).
2)
E(F ) n2 , n2 2
(n2 2),
D(F ) 2n22 (n1 n2 2) , n1(n2 2)2 (n2 4)
t1 (n) t (n). 当n 45时, t (n) u .
t0.05(10) 1.8125, 附表3-1 t0.025(15) 2.1315. 附表3-2
在Matlab中求解
(2) 若X的分布密度无对称性,
1) 2 (n) : 对于给定的正数 , 0 1, 称满足
1 P{ X u } 1 (u )
即 (u ) 1 给定 ,由附表2可查得u的值.
u0.05 1.645,
(u ) 1
附表2-1 0.95
( 0.05)
u0.025 1.96,
附表2-2 0.975 ( 0.025)
P{ 2 2 (n)}
2 (n) p( y)dy
的点 2 (n) 为 2(n) 分布的上侧分位数.
当n 60时,可查表4 (表4只详列到 n=60 为止).
但对于较小的n, t分布与N (0,1)分布相差很大.
(3) T的数字特征 E(T ) 0, D(T ) n n2
(n 2)
3. F分布
(1)定义5.8 设 X ~ 2(n1), Y ~ 2(n2 ), 且X , Y 独立,
则称随机变量 F X / n1 Y / n2
服从自由度为 (n1, n2 ) 的 F 分布,记为 F ~ F (n1, n2 ).
其中 n1 称为第一自由度, n2 称为第二自由度.
(2) F(n1, n2)分布的概率密度为
( y)
n1
n2
n1
n1
2
n1 1
y2
2 n2
n1 n2
n1 2
n2 2
1
n1 y n2
立, 则 Y1 Y2 ~ 2(n1 n2 ).
(此性质可以推广到多个随机变量的情形)
设 Yi ~ 2(ni ), 并且 Yi (i 1, 2,, m) 相互
m
独立, 则 Yi ~ 2(n1 n2 nm ).
i 1
性质2 ( 2分布的数学期望和方差)
若存在x ,使
P{ X x } 则称x为X的分布的上侧分位数.
2. 常用分布的上侧分位数记号
分布 N(0,1) 记号 u
2(n) t(n) F(n1,n2) 2 (n) t (n) F (n1, n2 )
3. 查表法
(1) 若X的分布密度关于y轴对称,则
x1 x
第五章
第二节 常用统计分布
一、常见分布 二、概率分布的分位数 三、内容小结
一.常见分布
• (1) 2 分布
定义5.6 :设随机变量 X1, X2 , X n 独立同分布,且每个
Xi ~ N (0,1), 则称随机变量
n
2 n
X
2 1
X
2 2
X
2 n
X
2 i
i 1
所服从的分布为自由度为 n 的 2 分布.
若
2 n
~
2(n),
则 E(n2 )
n,
D(n2 ) 2n.
性质3
设
2 n
~
2(n),则对任意x,有
lim
P{
2 n
n
x}
x
n
2n
1
e
t2 2
dt
2
即 2分布的极限分布是正态分布,也即,当n很大时
2 n
n
2n
近
似
服
从N
(0,1).进
ห้องสมุดไป่ตู้
而
2 n
近似
记为
2 n
~
2 (n).
随机变量
2 n
也称为 2 变量.
自由度:独立变量的个数 n
(2) 2 的概率密度
p( x)
n 22
1 (
n)
n 1 x
x2 e 2
2
0
x0 其它
2 (n)分布的概率密度曲线如图.
(3) 2 分布的性质
性质1 ( 2 分布的可加性) 设 Y1 ~ 2(n1), Y2 ~ 2(n2 ), 并且 Y1, Y2 独