统计学常用分布及其分位数

合集下载

三大分布及其分位数

性质
泊松分布的均值和方差相等，且随着均值的增大，泊松分布逐渐趋近于正态分布。此外，泊松分布具有可加性，即两个独立泊松分布的和仍然服从泊松分布。
泊松分布的分位数计算
分位数定义
分位数是指将一个随机变量的概率分布划分为几个等份的数值点，如中位数就是50%分位数。
泊松分布分位数计算
泊松分布的分位数可以通过查表或使用统计软件进行计算。对于给定的泊松分布参数λ和概率p，可以计算出对应的分分位数的概念
分布
分布是指一组数据在各个取值范围内的频数或频率。在统计学中，分布通常用概率密度函数或累积分布函数来描述。
分位数
分位数是指将一个随机变量的概率分布范围分为几个等份的数值点。常用的分位数有四分位数、百分位数等。例如，中位数就是50%分位数，表示有一半的数据小于或等于该值，另一半的数据大于该值。
和优化提供理论支持。
生物学和医学
在生物学和医学研究中，泊松分布可以用来描述放射性物质的衰变次数、基因突变数等随机事件的发生
次数。
04 指数分布及其分位数
指数分布的定义和性质
定义
01
指数分布是一种连续概率分布，通常用于描述事件之间的时间
间隔。
性质
02
指数分布具有无记忆性，即事件发生的概率与自上次事件发生
排队论
在排队系统中，指数分布可用于描述顾客到达和服务时间的概率分布，从而分析系统的性能指标。
金融风险管理
指数分布可用于评估金融风险，如信用风险和市场风险等，帮助金融机构制定风险管理策略。
05 三大分布的比较与联系
三大分布的特征比较
正态分布
呈钟形曲线，两侧对称，均值、中位数、众数相等，标准差决定

概率论-分布及其分位数

分布及其分位数
U—分布正态总体样本均值的分布
设总体 X ~ N , 2 ， X1, X2,..., Xn 是 X 的一
个样本, 则样本均值服从正态分布X1 nFra bibliotekn i 1
Xi
~
N
,
2
n
U
X
1 n
n i1
Xi
~
N 0,1
n n
概率分布的分位数(分位点)
定义对总体X和给定的 (0<<1)，若存在x，
f(y)
上分位数或上侧临界值，
其几何意义见图5-5所示.
其中f(y)是 2-分布的概率密度. O
图5-5 2(n) x
显然，在自由度n取定以后，2(n)的值只与有关.
例如，当n=21，=0.05时，由附表3(P254)可查得，
02.05(21) 32.67 即 P 2(21) 32.67 0.05.
即 t(n)≈u ， n>45.
一般的t分布临界值表中，详列至n=30，当 n>30就用标准正态分布N(0, 1)来近似.
四、F分布
定义5.5 设随机变量X～ 2(n1)、Y～ 2(n2)，且
与相互独立，则称随机变量
F
X Y
n1 n2
服从第一自由度为n1，第二自由度为n2的F分布，
记作 F～F(n1，n2).
02.1(9)≈查 14.684.
故
表
≈
14.684x
16 9
≈26.105
n2) F 2
图6-4
(n1,
n2)
x
例设总体X～N( , 42)， X1，X2，…，X10是n=10简
单随机样本， S2为样本方差，已知P{S2>}=0.1,求

统计学中的随机变量的分布与分位数概念

统计学中的随机变量的分布与分位数概念在质量工程师的培训中，我们经常询问学员以下图形是什么曲线，学员普遍能够回答是正态分布曲线，但进一步询问学员该曲线的纵轴f(x)表示什么，许多同学以为是概率值。

其实这个曲线是正态分布概率密度曲线，f(x)是指随机变量X在观察值为x时的概率密度，如果随机变量X的单位为mm，则f(x)的单位为%/mm。

曲线与X轴所围成的面积表示概率，该面积等于1，因为随机变量的所有可能取值（即：100%）都在X轴上。

随机变量的分布与分位数概念以下是一个均值=10，标准差=0.5的正态分布概率密度曲线的例子，x=9.020的垂线与该分布的概率密度曲线和X轴所围成的左侧区域面积=0.025，该面积表示在随机变量X的总体分布中，有2.5%的值小于9.020，也就是说在总体分布中，随机变量X的取值小于9.020的概率为2.5%。

同样，x=10.98的垂线与该分布的概率密度曲线和X 轴所围成的右侧区域面积=0.025，该面积表示在随机变量X的总体分布中，有2.5%的值大于10.98，也就是说在总体分布中，随机变量X 的取值大于10.98的概率为2.5%（也即是随机变量X的取值小于10.98的概率为97.5%）。

在这个分布中，x=9.020的值被称为X的2.5%分位数（即：X2.5%=9.020），x=10.98的值被称为X的97.5%分位数（X97.5%=10.98）。

随机变量X有95%（即：97.5% -2.5%=95%）的取值落在9.020至10.98之间。

每个分位数都是随机变量所有可能取值中的某个值。

按照定义，若某个值Xp被称为随机变量X的p分位数，则随机变量X的取值小于Xp的概率为p。

随机变量的分布与分位数概念以下是该正态分布对应的累积概率分布曲线，该曲线的纵轴表示的是累积概率，比如：x=9.020对应的累积概率为2.5%（即：随机变量X的取值小于x=9.020的概率为2.5%）, x=10对应的累积概率为50%（即：随机变量X的取值小于x=10的概率为50%）, x=10.98对应的累积概率为97.5%（即：随机变量X的取值小于x=10.98的概率为97.5%）。

数据的分位数如何计算公式

数据的分位数如何计算公式数据的分位数是统计学中常用的一种描述数据分布的方法，它可以帮助我们更好地理解数据的分布情况。

在统计学中，分位数是将数据集分成若干部分的数值，每一部分包含相同比例的数据。

常见的分位数包括四分位数、中位数、百分位数等。

本文将介绍如何计算数据的分位数，并探讨其在实际应用中的意义。

一、四分位数的计算公式。

四分位数是将数据集分成四等份的数值，分别是第一四分位数（Q1）、中位数（Q2）、第三四分位数（Q3）。

计算四分位数的方法如下：1. 首先将数据集按照大小顺序排列。

2. 然后计算中位数Q2，即将数据集分成两部分，前一部分的中位数即为Q1，后一部分的中位数即为Q3。

3. Q1即为数据集中所有数值中位数的中位数，Q3即为数据集中所有数值中位数的中位数。

四分位数的计算公式如下：Q1 = (n + 1) / 4。

Q2 = (n + 1) / 2。

Q3 = 3 (n + 1) / 4。

其中，n为数据集的大小。

二、中位数的计算公式。

中位数是将数据集分成两等份的数值，即中间的数值。

计算中位数的方法如下：1. 首先将数据集按照大小顺序排列。

2. 如果数据集的大小为奇数，则中位数即为数据集中间的数值；如果数据集的大小为偶数，则中位数为中间两个数值的平均值。

中位数的计算公式如下：如果n为奇数，中位数为X(n+1)/2。

如果n为偶数，中位数为(Xn/2 + X(n/2+1))/2。

其中，X为数据集中的数值，n为数据集的大小。

三、百分位数的计算公式。

百分位数是将数据集分成100等份的数值，即将数据集中所有数值按照大小顺序排列后，按照百分比进行划分。

计算百分位数的方法如下：1. 首先将数据集按照大小顺序排列。

2. 然后根据需要计算的百分位数的位置，找到对应的数值即为所求的百分位数。

百分位数的计算公式如下：P(k) = (k/100) (n + 1)。

其中，P(k)为所求的百分位数，k为百分位数的百分比，n为数据集的大小。

(完整版)三大分布及其分位数

研究生概率统计讲义
§1.5 常用的分布及其分位数
卡平方分布、t分布及F分布都是由正态分布所导出的分布，它们与正态分布一起，是试验统计中常用的分布。
1. 卡方分布
当X1、X2、…、Xn相互独立且都服从N(0,1)时，Z XFra bibliotek2 i
的分布称为自由度等于n的x2(n)分布，记作 Z～ x2(n)(n).它的分布密度
3. F分布
若X与Y相互独立，且X～x2 (n)，Y～x2 (m)，则
ZX Y nm
的分布称为第一自由度等于n、第二自由度等于m的 F分布，记作Z～F (n, m)，它的分布密度
2020/8/9
4
研究生概率统计讲义
p(
z
)
n
n
2m
m 2
n 2
nm 2
m 2
•
n 1
z2
nm
(mnz) 2
10
研究生概率统计讲义 5）F分布的α分位数记作Fα(n , m) Fα(n , m)>0，当X～F (n , m)时，P{X<Fα(n , m)}=α
2020/8/9
11
2020/8/9
7
研究生概率统计讲义
2020/8/9
8
研究生概率统计讲义 3）卡平方分布的α分位数记作x2α(n)。
P{X< x2α(n)}=α
2020/8/9
9
研究生概率统计讲义 4）t 分布的α分位数记作tα(n)
当X～t (n)时，P{X<t α(n)}=α，且与标准正态分布相类似。
2020/8/9
2020/8/9
6
研究生概率统计讲义
因为1-F(λ)=α，F(λ)=1-α，所以上侧α分位数λ就是1-α分位数 x 1-α；

统计五分位法

统计五分位法
五分位法，又称为又称箱形图方法，是一种统计学中常用的探索性数据分析方法，用于描述一组数值数据的分布情况。

五分位法将数据分为四个分位数，分别是第一四分位数（下四分位数，Q1，25%分位数）、第二四分位数（中位数，Q2，50%分位数）、第三四分位数（上四分位数，Q3，75%分位数）和第四四分位数（最大值）。

计算步骤如下：
1. 将数据按照大小排序。

2. 找出中位数Q2，该数将数据分为两部分。

3. 分别计算第一四分位数Q1，即处于Q2前一半位置的数的
中位数。

4. 分别计算第三四分位数Q3，即处于Q2后一半位置的数的
中位数。

5. 统计最小值和最大值。

6. 绘制箱形图，用矩形盒子表示数据的分布情况，下边界为
Q1，上边界为Q3，中位数用一条横线表示。

在矩形盒子上下
分别绘制须线，须线的末端分别表示最小值和最大值。

五分位法可以用于快速了解数据的集中趋势和离散程度。

通过观察箱形图，可以判断数据的偏度、异常值和离群点等信息。

概率分布的分位数三

解
1
2
~
N (0, 2),则 1
2
2
~
N (0,1)
同理
3
4
5
6
~
N (0, 4),则 3
4
5
4
6
~
N (0,1)
且 1 2 与 3 4 5 X 6 相互独立
2
4
所以( 1 2 )2 (3 4 5 6 )2 ~ 2 (2)
2
4
则C1 1 2 ,C2 1 4 .
的点 t (n) 为 t(n) 分布的上分位数(或分位点).
可以通过查表求得上分位数的值.
由分布的对称性知 t1 (n) t (n).
当n 45时, t (n) u .
t0.05(10) 1.8125, t0.025(15) 2.1315.
3.
2分布
的
上侧分
位
数
2
(n)
对于给定的正数, 0 1, 称满足条件
P{2 2 (n)}
的点
2
(n)
为
2
(
n)
分布的
上
分位数（
分位
点）.
对于不同的 , n,
可以通过查表求
得上分位点的值.
2 0.025
(8)
17.535,
2 0.975
(10)
3.247,
2 0.1
(
25)
34.382.
附表4只详列到 n=45 为止.
费歇(R.A.Fisher)证明:
费歇资料
2 2
独
立, 则
2 1
2 2
~
2(n1
n2 ).

分位数的概念

分位数的概念分位数是指统计学中常用的一个概念，用来描述数据的分布情况。

它把一组数据分成几部分，每部分包含相同比例的数据。

分位数通常用来衡量数据的集中趋势和离散程度，是统计学和数据分析中非常重要的一个概念。

在统计学中，常用的分位数有四分位数、中位数和百分位数。

其中，四分位数又分为下四分位数（Q1）、中位数（Q2）和上四分位数（Q3）。

下四分位数是数据中25%的位置的值，中位数是数据中50%的位置的值，上四分位数是数据中75%的位置的值。

除了四分位数之外，还有百分位数，百分位数是指数据中有百分之几的观察值小于或等于它。

分位数的概念可以通过举例来更好地理解。

假设有一个班级的学生成绩数据，我们想要了解学生成绩的分布情况。

我们可以计算这组成绩的四分位数，从而找到25%、50%和75%位置的分数。

这样我们就可以得出学生成绩的集中趋势和离散程度。

比如，中位数可以帮助我们确定学生成绩的中间位置，四分位数可以帮助我们了解学生成绩中较低、中等和较高的位置，进而得出整体上学生成绩的分布情况。

分位数的计算方法有很多，最常用的是通过对数据进行排序，然后找到对应位置的数据点。

比如，要计算下四分位数，首先对数据进行排序，然后找到数据的25%位置的值即为下四分位数。

类似地，中位数和上四分位数也可以通过这种方法来计算。

分位数的应用非常广泛，它在数据分析、统计推断、风险管理等领域都有着重要的作用。

在数据分析中，分位数可以帮助我们了解数据的分布情况，发现异常值和离群点，寻找数据的集中趋势等。

在统计推断中，分位数可以用来构建置信区间、进行假设检验等。

在风险管理中，分位数可以用来衡量风险的不确定性和波动性，帮助决策者做出合理的决策。

此外，在金融领域中，分位数也有着重要的应用。

比如，价值-at-风险（Value-at-Risk，VaR）是衡量金融风险的一种常用方法，它主要通过计算分位数来对金融资产的风险进行评估。

总之，分位数是统计学中非常重要的一个概念，它可以帮助我们了解数据的分布情况，衡量数据的集中趋势和离散程度，对数据进行分析和推断，并在风险管理和决策中发挥重要作用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

§1.4 常用的分布及其分位数1. 卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分布，它们与正态分布一起，是试验统计中常用的分布。

当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时，Z=∑ii X 2 的分布称为自由度等于n 的2χ分布，记作Z ～2χ(n)，它的分布密度 p(z )=⎪⎪⎩⎪⎪⎨⎧>⎪⎭⎫ ⎝⎛Γ--,,00,2212122其他z e x n z n n 式中的⎪⎭⎫ ⎝⎛Γ2n =u d e u u n ⎰∞+--012，称为Gamma 函数，且()1Γ=1，⎪⎭⎫ ⎝⎛Γ21=π。

2χ分布是非对称分布，具有可加性，即当Y 与Z 相互独立，且Y ～2χ(n )，Z ～2χ(m )，则Y+Z ～2χ(n+m )。

证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、X n+m 相互独立且都服从N(0,1)，再根据2χ分布的定义以及上述随机变量的相互独立性，令Y=X 21+X 22+…+X 2n ，Z=X 21+n +X 22+n +…+X 2m n +，Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +，即可得到Y+Z ～2χ(n +m )。

2. t 分布若X 与Y 相互独立，且X ～N(0,1)，Y ～2χ(n )，则Z =nY X 的分布称为自由度等于n 的t 分布，记作Z ～ t (n )，它的分布密度P(z)=)()(221n nn ΓΓ+2121+-⎪⎪⎭⎫ ⎝⎛+n n z 。

请注意：t 分布的分布密度也是偶函数，且当n>30时，t分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。

这时， t 分布的分布函数值查N(0,1)的分布函数值表便可以得到。

3. F 分布若X 与Y 相互独立，且X ～2χ(n )，Y ～2χ(m )，则Z=mY n X的分布称为第一自由度等于n 、第二自由度等于m 的F 分布，记作Z ～F (n , m )，它的分布密度 p(z)=⎪⎪⎪⎩⎪⎪⎪⎨⎧>++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ•。

其他,00,2)(1222222z m n z n m n z m n m n m m n n 请注意：F 分布也是非对称分布，它的分布密度与自由度的次序有关，当Z ～F (n , m )时，Z1～F (m ,n )。

4. t 分布与F 分布的关系若X ～t(n )，则Y=X 2～F(1,n )。

证：X ～t(n )，X 的分布密度p(x )=⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ221n n n π2121+-⎪⎪⎭⎫ ⎝⎛+n n x 。

Y=X 2的分布函数F Y (y ) =P{Y<y }=P{X 2<y }。

当y ≤0时，F Y (y)=0，p Y (y )=0；当y >0时，F Y (y ) =P{-y <X<y } =x d x p y y )(⎰-=2x d x p y )(0⎰， Y=X 2的分布密度p Y (y )=21)(121221212n y n y n n n n ++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ•，与第一自由度等于1、第二自由度等于n的F分布的分布密度相同，因此Y=X2～F(1,n)。

为应用方便起见，以上三个分布的分布函数值都可以从各自的函数值表中查出。

但是，解应用问题时，通常是查分位数表。

有关分位数的概念如下：4. 常用分布的分位数1）分位数的定义分位数或临界值与随机变量的分布函数有关，根据应用的需要，有三种不同的称呼，即α分位数、上侧α分位数与双侧α分位数，它们的定义如下：当随机变量X的分布函数为F(x)，实数α满足0 <α<1 时，α分位数是使P{X< xα}=F(xα)=α的数xα，上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ，双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使P{X>λ2}=1-F(λ2)=0.5α的数λ2。

因为1-F(λ)=α，F(λ)=1-α，所以上侧α分位数λ就是1-α分位数x1-α；F(λ1)=0.5α，1-F(λ2)=0.5α，所以双侧α分位数λ1就是0.5α分位数x0.5α，双侧α分位数λ2就是1-0.5α分位数x1-0.5α。

2）标准正态分布的α分位数记作uα，0.5α分位数记作u 0.5α，1-0.5α分位数记作u1-0.5α。

当X～N(0,1)时，P{X< uα}=F 0,1(uα)=α，P{X<u0.5α}= F 0,1 (u0.5α)=0.5α，P{X<u1-0.5α}= F 0,1 (u1-0.5α)=1-0.5α。

根据标准正态分布密度曲线的对称性，当α=0.5时，uα=0；当α<0.5时，uα<0。

uα=-u1-α。

如果在标准正态分布的分布函数值表中没有负的分位数，则先查出 u1-α，然后得到uα=-u1-α。

论述如下：当X～N(0,1)时，P{X< uα}= F 0,1 (uα)=α，P{X< u1-α}= F 0,1 (u1-α)=1-α，P{X> u1-α}=1- F 0,1 (u1-α)=α，故根据标准正态分布密度曲线的对称性，uα=-u1-α。

例如，u 0.10=-u 0.90=-1.282，u 0.05=-u 0.95=-1.645，u 0.01=-u 0.99=-2.326，u 0.025=-u 0.975=-1.960，u 0.005=-u 0.995=-2.576。

又因为P{|X|< u1-0.5α}=1-α，所以标准正态分布的双侧α分位数分别是u1-0.5α和-u1-0.5α。

标准正态分布常用的上侧α分位数有：α=0.10，u 0.90=1.282；α=0.05，u 0.95=1.645；α=0.01，u 0.99=2.326；α=0.025，u 0.975=1.960；α=0.005，u 0.995=2.576。

χα(n)。

3）卡平方分布的α分位数记作2χα(n)>0，当X～2χ(n)时，P{X<2χα(n)}=α。

2χ0.005(4)=0.21，2χ0.025(4)=0.48，例如，2χ0.05 (4)=0.71，2χ0.95(4)=9.49，2χ0.975(4)=11.1，2χ0.995(4)=14.9。

24）t分布的α分位数记作tα(n)。

当X～t (n)时，P{X<tα(n)}=α，且与标准正态分布相类似，根据t分布密度曲线的对称性，也有tα(n)=-t1-α(n)，论述同uα=-u1-α。

例如，t0.95(4)=2.132，t 0.975(4)=2.776，t 0.995(4)=4.604，t 0.005(4)=-4.604，t 0.025(4)=-2.776，t 0.05(4)=-2.132。

另外，当n>30时，在比较简略的表中查不到tα(n)，可用uα作为tα(n)的近似值。

5）F分布的α分位数记作Fα(n , m)。

Fα(n , m)>0，当X～F (n , m)时，P{X<Fα(n , m)}=α。

另外，当α较小时，在表中查不出F α(n , m )，须先查F 1-α(m , n )，再求F α(n , m )=),(11n m F α-。

论述如下：当X ～F(m , n )时，P{X< F 1-α(m , n )}=1-α， P{X 1>),(11n m F α-}=1-α，P{X 1<),(11n m F α-}=α，又根据F 分布的定义，X 1～F(n , m )，P{X 1<F α(n , m ) }=α，因此 F α(n , m )= ),(11n m F α-。

例如，F 0.95 (3,4)=6.59，F 0.975 (3,4)=9.98，F 0.99 (3,4)=16.7，F 0.95 (4,3)=9.12，F 0.975 (4,3)=15.1，F 0.99 (4,3)=28.7，F 0.01 (3,4)=7.281，F 0.025 (3,4)=1.151，F 0.05 (3,4)=12.91。

【课内练习】1. 求分位数①χ20.05(8)，②χ20.95(12)。

2. 求分位数① t 0.05(8)，② t 0.95(12)。

3. 求分位数①F 0.05(7,5)，②F 0.95(10,12)。

4. 由u 0.975=1.960写出有关的上侧分位数与双侧分位数。

5. 由t 0.95(4)=2.132写出有关的上侧分位数与双侧分位数。

6. 若X ～χ2(4)，P{X<0.711}=0.05，P{X<9.49}=0.95，试写出有关的分位数。

7. 若X ～F(5,3)，P{X<9.01}=0.95，Y ～F(3,5)，{Y<5.41}= 0.95，试写出有关的分位数。

8. 设X 1、X 2、…、X 10相互独立且都服从N(0,0.09)分布,试求P{X i i2∑>1.44}。

习题答案：1. ①2.73，②21.0。

2. ①-1.860，②1.782。

3. ①1488.，②3.37。

4. 1.960为上侧0.025分位数，-1.960与1.960为双侧0.05分位数。

5. 2.132为上侧0.05分位数，-2.132与2.132为双侧0.1分位数。

6. 0.711为上侧0.95分位数，9.49为上侧0.05分位数，0.711与19.49为双侧0.1分位数。

7. 9.01为上侧0.05分位数，5.41为上侧0.05分位数，1901.与5.41为双侧0.1分位数，1541.与9.01为双侧0.1分位数。

8. 0.1。