三大抽样分布的理解与具体性质

合集下载

6教育统计学第六章

6教育统计学第六章
S
n
(3)总体非正态分布条件下平均数的显著性检验
① 当 n≥30 时,尽管总体分布非正态,对于平均数的显 著性检验仍可用Z 检验。
Z
X
0(σ
已知)或
Z
X 0( σ 未知)
S
n
n
② 当 n<30 时,若总体分布非正态,对于平均数的显著 性检验不符合近似 Z 检验的条件,严格讲此时也不符合t 检验 的条件。
计算其置信区间:
X t SX (其X 中 t SX
2
2

SX
S n
小样本的情况
例如,从某小学二年级随机抽取12名学生,其阅读能 力得分为28、32、36、22、34、30、33、25、31、33、 29、26.试估计该校二年级阅读能力总体平均数95%和 99%的置信区间。
X 29.917 , S 4.100 , X 3.926
三、样本平均数与总体平均数离差统计量的形态
从正态总体中随机抽取样本容量为n的一切可 能样本平均数以总体平均数为中心呈正态分布。
当总体标准差已知时:
Z
X
X
X
n
当总体标准差未知时:
N (0,1)
总体标准差 的无偏估计量为
S (X X )2 n 1
S S X
X 2 ( X )2 / n
抽样分布是统计推断的理论依据。实际中只能抽取一个 随机样本根据一定的概率来推断总体的参数。即使是抽取一 切可能样本,计算出的某种统计量与总体相应参数的真值, 大多也是不相同的,这是由于抽样误差的缘故。抽样误差用 抽样分布的标准差来表示。因此,某种统计量在抽样分布上 的标准差称为该种统计量的标准误。
标准误越小,表明样本统计量与总体参数的值越接近, 样本对总体越有代表性,用样本统计量推断总体参数的可靠 度越大,所以标准误是统计推断可靠性的指标。

三大抽样分布

三大抽样分布

三大抽样分布众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2分布、t布和F分布。

这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。

X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。

三大抽样分布的研究意义c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。

”这句话一语道破统计学的重要性。

三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。

在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。

具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。

纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。

三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。

为此,要想研究三大抽样分布,就应该对其发展过程进行研究。

统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。

X2分布x2的早期发展由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。

在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。

但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。

三大抽样分布课件

三大抽样分布课件
在方差分析中,t分布用于检验 各个组之间的均值是否存在显著
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。

概率论与数理统计 7.2 数理统计中的三大分布

概率论与数理统计 7.2 数理统计中的三大分布
数理统计
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025

§5.4三大抽样分布

§5.4三大抽样分布

所以 Y ( y1 ,, yn )T 的各分量相互独立.
n 1 由于 x y1 , ( n 1) s 2 yi2 . x与s 2相互独立. n i 2
1 n 1 21 1 A 3 2 1 n( n 1)
n
( n 1) s 2 yi2,
i2
yi N (0, ), i 2,3, , n.
2
y2 ,, yn相互独立.
( n 1)
2
yi 2 s ~ (n 1). i 2
n
2
2
15
定理2:设( X 1 , X 2 ,, X n )是来自正态总体N ( , )的
1 n 1 21 1 3 2 1 n( n 1)
1 n 0

1 3 2 1 n( n 1)
0 0 1 n( n 1) 1 n
14
(3)
( n 1)
2
s 2 ~ 2 ( n 1).
2 i 1 2 i 2 1 2 2 n 2 n
服从自由度为n的 2分布, 记作 2 ~ 2 (n) . 注:服从 2分布的随机变量取值非负,其密度函数为 n x 1 1 x2 e 2 , x 0 n 2 n 2 ( x; n) 2 ( ) Γ ( s ) x s1e x dx , s 0, 2 0 0, x0
4
n=4
2 分布的性质:
n=6 n=10
1、随n的增大,其偏度越来越小。
2、 2分布表——P425 附表三
2
即是分布函数数值表.
2
n 1 3、 分布是Ga分布的特例,即有 ( n) Ga( , ) . 2 2 4、 2分布具有可加性:

5-4三大抽样分布

5-4三大抽样分布
F 0 .0 5 (1 2 , 9 ) 1 F1 0 .0 5 (9 ,1 2 ) 1 2 .8 0 0 .3 5 7
三、t 分布 设X1~N(0,1) , X2~ (n ) , 且X1与X2相 X1 互独立,则称变量 t
1、定义:
2
X2 n
所服从的分布为自由度为 n的 t 分布.
例2:
若总体X ~ N ( 0,1),从此总体中取一个容量为
6的样本X 1 , X 2 ,X 6 , 设 Y ( X1 X 2 X 3 ) ( X 4 X 5 X 6 )
2 2 2
试决定常数C,使随机变量CY服从 分布 .
解:
因为
X 1 X 2 X 3 ~ N (0, 3), 所以
2
( y 0)
F
( y1 ym ) / m ( x1 xn ) / n
2 2
p( y )
( m2 n )
m
m 2
1
( ) ( )
m 2 n 2
( ) 2 ( y)
m n
1
m n
y

n n 2
m (n 2) (n 4)
2
( y 0)
1
1 2 2 3 43 5 4 6 5 6
2. F分布的性质
(1).F分布的数学期望
E(F )
n n2
(n>2)
即它的数学期望并不依赖于第一自由度m. (2).F分布的分位数
对于给定的 (0 1), 称满足条件
P F F1 (m, n)
F ( m , n ) 1

p( y )dy 1
的点F1 (m, n)为F (m, n)分布的1- 分位数. 如图所示.

关于对统计推断中抽样分布的总结及判别

关于对统计推断中抽样分布的总结及判别

关于对统计推断中抽样分布的总结及判别统计推断是统计学的重要分支,用于从一个样本中推断总体的性质。

在进行统计推断时,我们需要对样本进行抽样,并利用抽样数据来进行分析。

抽样分布是统计推断的基础,它是由样本数据的一个统计量构成的分布。

本文将对抽样分布的概念、属性以及判别进行总结,并阐述其在统计推断中的作用。

抽样分布的概念:抽样分布是由样本统计量的取值构成的概率分布。

在统计推断中,我们往往无法获得总体的全部数据,而只能通过抽样来获取一部分数据。

我们需要对样本数据进行抽样,得到一个样本统计量,如均值、方差等。

样本统计量的分布即为抽样分布。

抽样分布的属性:1. 中心性质:抽样分布的中心通常与总体相同或近似相同。

当样本容量足够大时,抽样分布的均值接近总体均值。

2. 精确性质:抽样分布的方差通常比总体方差小。

样本容量越大,抽样分布越接近总体分布。

3. 形态性质:抽样分布的形态通常与总体分布有关。

当总体分布近似于正态分布时,抽样分布也近似于正态分布。

抽样分布的判别:在进行统计推断时,我们通常需要判断一个样本统计量是否来自某个已知分布。

为此,我们可以利用分布的特征进行判别。

1. 直方图:可以通过绘制样本统计量的直方图来观察其分布情况。

如果直方图呈现对称分布且近似于正态分布,那么我们可以判定样本统计量来自正态分布。

2. 正态概率图:正态概率图是一种用于判断数据是否来自正态分布的图形方法。

如果数据点近似位于一条直线上,那么可以判定数据来自正态分布。

3. 假设检验:通过设立假设并进行统计检验,可以判断样本统计量是否来自某个特定的分布。

常用的假设检验方法包括Z检验、t检验等。

抽样分布在统计推断中的作用:抽样分布在统计推断中起着重要的作用,它为我们提供了从样本推断总体性质的基础。

1. 参数估计:通过样本的抽样分布,可以进行总体参数的点估计和区间估计。

通过样本均值的抽样分布,可以推断总体的平均值。

2. 假设检验:抽样分布是进行假设检验的基础。

三大抽样分布

三大抽样分布

F(n1, n2)为F(n1, n2)的上侧分位点;
1 注: F1 (n1 , n2 ) F (n2 , n1 )
F (n1 , n2 )
若X 1 , Y1 ,
, X n1 来自正态总体X, X ~ N ( 1 , 12 ),
2 , Yn2 来自正态总体Y, Y ~ N ( 2 , 2 ), 且两样本独立.

2 ( n)
2.t 分布

关于t分布的早期理论工作,是英国统计学家威廉· 西利· 戈塞 特(Willam Sealy Gosset)在1990年进行的。 t分布是小样本分布,小样本一般是指n<30。t分布适用于 当总体标准差未知时用样本标准差s代替总体标准差σ,由

样本平均数推断总体平均数及两个小样本之间差异的显著性


χ2 分布是海尔墨特(Hermert)和卡· 皮尔生(K· Pearson) 分别于1875年和1890年导出的。它主要适用于对拟合优度检 验和独立性检验,以及对总体方差的估计和检验。 χ2 分布是一种抽样分布。当我们对正态随机变量随机地重 复抽取个数值,将每一个值变换成标准正态变量,并对这个 新的变量分别取平方再求和之后,就得到一个服从χ2分布的 变量,即
F分布的主要性质有: ①F分布是一种非对称的分布,呈右偏态; ② F分布两个自由度:n1-1和n2-1,相应的分布记作F(n1-1,n2-
1)。通常n1-1称为分子自由度, n2-1称为分母自由度。
③随n1,n2的不断增大,F分布的右偏程度逐渐减弱,但不会趋向 正态;
④具有倒数性质即若X~F(n1,n2),则1/X~F(n1,n2);
(4) t 分布是一个分布族,对于不同的样本容量对应不同的 分布,且均值都为0;随着自由度的增大,分布也逐渐趋 于标准正态分布。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数学学习与研究 2019. 12
பைடு நூலகம்
( ) 还有一个实用的结论,Γ
1 2
= 槡π.
若 X ~ Γ( α,β) ,我 们 可 以 计 算 出 它 的 矩 母 函 数 为
MX ( t) = ( 1 - βt) -α ,下面的分布就与这个矩母函数有关. 三、三大分布的性质
( 一) 卡方分布
1. 定义
如果 Z ~ N( 0,1) ,且 X = Z2 ,我们就说 X 服从自由度为
1 的卡方分布,记作 X ~ χ21 . 证明如下:
FX ( x) = P( X ≤ x) = P( Z2 ≤ x) = P( - 槡x ≤ Z ≤槡x) ,
FX ( x) = FZ ( 槡x) - FZ ( - 槡x) ,
求导可得,fX ( x) =
1
1
x-
1 2
e

x 2

2 2 槡π
( ) 或者 fX( x)
二、预备知识
如果一个随机变量 X 服从形状参数为 α,尺度参数为 β
的伽马分布,我们记 X ~ Γ( α,β) ,那么其概率密度函数为
f( x)
=
x
α
-1
e

x β
βαΓ( α)
,α,β

0,x ≥ 0,则 E(
X)
= αβ,Var( X)
=
∫∞
αβ2 ,其中 Γ( α) 为伽马函数,且 Γ( α) = xα-1 e -x dx,另外 0
交流平台
JIAOLIU PINGTAI
143
三大抽样分布的理解与具体性质
◎蔡则元 ( 甘肃省兰州市榆中县兰州大学榆中校区,甘肃 兰州 730107)
一、简 介
三大抽样分布分别指的是: 卡方分布、t 分布( 也叫学生
t 分布) 、F 分布,在详细叙述这三大分布之前,我们需要对伽
马分布有清晰的认识,下面我们先简单探讨伽马分布.
=
x

1 2
1
22 Γ
e

x 2
1
2
. 证毕.
( ) 可以发现,这刚好是 Γ
1 2
,2
的概率密度函数,且服从
自由度为 1 的卡方分布,记作 X ~ χ21 . 那么服从自由度为 1 的
卡方分布的矩母函数为 MX( t)
=
(1
- 2t)

1 2

如果 Z1,Z2,…,Zn 是独立的随机变量且 Zi ~ N( 0,1) ,如
1. 定义
如果 Z ~ N( 0,1) ,U ~ χ2df ,那么比率 Z 服从自由度 U
槡df
为 df 的 t 分布,记作 X ~ tdf , 如果 自 由 度 df = n,则 概 率 密 度 函 数 为 f( x) =
Γ n +1
( )2
( )( ) 槡πnΓ
n 2
1 + x2

n +1 2
,-
N(
μ,σ)
,我们知道(
n
- 1) σ2
S2

χ2n-1 ,同时又有X
- σ
μ

槡n X-μ
σ
N( 0,1) ,利用 t 分布的定义,我们有
槡n ( n - 1) S2
=
X
- s
μ,
σ2
槡n
槡n - 1
因此,X
- s
μ

tn-1 .
槡n ( 三) F 分布 1. 定义
U
如果 U

χ2n1 ,V

χ2n2
,那么 Y

χ2n .
( 2) 如果 X ~ Γ( α,β) ,则 E( X) = αβ,Var( X) = αβ2 ,
因此,我们可以推出:
若 X ~ χ2n ,那么 E( X) = n,Var( X) = 2n. ( 3) 如果 X ~ χ2n ,Y ~ χ2m ,且 X 和 Y 独立,同样利用矩母 函数,可得 X + Y ~ χ2n+m . ( 二) t 分布

< x < ∞.
n
若 X ~ tn ,有 E( X)
= 0,Var( X)
=
n
n -
2.
事实上,t 分布
的概率密度函数形状与卡方分布类似,但尾部稍粗,并且当
自由度 n 趋于无穷时,t 分布收敛到 N( 0,1) .
2. 性质
( 1) 如果 X1 ,X2 ,…,Xn 是独立同分布的随机变量,且
Xi

n
∑ 果 Y = Z2i ,那么 Y 服从自由度为 n 的卡方分布,记 Y ~ χ2n.
i =1
证明如下: 利用矩母函数和独立性,我们有 MY ( t) =
MZ21 (
t) × M 而每个
ZZ22 (2i
t) × … × MZ2n ( t) , 服从自由度为 1 的卡方分布,其矩母函数为
MZ2i ( t)
,如果
U

V
独立,那么比率
n1 V

n2
从 F 分布,其中分子的自由度为 n1 ,分母的自由度为 n2 ,记
作X ~ Fn1,n2 ,其概率密度函数为
f( x)
Γ n1 + n2
( ) =
2
( ) ( ) Γ n1 Γ n2
( ) ( ) 2
2
n1
x n1
2
n2 2
-1
1 + n1 x

1 2

n1
+ n2)

n2
n2
- ∞ < x < ∞.
同时,如果 X ~ Fn1,n2 ,
那么 E( X)
=
n2 n2 -
2,Var(
X)
2. 性质
=
2n22 ( n1 ( n2
n1 + n2 - - 2) 2 ( n2
2) - 4)

我们可以用 R 模拟 F 分布,
得到
这是一种 非 对 称 分 布,有 两 个 自 由 度,且 位 置 不 可 互 换. F 分布有着广泛的应用,如在方差分析、回归方程的显著 性检验中都有着重要的地位.
=
(1

2t)

1 2

( ) 故 MY( t)
=

1

2t)

n 2
,这是 Γ
n 2
,2
的矩母函数,因
此,我们称 Y 服从自由度为 n 的卡方分布.
2. 性质
( 1) 如果 X1 ,X2 ,…,Xn 是独立同分布的随机变量,且
Xi ~ N( μ,σ) ,
∑( ) n
令Y =
i =1
xi - σ
μ
2
相关文档
最新文档