几种常用的分布_抽样分布
3-理论分布与抽样分布

68-95-99.7规则
➢ 正态分布有其特定的数据分布规则: ▪ 平均值为, 标准差为σ的正态分布 ▪ 68%的观察资料落在的1σ之内 ▪ 95%的观察资料落在的2σ之内 ▪ 99.7%的观察资料落在的3σ之内
19
20
三、68-95-99.7规则
68.26% 的资料 95.45% 的资料 99.73% 的资料 -3 -2 -1 0 1 2 3 -3s -2s -s +s +2s +3s
体称为样本平均数的抽样总体。其平均数和标准差分
别记为 和 。x
s x
是样s x本平均数抽样总体的标准差,简称标准误 (standard error),它表示平均数抽样误差的大小。统 计学上已证明x总体的两个参数与x 总体的两个参数有 如下关系:
u=(x-μ)/σ
x~N(0,1)
上一张 下一张 主 页 退12出
3.3.3 正态分布的概率计算 1. 标准正态分布的概率计算
设u服从标准正态分布,则u在[u1,u2 )内取 值的概率为:
=Φ(u2)-Φ(u1)
(3-16)
Φ(u1)与Φ(u2)可由附表1查得。
上一张 下一张 主 页 退13出
例如,u=1.75时,由附表1可以查出 Φ(1.75)=0.95994
图3-6 μ相同而σ不同的3个正态分布比较大 8
(6)分布密度曲线与横轴所围成的区间面积为1, 即:
(7) 正态分布的次数多数集中在平均数μ的附 近,离均数越远,其相应次数越少,在3σ以外的 极少,这就是食品工业控制中的3σ 原理的基础。
上一张 下一张 主 页 退 9出
3.3.2 标准正态分布
上一张 下一张 主 页 退16出
(1) P(u<-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.024940 (3) P (|u|≥2.56)
第十六讲(数理统计中常用的分布、抽样分布定理)

3 n足够大 时, (n)近似服从• (n,2n) N
2
证
1设
2 (n) X i2
i 1
n
X i ~ N (0,1) i 1,2, , n
X 1 , X 2 , , X n
相互独立,
2 i
则 E ( X i ) 0, D( X i ) 1, E ( X ) 1
•2
P{ X z } 1
-z= z1-
例1 求
z0.05 , z0.025 , z0.005 , z0.95 .
解: P{ X 1.645} 0.05, P{ X 1.96} 0.05, P{ X 2.575} 0.005.
z0.05 1.645 , z0.025 1.96 , z0.005 2.575
0.4 0.3 0.2 0.1
n= 1 n=20
-3
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t分布的性质: 1. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形, 1 t 2 2 再 由函数的性质有 lim f (t ) 2 e . n
~ ( n2 ), U
2
与V 相互
U n1 F V n2
服从自由度为n1及 n2 的F分布,n1称为 第 一自由度,n2称为第二自由度,记作
F~F(n1,n2) . 由定义可见,
1 V n2 ~F(n2,n1) F U n1
若F~F(n1,n2), F的概率密度为
( n1 n2 ) n n1 n21 1 n n 2 n ( n1 ) 2 ( y ) 1 n1 y 2 ( y ) ( 1 ) ( 2 ) 2 2 2 0
(抽样检验)理论分布和抽样分布

第四章理论分布和抽样分布在上章样本分布及其特征的基础上本章将讨论总体的分布及其特征。
首先介绍间断性变数总体的理论分布,包括二项分布和泊松分布;其次介绍连续性变数总体的理论分布,即正态分布;最后介绍从这两类理论分布中抽出的样本统计数的分布,即抽样分布。
为了说明这些理论分布,必须首先了解概率的基本概念和计算法则。
第一节事件、概率和随机变量一、事件和事件发生的概率在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件,而每一个事件出现的可能性称为该事件的概率(probability)。
例如种子可能发芽,也可能不发芽,这就是两种事件,而发芽的可能性和不发芽的可能性就是对应于两种事件的概率。
若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件(random event),例如抽取一粒种子,它可能发芽也可能不发芽,这决定于发芽与不发芽的机会(概率),发芽与不发芽这两种可能性均存在,出现的是这两种可能性中的一种。
事件发生的可能性(概率)是在大量的实验中观察得到的,例如棉田发生盲蝽象为害的情况,并不是所有的棉株都受害,随着观察的次数增多,我们对棉株受害可能性程度大小的把握越准确、越稳定。
这里将一个调查结果列于表4.1。
调查5株时,有2株受害,受害株的频率为40%,调查25株时受害频率为48%,调查100株时受害频率为33%。
可以看出三次调查结果有差异,说明受害频率有波动、不稳定。
而当进一步扩大调查的单株数时,发现频率比较稳定了,调查500株到2000株的结果是受害棉株稳定在35%左右。
表4.1 在相同条件下盲蝽象在某棉田危害程度的调查结果调查株数(n) 5 25 50 100 200 500 1000 1500 2000 受害株数(a) 2 12 15 33 72 177 351 525 704 棉株受害频率(a/n)0.40 0.48 0.30 0.33 0.36 0.354 0.351 0.350 0.352现以n代表调查株数,以a代表受害株数,那么可以计算出受害频率p=a/n。
三大抽样分布及常用统计量的分布

(n1
1) S12
2
~
2
(n1
1),
(n2
1)S
2 2
2
~
2
(n2
1)
且S12与S22相互独立,由 2分布的性质知
(n1 1)S12
2
(n2 1)S22
2
~ 2 (n1
n2
2)
再由定义3知
T
X
Y Sn
(1
1 n1
1
2
)
~t(n1
n2
n2
- 2)
t 分布的上侧分位点
对于给定的 (0< <1),称满足条件
X
2 i
.
i2
i4
解 (1) 因为Xi~N(0,1),i=1, 2, …, n. 所以
X1-X2 ~N(0, 2),
X
2 3
X
2 4
~
2(2),
X1
X2 2
~
N(0,1),
故
X1 X2
X
2 3
X
2 4
(X1
X
X 2)
2 3
X
2 4
2
~t(2).
2
例1 设总体X~N(0,1), X1,X2,…,Xn为简单
/2
/2
- t/2(n) O t/2(n) t
图5-8
在附表4 (P256)中给出了t分布的临界值表.
例如,当n=15,=0.05时,查t分布表得,
t0.05(15)= 1.753
t0.05/2(15)= 2.131
其中t0.05/2(15)由P{t(15)≥t0.025(15)}=0.025查得.
几种常用抽样方案

几种常用抽样方案
常用抽样方案有很多种,以下是几种常见的抽样方案及其特点:
1.简单随机抽样:简单随机抽样是指从总体中随机地选择样本,每个个体有相等的概率被选中。
这种抽样方案适用于总体的分布和特征都是已知的情况,且总体规模不大的情况。
2.系统抽样:系统抽样是指按照一定的规则,从总体中按照一定的间隔选择样本。
例如,从一串编号的个体中每隔一定的距离选择一个个体作为样本。
系统抽样适用于总体规模较大,难以进行简单随机抽样的情况。
3.分层抽样:分层抽样是将总体分为若干层,然后从每一层中进行简单随机抽样。
这种抽样方案适用于总体具有明显的层次结构的情况,可以提高抽样的效率和精度。
4.整群抽样:整群抽样是将总体划分为若干个群体,然后随机选择几个群体作为样本进行调查。
这种抽样方案适用于总体划分明确,群体内的个体相似性较高的情况,能够提高抽样的效率。
5.分阶段抽样:分阶段抽样是将抽样过程划分为多个阶段,在每个阶段中进行不同的抽样方式。
例如,先进行简单随机抽样,然后在选定的样本中再进行分层抽样。
分阶段抽样适用于复杂的抽样情况,能够提高抽样的效率和灵活性。
6.整体抽样:整体抽样是指直接从总体中抽取全部个体作为样本。
这种抽样方案适用于总体规模较小,抽取全部个体的成本较低的情况。
以上是几种常用的抽样方案,不同的抽样方案适用于不同的调查情况。
在选择抽样方案时,需要考虑总体的特点、抽样目的以及可行性等因素,
以确保抽样结果的准确性和可靠性。
常用的三种抽样分布

常用的三种抽样分布
概述
在统计学中,抽样分布是指从总体中抽取一定数量的样本,并计算样本统计量的分布。
根据中心极限定理,当样本数足够大时,样本的均值和标准差会呈正态分布。
然而,并非所有的抽样分布都符合正态分布。
本文将介绍统计学中常用的三种抽样分布,包括正态分布、t分布和χ²(卡方)分布。
1. 正态分布(Normal Distribution)
正态分布是最常见的一种抽样分布,也被称为高斯分布。
它具有以下特点: - 均值为μ,标准差为σ; - 对称分布,其曲线呈钟型,两侧尾部逐渐下降; - 总体分布和抽样分布均为正态分布; - 标准正态分布
的均值为 0,标准差为 1。
可以通过标准化计算将任意正态分布转换为标准正态分布。
正态分布在实际应用中非常重要,尤其是在假设检验和置信区间计算中的应用广泛。
2. t分布(Student’s t-Distribution)
t分布是由英国统计学家William Sealy Gosset(也被称为。
概率论第六章样本及抽样分布

本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
16几个常用的抽样分布与抽样分布定理

(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2
即
( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 1 F0.95 (12,9)= 0.357 F0.05 (9,12) 2.8
证明:
P{F F1 (n1, n2 )} 1
1 1 P{ } 1 F F1 (n1 , n2 ) 1 1 P{ } F F1 (n1, n2 )
1 F ( n2 , n1 ) F1 ( n1 , n2 )
单侧分位点 t ( n)也可由表四查得, P{t t (n)}
2
2
定理5.2 (P.124)设 X ~ N(0,1), Y ~ 2(n),
且 X与Y 独立,则
X t ~ t (n) Y /n
例 设总体 X ~ N(0,1), X1,X2为总体X的样本,Z= X1+X2
z Y X X 2 , 令W , 则W 服从的分布是 () Y Z 0
例:设随机变量X1, X2, …,Xn为总体X~N(,2)的 一个样本,
1 1 2 2 X X i , Sn ( X i X ) n i 1 n i 1
则服从 t(n-1) 分布的统计量是( 4 )
n
n
(1) (3)
n( X )
; ;
n( X ) (2) ; Sn (4) n 1( X ) . Sn
§5.2 几种常用的分布(统计三大分布)
一、2 (卡方)分布 1. 定义
2 ~
称随机变量 2 服从自由度为n的2 分布,记为2 ~ 2(n).
其中,( r ) x r 1e x dx ( r 0时收敛 ). 0 1 有 ( r 1) r( r )(r 0), (1) 1, ( ) . 2
(2) (6);
2
(4) (3) .
2
§5.3 抽样分布 1. 单个正态总体
2 X , X , , X 设 1 2 n 是来自正态总体X ~ N ( , )的样本
下面介绍几个常用统计量的分布(Th5.4, 5.6, 5.7)。 2 1. X ~ N , n
X 2. u / n
~ N (0,1)
4. 与正态分布之间的关系 定理5.1(P.123 )设随机变量 X ~ N (0,1) (i 1,2,, n), 且它们相互独立,则
i
X ~ ( n)
2 2 i 2 i 1
n
自由度:构成平方和的独立项数。
本平方和中,有 n个独立项: X 1 , X 2 , , X n
X ~ N (0,1), 则X ~ (1),即EX
定理5.3 (P.125)设 X ~ 2 ( n1 ),Y ~ 2 ( n2 ) ,
且X与Y相互独立,则
X / n1 ~ F ( n1 , n2 ) F Y / n2
推论 若 F ~ F(n1, n2) ,则
1 1 ~ F ( n2 , n1 ), 且 F1- ( n1 , n2 )= F F ( n2 , n1 )
X1 , X 2 ,
, X15为来自总体N (0,32 )的一个样本,
15 15 2 求:(1)P X i 225 (2) P 36.65 ( X i X )2 235 . i 1 i 1
15 1 解:(1)令12 2 X i 2 ~ 2 (15) 3 i 1 15 15 1 225 2 2 P{ X i 225} P{ 2 ( X i 0) 2 } 3 i 1 3 i 1 2 P{12 25} 1 P{1 25} 1 0.05 0.95
2 2
2
2 1 _, DX
2 _
二、t 分布 定义5.6 随机变量t 的概率密度为
称t 服从自由度为n 的t 分布,记为 t ~ t(n).
双侧分位点(表四)
P{| t | t ( n)} (给定 )
例1) 2.080,
3. 分位点
P{ ( n)} (给定)
2 2
2 分布的上 分位点(表三)
2 查表三 ( P . 256 ) 得 0.01, n 14, 例如: 0.01 (14) 29.141
即若 2 ~ 2 (14), 则 P{ 2 29.141} 0.01
15 2 (2) P 36.65 ( X i X ) 235 . i 1
(2) 由定理5.6知
15
15 1 22 2 ( X i X ) 2 ~ 2 (14) 3 i 1
15 36.65 1 235 2 P 2 2 ( X i X ) 2 P 36.65 ( X i X ) 235 2 3 i 1 3 3 i 1
解 由 故
2 2 X ~ N ( 21, ) 25
0 .4 2 X 21 ~ 得 N (0,1) 0.4
X 21 P{| X 21 | 0.24} P 0.6 0.4 2(0.6) 1
0.4514
例( P.130 定理5.1,定理5.6的应用)
n 2(指数分布)
n4 n8
2 分布图
2. 性质
1° 若 2 ~ 2(n) ,则 E2 =n, D2 =2n; 2 2 2 2 ( n ), ( n2 ), 2° (可加性):若 1 ~ 1 2 ~ 2 2 且 1与 2 相互独立,则 2 2 2 ~ 1 2 ( n1 n2 ) 可推广到k个的情形。
X 1 , X 2 ,, X n为X的一个样本,则当 n 充分大时,
X ~ N ( 0,1) (近似) / n
证 由中心极限定理,当n充分大时
X / n
X
i 1
n
i
n
2
n
~ N (0,1) (近似)
2. 两个正态总体(P.128 )
定理5.8 的结果
2 2 2 , 则有 定理5.9 若两总体方差相等: 1 2
P{4.07 26.11} P{ 22 4.07} P{ 22 26.11}
2 2
对n=14
查表三 (P.255,256)
0.995 0.025 0.97
4.07
26.11
对于非正态总体的大样本有以下结果:
2 EX , DX , 定理5.5(P.126)设X为任意总体,且
1
n
X 5. t S/ n
i
~ t ( n 1)
3.
2
( n 1) S 2
2
n i 1
2
(X
i 1
X)
2
~ ( n 1)
2
4. 2
1
2 ( X ) i 2
2 ~ ( n)
例(P.126 ,定理5.4的应用)
X 1 , X 2 ,, X 25为来自总体N ( 21,2 2 )的一个样本, 求 ( 2) P{| X 21 | 0.24}.
n 1( X )
例:设随机变量X1, X2, …,X6为总体X~N(,2)的 一个样本,则
Y
( X1 X 2 ) ( X 3 X 4 ) ( X 5 X 6 ) 2
2 2 2
1
服从( 4 )分布。
(1) N (0,1); (3) t (3);
2 1 2
Z 2 ~ t (2) W Y Y /2
三、F分布 定义5.7 随机变量 F 的概率密度
称 F服从第一自由度为n1,第二自由度为 n2的F分布, 记为 F ~ F(n1, n2). F 分布的上分位点由表五给出
P{F F (n1 , n2 )} (小)
当所给概率较大时利用后面的推论,查分位点。