03 第三节 正态总体的抽样分布

合集下载

第三讲 抽样分布和估计

第三讲 抽样分布和估计
Stat_istic
x
Proportion p
p
Variance Difference
2
-
12
s2
__ x -x
12
30
联合食品公司的案例
针对“联合食品公司”的案例(P.44 案例2-1), 我们假设调查的100个客户组成一个简单随机样 本。尝试回答下面的问题: 1)所有客户一次购买金额的平均值是多少?
第三讲
抽样分布和估计
1
概率论与统计学之间的关系
一个概率论的问题:
假定有一个大盒子中有 10,000个球,分布如下: 70%的黑球和 30%的白球
随机抽取100个球,得到60个黑球和40个白球的 概率是多少?
---- 给定一个总体(盒子中的所有小球)的已知 特征(70% 和30%),研究一个试验(抽取小球) 的可能的结果 (例如 60-40) 。
2
一个统计学的问题:
假定一个大盒子中有 10,000个小球(黑和白)。 随机抽取100个小球,发现其中有60个黑球和40个
白球。那么黑球在盒子中所占的比例是多少?
---- 观察到一个试验(抽取小球)的结果 (60-40), 推断出这个总体(盒子中的所有小球)的特征 (比例)
3
总体-样本理论 统计推断采用一个(有代表性的)子总体 (样本)来对总体的某些特征进行科学的 推断。
10 2 55 7.42
x 10.33 s 2 56.78 s 7.54
抽样分布
样本不同, x 值也不同。那么 x 取不同 值的可能性分别是什么? x 的概率分布称作它的抽样分布。 抽样分布在统计推断中的中心地位。 抽样分布取决于总体的分布(模型)以 及抽样的方式。
抽样方式 总体分布===== 抽样分布

抽样方法、正态分布

抽样方法、正态分布

抽样方法、正态分布本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March抽样方法、正态分布重点、难点讲解:1.抽样的三种方法:简单随机抽样、系统抽样、分层抽样。

后两种方法是建立在第一种方法基础上的。

2.了解如何用样本估计总体: 用样本估计总体的主要方法是用样本的频率分布来估计总体分布,主要有总体中的个体取不同数值很少和较多甚至无限两种情况。

3.正态曲线及其性质:N(),其正态分布函数:f(x)=, x∈(-∞,+∞)。

把N(0,1)称为标准正态分布,相应的函数表达式:f(x)=, x∈(-∞,+∞)。

正态图象的性质:①曲线在x轴的上方,与x轴不相交。

②曲线关于直线x=μ对称。

③曲线在x=μ时位于最高点。

④当x<μ时,曲线上升;当x>μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。

⑤当μ一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中。

4.一般正态分布与标准正态分布的转化对于标准正态分布,用表示总体取值小于x0的概率,即=p(x<x0),其几何意义是由正态曲线N(0,1),x轴,直线x=x0所围成的面积。

又根据N(0,1)曲线关于y轴的对称性知,,并且标准正态总体在任一区间(a,b)内取值概率。

任一正态总体N(),其取值小于x的概率F(x)=。

5.了解“小概率事件”和假设检验的思想。

知识应用举例:例1.从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样思路分析:因为总体的个数503,样本的容量50,不能整除,故可采用随机抽样的方法从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,再用系统抽样方法。

解:第一步:将503名学生随机编号1,2,3,……,503第二步:用抽签法或随机数表法,剔除3个个体,剩下500名学生,然后对这500名学生重新编号。

抽样检验和抽样分布

抽样检验和抽样分布

占总体单位数N的比例,即:
n n n n 1 2 3 K n
N1 N2 N3
NN K
各类型组应抽取的样本单位数为:
N n
in
n N i N i N
样本比率抽样样本容量:按前面指定的比
例(n/N)从每组的Ni单位中抽取ni个单位 即构成一个抽样总体,其样本容量为:
K
n= n1+ n2+ n3+…+ nk= ni i 1
数μ;
3、样本平均数 x 分布的均方差 x 等于:
当为有限总体无放回抽样时,其样本均值 标准差为:
N
N x
N
N
p
1
p
如果总体为无限总体的或抽取是有放回的
,其样本均值标准差为:
x
N
(二)非正态总体样本平均数 x 的分布及
性质?
1、中心极限定理可以解决上述问题:
一个具有任意函数形式的总体,其样
2、抽样误差:是指由于随机抽样的偶然因 素使样本各单位的结构不足以代表总体 各单位的结构,而引起抽样指标和全及 指标之间的绝对离差。不包含登记性误 差和不遵守随机原则造成的偏差。
影响抽样误差的因素有:总体各单位标 志值的差异程度;样本的单位数;抽样 的方法;抽样调查的组织形式。
第二节 随机抽样设计
样本容量足够大(n=50),据中心极限
定理,x 近似服从正态分布。
(1)
3160
x
800 113.14
x
N
50
x
P x3000 P
x
3000
3160
/ n
113.14
Pz 1.41 0.9207
同理处理(2)和(3)

统计学 第三章抽样与抽样分布

统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取

正态总体下的抽样分布

 正态总体下的抽样分布

§1.2数理统计中常用的分布正态总体是最常见的总体, 本节介绍的几个抽样分布均对正态总体而言.1.标准正态分布2. 2分布3.t分布4.F分布o xϕ(x )定义:设X ~N (0,1),对任给的α, 0<α<1,称满足条件1、标准正态分布αϕαα==>⎰+∞dx x z X P z )(}{的点z α为标准正态分布的上α分位点.z αα例:求z0.05解:P{X≤z0.05}=1−P{X>z0.05}=1−0.05=0.95∵P{X≤1.64}=0.9495P{X≤1.65}=0.9505∴z0.05≈(1.64+1.65)/2=1.645公式: Φ(zα)=1−α常用数字575.296.1645.1005.0025.005.0===zzz定义:设X i ~N (0,1) (i =1,2,...,n ), 且它们相互独立,则称随机变量2、χ2分布221nii X χ==∑服从自由度为n 的χ2分布,记为χ2~χ2(n ).χ2分布最常用的是拟合优度检验.其中,在x > 0时收敛,称为Γ函数,具有性质1()tx te dtx +∞−−Γ=⎰(1)(),(1)1,(1/2)(1)!()x x x n n n N πΓ+=ΓΓ=Γ=Γ+=∈一般自由度为n 的χ2(n )的密度函数为12221,0()2()20,xnnn ex ng x x x −−⎧>⎪⎪=Γ⎨⎪⎪≤⎩χ2分布的密度函数图χ2~χ2(n)D Y =D෍i=1nX i 2=෍i=1n D(X i 2)=෍i=1n [E(X i 4)−(E(X i 2))2]=෍i=1n2=2n .χ2分布的基本性质(1)设Y 1~χ2 (m ), Y 2~χ2 (n ), 且Y 1 , Y 2 相互独立,则χ2 分布的可加性(2)若Y ~χ2 (n ), 则E (Y )=n ,D (Y )=2n.= 1;)(~221n m Y Y ++χY 1=෍i=1mX i 2,Y 2=෍i=m+1m+nX i 2,)(~2n m +χY 1+Y 2=෍i=1m+nX i2E Y =E෍i=1nX i 2=෍i=1nE(X i 2)=෍i=1n[D(X i )+(E(X i ))2]=෍i=1n1=n ,E(X i 4)=12πන−∞+∞x 4e −x 22dx =3故(3)设X 1,…, X n 相互独立,且都服从正态分布N (μ,σ2),则;)(~)(12122n X Y ni i χμσ∑=−=(4)若Y ~χ2 分布,则当n 充分大时,近似服从N (0,1).n n Y 2−应用中心极限定理oχ2α(n )xf (x )α设χ2~χ2(n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件αχχαχα==>⎰+∞dx x f n P n )(222)()}({的点χ2α(n )为χ2(n )分布的上α分位点.χ2分布的上α分位点当n 充分大时,22)12(1)(−+≈n z n ααχ例:设X ~N (μ,σ2), (X 1,X 2,...,X 16)是取自总体X 的样本,求概率:}2)(1612{216122σμσ≤−≤∑=i iX P 解:∵X 1,X 2,...,X 16相互独立且)1,0(~N X i σμ−)16(~)(21612χσμ∑=−∴i i X}2)(1612{216122σμσ≤−≤∑=i iX P }32)(8{1612≤−≤=∑=i i X P σμ}32)({}8)({16121612>−−≥−=∑∑==i i i i X P X P σμσμ≈0.95−0.01=0.94定义:设X ~N (0,1),Y ~χ2(n ),且X 与Y 相互独立,则称随机变量3、t 分布服从自由度为n 的t 分布,记为T ~t (n )./X T Y n=T 的密度函数为:22112()1,.2n n n t x x n n n x π+−+⎛⎫Γ ⎪⎛⎫⎝⎭=+−∞<<∞ ⎪⎛⎫⎝⎭Γ ⎪⎝⎭1908年英国统计学家W.S. Gosset (笔名Student )t分布的密度函数图T~t(n)t 分布的上α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件(){()}()t n P T t n f x dt ααα+∞>==⎰的点t α(n )为t 分布的上α分位点.f (x )xt α(n )αt *0f (x )1-αx-t *t 分布的双侧α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件*{||}1P T t α<=−的数t *为t 分布的双侧α分位点.α/2t 分布的密度函数f (x )是偶函数,故**()()P T t P T t ≤−=≥***(||)()P T t P t T t <=−<<*(),2P T t α≥=于是得即*()2P T t α>=**()()P T t P T t =<−≤−**(1())()P T t P T t =−≥−≥*12()1,P T t α=−≥=−= t α/2(n )t 分布的性质(1) 其密度函数f (x )是偶函数(3) f (x )的极限为N (0,1)的密度函数,即221lim ()()2x n f x x e φπ−→∞==(2)t 1−α(n )= −t α(n )当n >45时,t α(n )≈z α例:设X , Y 1,Y 2,Y 3,Y 4 相互独立,且X ~N (2,1),令Y i ~N (0, 4),i =1, 2, 3, 4 ,解:∵X -2~N (0, 1),~t (4),即Z 服从自由度为4 的t 分布.求Z 的分布.由t 分布的定义Y i /2~N (0, 1),i = 1, 2, 3, 4 . ,)2(4412∑=−=i iY X Z ∑=−=412)2(4i i Y X Z 4)2(2412∑=−=i i Y X例:设随机变量X 与Y 相互独立,X ~ N (0,16),Y ~ N (0,9) , X 1, X 2,…, X 9与Y 1, Y 2 ,…, Y 16分别是取自X 与Y 的简单随机样本,求统计量所服从的分布.解:)169,0(~921⨯+++N X X X )1,0(~)(431921N X X X +++⨯ 2162191YY XX Z ++++=从而16,,2,1,)1,0(~31=i N Y i )16(~3122161χ∑=⎪⎭⎫ ⎝⎛i i Y 2162221921Y Y Y X X X ++++++ ()16314311612921∑=⎪⎭⎫ ⎝⎛+++⨯=i i Y X X X )16(~tt分布用于在小样本(n<30)场合下的正态分布(大样本(n≥30)场合下可以用正态分布来近似),有时候在信息不足的情况下,只能用t分布,比如在总体方差不知的情况下,对总体均值的估计和检验通常要用t统计量.12222,()2(),0()()()220,0m n m m nm n x x m nm n n m x m n f x x +−−+⎧Γ⎪+>⎪=⎨ΓΓ⎪⎪≤⎩F 的密度函数为:所服从的分布为第一自由度为m ,第二自由度为n 的F 分布,记作F ~ F (m , n ).4、F 分布则称统计量F 分布多用于比例的估计和检验!nY mX F =定义:设随机变量X 与Y 独立,且X~χ2(m),Y~χ2(n),F 分布的密度函数图F~F(m,n)F 分布的上α分位点设F ~F (m ,n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件ααα==>⎰+∞dx x f n m F F P n m F ),()()},({的点F α(m ,n )为F 分布的上α分位点.0f (x )F α(m ,n )αxF 分布的性质(1) 若F ~F (m ,n ),则(2)()~,1F F n m ),(1),(1m n F n m F αα=−}),(11{1n m F F P α−≤=∵1−α=P {F ≥F 1−α(m ,n )}}),(11{11n m F F P α−>−=αα=>⇒−}),(11{1n m F F P ),(),(11m n F n m F αα=⇒−(3)若X ~ t (n ), 则X 2~ F (1, n );mX nY F=1例:设F ~ F (24, 15) ,求F 1,F 2,F 3,使其分别满足P (F >F 1 )= 0.025 , P (F <F 2 )= 0.025 , P (F >F 3 )= 0.95 .解:(1)由m =24,n =15,α= 0. 025 ,查P192 附表6(2)无法直接查表获得,但由F 分布性质知1/F ~F (15, 24),查附表6知(3) ∵F 3 =F 0. 95(24,15), 查附表6知:∴ F 2 = 1/2.44 = 0.41 ; 由性质(2)知,025.0)11()(22=>=<F F P F F P 1F 2=F 0.025(15,24)=2.44⇒P(F <1/2.44)=0.025F 0.05(15,24)=2.11,,)24,15(1)15,24(95.0195.0−=F F .474.011.213==∴F 知F 1= F 0.025 (24, 15)= 2.70 ;抽样分布定理1. 单个正态总体的抽样分布2. 两个正态总体的抽样分布定理:设X 1,X 2,...,X n 是来自正态总体N (μ,σ2)的样本,则1. 单个正态总体的抽样分布(1)),(~2n N X σμ)1,0(~N n X σμ−⇒(2)与S 2相互独立X (3))1(~)1(222−−n S n χσ(4))1(~−−n t n S X μ1σ2෍n(X i −μ)2~χ2(n)(5)(1)∑==ni i X n X 11)1,0(~N n X σμ−⇒为n 个相互独立的正态X ∴服从正态分布∑==ni i X E n X E 1)(1)(=μ∑==n i i X D n X D 12)(1)(n2σ=),(~2n N X σμ∴随机变量的线性组合(4)),1,0(~N n X σμ− 且它们相互独立由t 分布的定义,)1(~1)1(22−−−−n t n S n nX σσμ)1(~−−n t n S X μ即22)1(σS n −~χ2(n −1)例:设(X 1,X 2,…,Xn )是取自总体X 的样本, 是样本均值,如果总体X ~N (μ,4),则样本容量n 应取多大才能使X 95.0}1.0|{|≥≤−μX P 解:)1,0(~ N n X σμ− }21.02||{}1.0|{|n n X P X P ≤−=≤−∴μμ}05.02)(05.0{n X n n P ≤−≤−=μ)05.0()05.0(n n −Φ−Φ=1)05.0(2−Φ=n ≥0.95975.0)05.0(≥Φ⇒n 96.105.0≥⇒n ⇒n ≥1536.64⇒n ≥1537解:),1(~)1(222−−n S n χσ由),,(~2nN X σμ又()⎪⎭⎫⎝⎛+−+n n N X X n 211,0~σ)1,0(~11N n n X X n +−+σ故212(1)~(1)1(1)n X Xn n St n n n σσ+⎛⎫−−−⎪+−⎝⎭于是)1(~11−+−+n t n nS X X n 即例:总体X ~N (μ,σ2),(X 1,X 2,…,X n ,X n +1)为样本,,求X n+1−തX S n n+1的分布.S 2=1n −1෍i=1n(X i −തX)2തX=1n ෍i=1nX i定理:设总体X ~N (μ1,σ12),总体Y ~N (μ2,σ22).X 1,X 2,...,是总体X 的样本,Y 1,Y 2,...,是总体Y 的样本, 且这两个样本相互独立.则1n X 2n Y 2. 两个正态总体的抽样分布(1)),(~22212121n n N Y X σσμμ+−−(2))1,1(~2122222121−−n n F S S σσ)2(~11)()(212121−++−−−n n t n n S Y X ωμμ其中2)1()1(212222112−+−+−=n n Sn S n S ω称为混合样本方差.进一步,若σ12=σ22 =σ2,有(3)),(~221221n n N Y X σσμμ+−− )1,0(~11)()(2121N n n Y X +−−−∴σμμ2211)1(σSn −~χ2(n1−1),2222)1(σSn −~χ2(n2−1)且它们相互独立22222211)1()1(Sn Sn −+−∴~χ2(n1+n 2−2)由t 分布的定义,2)1()1(11)()(21222222112121−+−+−+−−−n n Sn Sn n n Y X σσσμμ22221121112)1()1()()(n n n n Sn S n Y X +−+−+−−−−μμ即~t (n 1+n 2−2)~t (n 1+n 2−2)小结1.理解总体、个体、样本和统计量的概念,掌握样本均值和样本方差的计算及基本性质2.掌握 2分布、t分布、F分布的定义,会查表计算3.理解正态总体的某些统计量的分布。

3-理论分布与抽样分布

3-理论分布与抽样分布

68-95-99.7规则
➢ 正态分布有其特定的数据分布规则: ▪ 平均值为, 标准差为σ的正态分布 ▪ 68%的观察资料落在的1σ之内 ▪ 95%的观察资料落在的2σ之内 ▪ 99.7%的观察资料落在的3σ之内
19
20
三、68-95-99.7规则
68.26% 的资料 95.45% 的资料 99.73% 的资料 -3 -2 -1 0 1 2 3 -3s -2s -s +s +2s +3s
体称为样本平均数的抽样总体。其平均数和标准差分
别记为 和 。x
s x
是样s x本平均数抽样总体的标准差,简称标准误 (standard error),它表示平均数抽样误差的大小。统 计学上已证明x总体的两个参数与x 总体的两个参数有 如下关系:
u=(x-μ)/σ
x~N(0,1)
上一张 下一张 主 页 退12出
3.3.3 正态分布的概率计算 1. 标准正态分布的概率计算
设u服从标准正态分布,则u在[u1,u2 )内取 值的概率为:
=Φ(u2)-Φ(u1)
(3-16)
Φ(u1)与Φ(u2)可由附表1查得。
上一张 下一张 主 页 退13出
例如,u=1.75时,由附表1可以查出 Φ(1.75)=0.95994
图3-6 μ相同而σ不同的3个正态分布比较大 8
(6)分布密度曲线与横轴所围成的区间面积为1, 即:
(7) 正态分布的次数多数集中在平均数μ的附 近,离均数越远,其相应次数越少,在3σ以外的 极少,这就是食品工业控制中的3σ 原理的基础。
上一张 下一张 主 页 退 9出
3.3.2 标准正态分布
上一张 下一张 主 页 退16出
(1) P(u<-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.024940 (3) P (|u|≥2.56)

统计学 抽样分布和理论分布

统计学  抽样分布和理论分布

抽样分布与理论分布一、抽样分布总体分布:总体中所有个体关于某个变量的取值所形成的分布。

样本分布:样本中所有个体关于某个变量大的取值所形成的分布。

抽样分布:样品统计量的概率分布,由样本统计量的所有可能取值和相应的概率组成。

即从容量为N 的总体中抽取容量为n 的样本最多可抽取m 个样本,m 个样本统计值形成的频率分布,即为抽样分布。

样本平均数的抽样分布:设变量X 是一个研究总体,具有平均数μ和方差σ2。

那么可以从中抽取样本而得到样本平均数x ,样本平均数是一个随机变量,其概率分布叫做样本平均数的抽样分布。

由样本平均数x 所构成的总体称为样本平均数的抽样总体。

它具有参数μx 和σ2x ,其中μx 为样本平均数抽样总体的平均数,σ2x 为样本平均数抽样总体的方差,σx 为样本平均数的标准差,简称标准误。

统计学上可以证明x 总体的两个参数 μx 和σ2x 与X 总体的两个参数μ和σ2有如下关系:μx = μσ2x = σ2 /n 由中心极限定理可以证明,无论总体是什么分布,如果总体的平均值μ和σ2都存在,当样本足够大时(n>30),样本平均值x 分布总是趋近于N (μ,n2σ)分布。

但在实际工作中,总体标准差σ往往是未知的,此时可用样本标准差S 估计σ。

于是,以nS估计σx ,记为X S ,称为样本标准误或均数标准误。

样本平均数差数的抽样分布:二、正态分布2.1 正态分布的定义:若连续型随机变量X 的概率密度函数是⎪⎭⎫ ⎝⎛--=σμπσx e x f 22121)( (-∞<x <+∞)则称随机变量X 服从平均数为μ、方差为σ2的正态分布,记作X~N (μ,σ2)。

相应的随机变量X 概率分布函数为 F (x )=⎰∞-x dx x f )(它反映了随机变量X 取值落在区间(-∞,x )的概率。

2.2 标准正态分布当正态分布的参数μ=0,σ2=1时,称随机变量X 服从标准正态分布,记作X~N (0,1)。

第3章 抽样分布

第3章 抽样分布

样本方差s2
s2取值的概率
0.0 0.5
4/16 6/16
2
4.5
39
4/16
2/16
0.00 0.0 0.5 s的取值 2.0 4.5
(用Excel计算2分布的概率)
1. 利用Excel提供的CHIDIST统计函数,计算2分布 右单尾的概率值
2. 语法为 CHIDIST(x,df) ,其中 df 为自由度, x 是随 机变量的取值 3. 给定自由度和统计量取值的右尾概率,也可以利 用“插入函数”命令来实现 4. 计算自由度为8,统计量的取值大于10的概率
σ2 =1.25
23
x 2.5
x2 0.625
样本均值的抽样分布
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n=4 x 5 n =16 x 2.5
37
2分布
(图示)
选择容量为n 的 不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本


计算样本方差s2
计算卡方值
n=20
2 = (n-1)s2/σ2
计算出所有的
2
2值
38
2分布
(例题的图示)
16个样本方差的分布
s取值的概率
0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05
13
三种不同性质的分布
1 2 3
14
总体分布 样本分布 抽样分布
总体分布
(population distribution)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三节 正态总体的抽样分布
分布图示
★ 抽样分布
★ 单正态总体的抽样分布
★ 例 1 ★ 例 2 ★ 例 3
★ 双正态总体的抽样分布
★ 例 4 ★ 例 5
★ 内容小结 ★ 课堂练习
★ 习题12-3
内容要点
一、抽样分布
有时, 总体分布的类型虽然已知, 但其中含有未知参数,此时需对总体的未知参数或对总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从已知的总体分布. 统计学中泛称统计量分布为抽样分布.
二、单正态总体的抽样分布
设总体X 的均值μ,方差为2σ,n X X X ,,,21 是取自X 的一个样本,X 与2S 分别为该样本的样本均值与样本方差, 则有 ,)(,)(2σμ==X D X E )(2S E .2
σ=
定理1 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )/,(~2n N X σμ; (2) ).1,0(~/N n X U σμ-= 定理2 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有
(1) 2χ=);1(~)(1
1
212222--=-∑=n X X S n n i i
χσσ
(2) X 与2S 相互独立.
定理3 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个
样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )(~)(121222n X n i i χμσχ∑=-=
(2) ).1(~/--=n t n S X T μ
三、双正态总体的抽样分布
定理 4 设),(~211σμN X 与),(~222σμN Y 是两个相互独立的正态总体, 又设
1
,,,21n X X X 是取自总体X 的样本, X 与21S 分别为该样本的样本均值与样本方差. 2
,,,21n Y Y Y 是取自总体Y 的样本, Y 与22S 分别为此样本的样本均值与样本方差. 再记2w S 是21S 与22
S 的加权平均, 即
.2
)1()1(212222112-+-+-=n n S n S n S w 则 (1) );1,0(~//)
()(222
12121N n n Y X U σσμμ+---= (2) );1,1(~2122
2
1212--⎪⎪⎭⎫ ⎝⎛=n n F S S F σσ
(3) 当22221σσσ==时, ).2(~/1/1)()(212
121-++---=n n t n n S Y X T w μμ
例题选讲
单正态总体的抽样分布
例1 (E01) 设),2,21(~2N X 2521,,,X X X 为X 的一个样本,求:
(1) 样本均值X 的数学期望与方差; (2) }.24.0|21{|≤-X P
解 )1( 由于),2,21(~2N X 样本容量,25=n 所以,252,21~2⎪⎪⎭
⎫ ⎝⎛N X 于是,21)(=X E .4.0252)(22==X D )2( 由),4.0,21(~2N X 得),1,0(~4
.021N X - 故 ⎪⎭
⎪⎬⎫⎪⎩⎪⎨⎧≤-=≤-6.04.021}24.0|21{|X P X P .4514.01)6.0(2=-Φ=
例2 假设某物体的实际重量为μ, 但它是未知的. 现在用一架天平去称它, 共称了n 次,得到n X X X ,,,21 . 假设每次称量过程彼此独立且没有系统误差, 则可以认为这些测量值都服从正态分布),(2σμN , 方差2σ反映了天平及测量过程的总精度, 通常我们用样本均值X
去估计μ, 根据定理1, .,~2⎪⎪⎭
⎫ ⎝⎛n N X σμ 再从正态分布的σ3性质知
%.7.993||≥⎭⎬⎫⎩
⎨⎧<-n X P σμ 这就是说, 我们的估计值X 与真值μ的偏差不超过n /3σ的概率为99.7%,并且随着称量次数n 的增加, 这个偏差界限n /3σ愈来愈小. 例如若,1.0=σ10=n . 则
%,7.99}09.0|{|101.03||≥<-=⎭
⎬⎫⎩⎨⎧⨯<-μμX P X P 于是我们以99.7%的概率断言, X 与物体真正重量μ的偏差不超过0.09.如果将称量次数n 增加到100, 则
%.7.99}03.0|{|1001.03||≥<-=⎭
⎬⎫⎩⎨⎧⨯<-μμX P X P 这时,我们以同样的概率断言, X 与物体真正重量μ的偏差不超过0.03.
例3 (E02) 在设计导弹发射装置时, 重要事情之一是研究弹着点偏离目标中心的距离的
方差.对于一类导弹发射装置, 弹着点偏离目标中心的距离服从正态分布),(2σμN , 这里22100米=σ, 现在进行了25次发射试验, 用2S 记这25次试验中弹着点偏离目标中心的距离的样本方差. 试求2S 超过502米的概率.
解 根据定理2, 有
),1(~)1(222--n S n χσ 于是 ⎭
⎬⎫⎩⎨⎧->-=>222250)1()1(}50{σσn S n P S P ⎭⎬⎫⎩⎨⎧⨯>=1005025)24(2χP }12)24({2>=χP }401.12)24({2>>χP .975.0=(查表)
于是我们可以以超过%5.97的概率断言, 2S 超过50 米2.
双正态总体的抽样分布
例4 (E03) 设两个总体X 与Y 都服从正态分布)3,20(N ,今从总体X 与Y 中分别抽得容量15,1021==n n 的两个相互独立的样本, 求}.3.0|{|>-Y X P
解 由题设及定理4, 知),1,0(~5.0153103)
2020()(N Y X Y X -=+--- 于是
}3.0|{|>-Y X P ⎪⎭
⎪⎬⎫⎪⎩⎪⎨⎧≤--=5.03.05.01Y X P ⎥⎦⎤⎢⎣⎡-⎪⎪⎭⎫ ⎝⎛Φ-=15.03.021.6744.0)42.0(22=Φ-=
例5 (E04) 设总体X 和Y 相互独立且都服从正态分布);3,30(2N
251201,,;,,Y Y X X 分别来自总体X 和Y 的样本, ,,Y X 21S 和22
S 分别是这两个样均值和方差. 求}.4.0/{2221≤S S P
解 因,3221==σσ 由定理4, ),125,120(~/2221--F S S 即).24,19(~/2221F S S
因F 分布表中没有,191=n 但由F 分布的性质, 知),19,24(~/2122F S S
于是 }5.2/{}4.0/{21222221≥=≤S S P S S P
查表有,45.2)19,24(025.0=F 即,025.0}45.2)19,24({=>F P 故.025.0}4.0/{2221≈≤S S P
课堂练习
1. 设1521,,,X X X 为正态总体)3,0(2N 的一个样本, X 为样本均值, 求: .235)(65.361512⎭
⎬⎫⎩⎨⎧≤-≤∑=i i X X P
2. 设n X X X ,,,21 为总体),(~2σμN X 的一个样本, X 和2S 为样本均值和样本方差.又设新增加一个试验量11,++n n X X 与n X X ,,1 也相互独立, 求统计量
1
1+-=+n n S X
X U n 的分布.。

相关文档
最新文档