第五章抽样分布与参数估计

合集下载

抽样分布与参数估计

抽样分布与参数估计首先，我们来了解什么是抽样分布。

在统计学中，抽样分布是指从总体中多次抽样得到的样本统计量的分布。

假设我们的总体是指所有感兴趣的个体的集合，而样本是从总体中选取的一部分个体。

抽样分布的形状和性质取决于总体的分布和样本的大小。

通过分析抽样分布，可以得到有关总体参数的有用信息。

例如，我们想要知道一些城市成年人的平均年收入。

在实际情况下，我们无法调查每个人的收入情况，因此我们需要从总体中随机抽取一部分个体作为样本，并计算他们的平均年收入。

如果我们多次从总体中抽取样本并计算平均年收入，然后绘制这些平均值的分布图，我们就可以得到平均年收入的抽样分布。

这个抽样分布将给我们提供有关总体平均年收入的估计和推断。

接下来，我们将讨论参数估计。

参数估计是指使用样本数据来估计总体参数的过程。

总体参数是用于描述总体特征的数值，如总体平均值、总体标准差等。

通过从总体中抽取样本，并计算样本统计量，我们可以利用样本统计量来估计总体参数。

常用的参数估计方法有点估计和区间估计。

点估计是指用单个数值来估计总体参数，例如用样本均值来估计总体均值。

点估计给出了一个单一的值，但不能提供关于估计的精度的信息。

因此，我们常常使用区间估计。

区间估计是指给出一个区间，这个区间内有一定的置信水平使得总体参数落在这个区间内的概率最高。

区间估计能够向我们提供关于估计的精确程度的信息。

区间估计依赖于抽样分布的性质。

中心极限定理是制定抽样分布理论的一个重要原则。

根据中心极限定理，当样本容量足够大时，样本均值的抽样分布将近似于正态分布。

这使得我们可以使用正态分布的性质来计算置信区间。

构建置信区间的一种常用方法是使用样本均值的标准误差。

标准误差是样本均值的标准差，它用来衡量样本均值和总体均值之间的误差。

根据正态分布的性质，当样本容量足够大时，样本均值与总体均值之间的误差可以用标准误差来估计。

通过计算标准误差并结合正态分布的性质，我们可以得到样本均值的置信区间。

曾五一《统计学导论》(第2版)配套题库【课后习题】第五章抽样分布与参数估计【圣才出品】

A．是不可避免要产生的 B．是可以通过改进调查方法消除的
C．是可以事先计算的
D．只有调查结束之后才能计算
【答案】AC
【解析】抽样误差是由于抽样的随机性引起的样本结果与总体之间的误差。抽样误差是
一种随机性误差，只存在概率抽样中，在概率抽样中，抽样误差是不可避免的。但是，用大
数定律的数学公式，是可以事先计算的。
构造的统计量
X S
服从 t n
1
，则置信区间为：
X
t /2
n
1
S n
n
样本均值
X
=12.09，样本标准差
S2 n 1
S
2 15
=0.005，
S15
=0.0707
SX =
S =0.0707/ n
16 =0.0177， t0.025
15
2.131
△= t /2 n 1
S n
=0.0177 2.131=0.038
5．某微波炉生产厂家想要了解微波炉进入居民家庭生活的深度。他们从某地区已购买了微波炉的 2200 个居民户中用简单随机不还原抽样方法以户为单位抽取了 30 户，询问每户一个月中使用微波炉的时间。调查结果依次为（单位：分钟）
【答案】A
【解析】 E z 2
，根据公式可知，如果极限误差缩小为原来的二分之一，则在其
n
他条件不变的情况下，样本容量扩大为原来的 4 倍。
4．当样本单位数充分大时，样本估计量充分地靠近总体指标的可能性趋于 1，称为抽样估计的（）。
A．无偏性 B．一致性 C．有效性 D．充分性【答案】B 【解析】一致性是指随着样本容量不断增大，样本统计量接近总体参数的可能性就越来越大，或者，对于任意给定的偏差控制水平，两者间偏差高于此控制水平的可能性越来越小，接近于 0。用公式表示就是

统计学课件第5-7章概率分布、抽样分布及参数估计剖析.

第5、6、7章
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有：
● 遵循随机性原则 --- 体现在在每一层抽选中；
● 每一层内应包含足够多的个体；
● 在同等条件下，抽样误差要小于简单随机抽样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7
●
常用的随机抽样组织方式
► 简单随机抽样（Simple random sampling)
►分层随机抽样（Stratified sampling)
►系统随机抽样（Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法： ►重复抽样 (Sampling with replacement) ►不重复抽样（Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义：从总体中，按照随机的原则，使得总体中每个个体都有同等被选中的机会，而先后抽出的n个个体作为一个容量为n的样本。

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是，标准差是，从这个总体中抽出一个容量是 n 的样本，则样本平均数 X 也服从正态分布，其平均数 E( X ) 仍为，其标准
差为。 X 5-19
从正态分布的再生定理可以看出，只要总体变量服从正态分布，则从中抽取的样本，不管n 是多少，样本平均数都服从正态分布。但是在客观实际中，总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题，需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节抽样的基本概念与数学原理
一、有关抽样的基本概念二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
（一）样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明：尽管个别现象受偶然因素影响，有各自不同的表现。但是，对总体的大量观察后进行平均，就能使偶然因素的影响相互抵消，消除由个别偶然因素引起的极端性影响，从而使总体平均数稳定下来，反映出事物变化的一般规律。

管理统计学第5章

总体（累积）概率分布曲线F（x）不一定是连续的。例如，有限（累积）概率分布曲线F(x)是阶跃式的。
随着样本数 n 的增大，样本分布会越来越接近于总体分布。
5.1.4 格利文科定理
定理：设总体X的分布函数为F(x), 样本分布函数
Fn(x)，则对于任何实数x，有
n x
研究多指标时，就是多维随机变量，或称随机向量。

2. 总体（母体）

3. 总体分布（母体分布）
取直径为随机变量X，通常服从正态分布。这个分布，就称为 “生产线上生产出来的零件的直径”这个总体的分布。

5.1.2 随机样本与样本观察值（样本数据） 1. 随机样本
每个个体被抽取到的机会（概率）均等。

F (m, n)
x
5.2.3 由一般正态分布的随机样本构成的若干重要统计量的分布
例1 从总体 N ( 52，6.32 ) 中随机抽取
一容量为 36 的样本，求样本均值 X 落在
50.8 到 53.8 之间的概率。
X ~ N (0, 1) ，解：n 36, 52, 6.3 。由 / n

解：由题意可知， X1+X2+…+X9~N(0,9×16)，
1 2 2 1 ( Y ) ~ ( 16 ) 则 i Yi ~ N (0,1), i 1,2, ,16 i 1 3 3 X1 X 2 X 9 从而 2 2 2
Y1 Y2 Y16 1 ( X1 X 2 X 9 ) 3 4 ~ t (16) 16 1 2 ( Yi ) i 1 3 16
p 0.46 0.5 0.46 P( p 0.5) P( ) 0.0352 0.0352 P( Z 1.136) 1 P( Z 1.136) 1 (1.136 ） 0.128

SPSS第5章总体分布、样本分布与参数估计(修改)解读

X - 7 7.5 - 7 P( ) 2.2 2.2
X -7 令Y ，则： 2.2 P(Y 0.2273 )
其中Y ~ N (0,1),查表得 P(Y 0.2273 )?
标准正态分布表
φ ( - x ) = 1 –φ ( x )
x 0 0 0.500 0 0.01 0.504 0 0.02 0.508 0 0.03 0.512 0 0.04 0.516 0 0.05 0.519 9 0.06 0.523 9 0.07 0.527 9 0.08 0.531 9 0.09 0.535 9
X Y n
~ t(n )
其中，X ~ N(0，1)，Y ~2(n)分布，且X与Y相互独立。密度函数为：
n 1 ) 2 n 1 x 2 fn(x ) (1 ) 2 n n (n / 2) x
(

t 分布图
3、F 分布
F
U m V n
~ F (m ,n )
样本(累积)分布函数Fn(x)是对总体的累积分布函数F(x)的近似， n越大, Fn(x)对F(x)的近似越好。
格利文科 ( Glivenko )定理
当样本容量 n 趋于无穷大时，Fn(x)以概率1(关于 x )均匀地收敛于F(x).
P(lim sup
n x
Fn ( x) F ( x) 0) 1
Z X

~N(0， 1) ~2(n-1) ~t(n -1)
n
( n 1) S 2

T
2
X S n
(6)
1

2 ( X ) ~2(n) i 2 i 1
n
定理：若X1，X2，· · · , Xn1 和Y1，Y2，· · · , Yn2 分别是正态总体N(1， 12)和N(2， 22)的一个随机样本，且它们相互独立，则满足如下性质： (1)

曾五一《统计学导论》配套题库【章节题库】第五章抽样分布与参数估计【圣才出品】

12．样本均值的抽样标准差 x ，（）．
A．随着样本量的增大而变小 B．随着样本量的增大而变大
5 / 30
圣才电子书十万种考研考证电子书、题库视频学习平台

C．与样本量的大小无关
D．大于总体标准差
【答案】A
【解析】根据样本均值的抽样分布可知，样本均值抽样分布的标准差 x
D．服从 2 分布
【答案】B
【解析】当 n 比较大时，样本均值的抽样分布近似服从正态分布。题中 n 36 30 为
大样本，因此样本均值的抽样分布近似服从正态分布。
5．估计量的含义是指（）。 A．用来估计总体参数的统计量的名称
2 / 30
圣才电子书十万种考研考证电子书、题库视频学习平台

圣才电子书十万种考研考证电子书、题库视频学习平台

第五章抽样分布与参数估计
一、单项选择题 1．抽样分布是指（）。 A．一个样本各观测值的分布 B．总体中各观测值的分布 C．样本统计量的分布 D．样本数量的分布【答案】C 【解析】统计量是样本的函数，它是一个随机变量。样本统计量的分布称为抽样分布。
2．根据中心极限定理可知，当样本容量充分大时，样本均值的抽样分布服从正态分布，其分布的均值为（）。
A．
B． X C． 2
2 D．
n 【答案】A
【解析】根据中心极限定理，设从均值为，方差为 2 的任意一个总体中抽取样本量为 n 的样本，当 n 充分大时，样本均值的抽样分布近似服从均值为，方差为 2 n 的正
n
，样本
量越大，样本均值的抽样标准差就越小。
13．在用正态分布进行置信区间估计时，临界值 1.645 所对应的置信水平是（）。 A．85％ B．90％ C．95％ D．99％【答案】B 【解析】置信水平是指总体参数值落在样本统计值某一区内的概率；而置信区间是指在

卫生统计学七版第五章参数估计基础电子教案

P0.05
第三节总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区点间估估计计
对总体参数估计称的为范置围信区C间（ I ， co用 nfidenicneterv）al
表示，其置信1度）为，（一般取置95信 %，度即为取为0.05，此区
间的较小值称为限置，信较下大值称为限置。信一上般进行双区侧间的估计。
卫生统计学七版第五ຫໍສະໝຸດ 参数估计基础第一节抽样分布与抽样误差
一、样本均数的抽样分布与抽样误差
……
x15 .55 1 sx0.9617
样本均数的标准差越，大抽样误差就越大
样本均数的标准差称标为准误
x
n
sx
s n
sx称为标准误估计值，简也称标准误
标准误与标准差成正比，与样本含量成反比
标准误越大，抽样误差越大。
2、正态近似法
当已知时X： u
n
当未知但n足够大时X：u0.05
s n
X1.96 s n
或：X1.96s X
例5-3(P95) 某医生于2000年在某市随机抽取90名 19岁的健康男大学生，测量了他们的身高，得样本均数为172.2cm，标准差为4.5cm，试估计该市2000年19岁健康男性大学生平均身高的95%置信区间。
对任意分布，在样本含量足够大时，其样本均数的分布都近似正态分布，且样本均数的均数等于原分布的均数。
二、样本频率的抽样分布与抽样误差
总体率的标准误：
p
(1 )
n
率的标准误的估计值：
sp
p(1 p) n
标准误大抽样误差就大。
第二节 t分布
一、t分布的概念

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

七.样本单位的抽选方法
在组织抽样调查时，根据样本单位是否重复抽取，分别有重复抽样和不重复抽样两种方法。
1、重复抽样
重复抽样是指每次从总体中抽取一个单位进行观察后，再把这个单位重新放回总体，使之继续参加下次抽选。这种抽选法也称为放回抽样。
布。
在一定条件下，大量独立随机变量的平均数是以正态分布为极限的。
六、抽样组织的方式
1.简单随机抽样
简单随机抽样是一种对总体的每个单位（个体）都不加任何限制的抽样。在总体中不作任何分组、划类、排队等，完全随机地抽取调查单位。
它是抽样调查中最简单组织形式，又叫单纯随机抽样。
具体抽样时,可直接抽样,按号码签抽样,按随机数字表抽等
③样本标准差： s
(x x)2
n 1
s p(1 p) n 1
对于某一研究对象，当研究目的确定时，总体指标是确定的，
样本指标是不确定的。
（三）抽样框和抽样单元
抽样框：指供抽样所用的总体清单，是抽样的实际总体。包括具体的目录以及能够计数的全部抽样单位，而又不用把它们一一列出来。
抽样单元：把总体划分为有限个互不交叉而又内容完备的部分，每个部分称为一个抽样单元。
对于分层抽样: 层内是抽样调查 , 层间是全面调查
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。它是先将总体中各单位按一定的标志排队，然后每隔一定的距离抽取一个总体单位（个体）的抽样方式。
例如：从100人中抽取10人构成样本，先将100人排队编号，然后在1～10号之间随机抽取一个数字，比如抽到3，那么编号为 3，13，23，33，43，53，63，73，83，93的10个人组成样本。
具体排队时又分
按无关标志排队按有关标志排队
5.多阶段随机抽样
多阶段随机抽样是将一次抽样后得到的样本当作总体再次进行随机抽样，得到第二次抽样样本，然后再如此进行下去的抽样方式。
例如：我国农产量调查就采用五阶段抽样方式。省抽县、县抽乡、乡抽村、村抽地块、地块抽样本点，对样本点进行实割实测的调查方法。
对于某一研究对象，当研究目的确定时，全及总体是确定的，样本总体是不确定的。
（二）总体指标与样本指标
1、总体指标：根据总体中各单位的标志值计算出来的用于反
映总体的数量特征的指标。又称为全及指标或母体参数。
①总体平均数（总体均值）：
N
Xi
X i1 N
②总体成数：
P N1 N
N1 —总体中具有某种
总体
样本均值
样本
样本方差
抽样分布
二、抽样调查的分类
❖ 随机抽样：按照随机原则，完全排除了人为的主观因素，总体中每个单位都有一定的概率被选入样本。
❖ 非随机抽样：从方便出发或者根据研究者主观的判断来抽取样本，不遵循随机原则。无法估计和控制抽样误差，无法用样本的数量特征来推断总体。（方便抽样、配额抽样、不等概率PPS抽样等）
本章主要讨论随机抽样的原理和方法
三、抽样调查的特点
➢ 按照随机原则抽取样本，完全排除了主观因素的影响，样本对总体具有代表性。
➢ 可节省人力、物力和财力，提高时效。 ➢ 可以通过分析样本的特性，估计和推断被调查总
体的数量特征。 ➢ 抽样误差可以事先计算并加以控制，抽样调查具
有一定的精确性和可靠性。
四、抽样调查的应用
对一些社会现象不可能或不必要进行全面调查时，一种是被调查总体包含有无穷多个单位，第二种是对破坏性和消耗性产品的检验（如：家用电器检验、食品卫生检验等）。
企业产品质量的管理。对一些时效性较强但有来不及采取全面调查的。可以对大规模的全面调查进行检验，以修正资料。
五、抽样推断中的理论依据
各层抽样比例相同
标志变动度大的组多抽标志变动度小的组少抽
3.整群随机抽样
整群随机抽样是先将总体按某一标志分成若干组，每一组称为一个群，以群为单位进行简单随机抽样，然后对抽到的群进行全面调查的抽样方式。
例如：了解某地区职工家庭生活状况时，按居委会分群，然后对抽到的群（居委会）中,所辖每户职工家庭进行调查登记。
另外还有二重抽样法、比估计法、回归估计等
七、抽样调查中的几个基本概念
（一）全及总体与样本总体
1.全及总体是指根据调查目的所确定的研究对象全体.简称为总体.常用 N 表示总体单位数。 2.样本总体是指根据随机原则从总体中抽取一部分单位所组成的整体.常用 n 表示样本单位数（样本容量）。
一般 n 30 时，称为大样本；n 30 时，称为小样本
2.分层随机抽样
分层随机抽样又称为类型随机抽样或分类随机抽样。它是按照某一标志先将总体分成若干组（类），其中每一组称为一层，然后在每一层内按照简单随机抽样方式进行抽样的抽样方式。
例如：将工业企业划分为冶金、电力、石油化工、煤炭、机械、电子等部门，每个部门中进行抽样调查。
进一步细分
类型比例抽样类型适宜抽样
1、大数定律（切贝雪夫大数定律）
设 X1, X2, , Xn 是一列两两相互独的数学期望和方差 2 ,则对于
任意小的正数 0 ，有：
lim P（ X ） 1
n
n
对于抽样推断：随着样本容量 n 的增加，样本平均
数将接近于总体平均数。
❖ 2、中心极限定理：设从均值为，方差为 2的一个任意总体中抽取容量为n的样本，当n充分大时，样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分
特性个体数目
③总体标准差：
(X X )2
N
P(1 P)
针对数量标志
针对是否标志
2、样本指标：根据样本中各单位的标志值计算出来的用于反
映样本数量特征的指标称为样本指标，也称样本参数。
①样本平均数（样本均值）：
n
xi
x i1 n
②样本成数：
p n1 n
n1 —样本中具有某种特性个体数目
第五章抽样分布与参数估计
本章主要内容
❖ 一、抽样调查概述 ❖ 二、抽样推断的原理 ❖ 三、抽样分布与误差 ❖ 四、必要样本容量的确定
第一节抽样调查概述
一、抽样调查的意义
按照一定的程序,从总体中抽取一部分单位进行调查，根据样本资料的估计值，对总体待估参数做出具有一定可靠程度的估计和推断，以反映总体的数量特征或数量表现。

第五章 抽样分布与参数估计

抽样分布与参数估计

曾五一《统计学导论》(第2版)配套题库【课后习题】第五章 抽样分布与参数估计 【圣才出品】