(04)第4章 抽样与抽样分布(袁卫)
(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
统计学04第四章抽样与抽样分布

1. 从总体中抽取样本容量相同的所有样 本 — 样本空间;
2. 计算每个样本的样本统计量的取值; 3. 根据样本统计量的所有取值计算相应
的概率; 4. 样本统计量的概率分布 — 抽样分布。
2020/3/2
第四章 抽样和抽样分布
18
3.2 重置抽样下的抽样分布
总体样变本量平的均分数布的:抽样分X 布 100元 2 200 某施工小组X5个员工的 1日0 2工元 资为80、X1 9X02 、X 3 1X040、X5 110、120
N
标准差: σ X X i E X 2 Pi i 1
2020/3/2
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望
率
N
论 EX X i Pi
i 1
方差
N
σ 2 X X i E X 2 Pi i 1
基本问题
❖ 抽样 ❖ 样本(样本点) ❖ 样本空间 ❖ 随机原则 ❖ 随机抽样 ❖ 重置抽样 ❖ 不重置抽样
2020/3/2
第四章 抽样和抽样分布
15
基本问题
样本点个数
设:总体单位数 N ,样本容量 n : 样本空间的样本点数为:
重置
不讲
重 顺序
置
不讲 顺序
ANn N n
PNn
N N
1
F x P X x P X X i Pi
Xi x
Xi x
概率分布函数的性质:
P x1 X x2 P X x2 P X x1
F x2 F x1
《统计学》(第四版)袁卫 课后答案

1.简述评价估计量好坏的标准
答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数 的估计量有 和 ,如果 ,称 是无偏估计量;如果 和 是无偏估计量,且 小于 ,那么 比 更有效;如果当样本容量 , ,那么 是相合估计量。
答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度,而区间的长度反映估计的精确度。
答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
4怎样理解均值在统计中的地位?
答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,
具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的根底地位。受极端数值的影响是其使用时存在的问题。
条形图〔略〕
2〔1〕采用等距分组:
n=40全距=152-88=64取组距为10
组数为64/10=6.4取6组
频数分布表如下:
40个企业按产品销售收入分组表
按销售收入分组
〔万元〕
企业数
〔个〕
频率
〔%〕
向上累积
向下累积
企业数
频率
企业数
频率
100以下
100~110
110~120
120~130
130~140
原因:尽管两个企业的单位本钱相同,但单位本钱较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均本钱。
11. = 〔万元〕;
4抽样与抽样分布

抽样方法-概率抽样
根据已知的概率选取样本 简单随机抽样:完全随机抽取样本; 分层抽样:总体分“层”,在每一层内进行抽样; 整群抽样:将总体划分为若干群,将一组被调查者
(群)作为一个抽样单位。(群内的个体存在差异, 理想情况是每个群都是总体的一个缩影) 等距抽样:在样本框中,每隔一定距离抽选一个被调 查者。
f (x)
1
(x)2
e , 2 2
2
x
记为 X ~ N (, 2 )
最常见的连续型随机变量的概率分布
标准正态分布: 0, 2 1
Z X
标准正态分布
标准正态分布的计算
(z) 1 (z)
( Z 1.645) 0.90
P(a Z b) (b) (a) ( Z 1.96) 0.95
本快速准确的预测选举,误差在2%之内。
抽样的基本概念
抽样调查,按照随机原则从全部研究对象中抽 取一部分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计与推断, 从而认识总体的一种统计方法。
随机原则:指样本单位的抽取不受主观因素及 其他系统性因素的影响,每个总体单位都有均 等的被抽中机会。
随机原则的实现
抽签法,是将总体中每个单位的编号写在外形 完全一致的签上,将其搅拌均匀,从中任意抽 选,签上的号码所对应的单位就是样本单位。
随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
计算机模拟法:是将随机数字编制为程序存储 在计算机中,需要时将总体中各单位编上号码, 启用随机数字发生器输出随机数字。
4 统计抽样与抽样分布
抽样的基本概念 抽样方法 抽样分布的概念 样本均值的抽样分布
抽样与抽样分布

属性总体
样本平均数
样本比例(样本成数)p
样本标准差s或方差s²
样本比例标准差sP或方差sP²
抽样方法
#O1
#2022
概率抽样 (probability sampling)
概率抽样也叫随机抽样,是指按随机原则抽取样本。 随机原则,就是排除主观意识的干扰,使总体每一个单位都有一定的概率被抽选为样本单位,每个单位能否入选是随机的。 特点 能有效地避免主观选样带来的倾向性误差(系统偏差),使样本资料能够用于估计和推断总体的数量特征,而且这种估计和推断得以建立在概率论和数理统计的科学理论之上 可以计算和控制抽样误差,说明估计的可靠程度。 作用: 在不可能或不必要进行全面调查时,利用概率抽样来推断总体; 利用概率抽样修正或补充全面调查的不足。
简单随机抽样 (用Excel对分类数据随机抽样)
第1步:将30个学生的名单录入到Excel工作表中的一列 第2步:给每个学生一个数字代码,分别为1,2…,30,并按顺序排列,将代码录入到Excel工作表中的一列,与学生名单相对应 第3步:选择【工具】下拉菜单,并选择【数据分析】选项, 然后在【数据分析】选项中选择【抽样】 第4步:在【抽样】对话框中的【输入区域】中输入学生代码区域,在【抽样方法】中单击【随机】 。在【样本数】中输入需要抽样的学生个数。在【输出区域】中选择抽样结果放置的区域。【确定】后即得到要抽取的样本
多阶段抽样 (multi-stage sampling)
先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查 群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样 具有整群抽样的优点,保证样本相对集中,节约调查费用 需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开 在大规模的抽样调查中,经常被采用的方法
统计学习题答案 第4章 抽样与抽样分布

第4章 抽样与抽样分布——练习题(全免)1.一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴给出x 的抽样分布(重复抽样)的均值和标准差⑵描述x 的抽样分布的形状。
你的回答依赖于样本容量吗?⑶计算标准正态z 统计量对应于5.15=x 的值。
⑷计算标准正态z 统计量对应于23=x 的值。
解:已知 n=64,为大样本,μ=20,σ=16,⑴在重复抽样情况下,x 的抽样分布的均值为a. 20, 2b. 近似正态c. -2.25d. 1.502 .参考练习4.1求概率。
⑴x <16;⑵x >23;⑶x >25;⑷.x 落在16和22之间;⑸x <14。
解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.00133.一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。
试求下列概率的近似值:解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.96994.一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。
⑴你预计x 的最大值和最小值是什么? ⑵你认为x 至多偏离μ多么远?⑶为了回答b 你必须要知道μ吗?请解释。
解:a. 101, 99 b. 1 c. 不必5.考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。
假设x 的取值的可能性是相同的。
则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。
对于每一个样本容量,构造x 的500个值的相对频率直方图。
当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。
解:趋向正态6.美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以与与汽车相关的各项服务。
1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。
应用统计学(第三版袁卫-庞皓-曾五一-贾俊平主编)各章节课后习题答案
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学第4章抽样与抽样分布
思考与练习
二、实验题 1.利用Excel的“抽样”工具或“RAND”函数,从本 班级的全体同学总体中抽出5名同学构成一个随机 样本。 2.假设一个总体共有8个数值:32,33,35,40, 41,43,46,50。从该总体中按重复抽样方式抽 取n = 2的随机样本。 要求:(1)计算出总体的平均数与标准差。 (2)一共有多少个可能的样本? (3)抽出所有可能的样本,并计算出每个样 本的平均数。 (4)计算所有样本平均数的平均数与标准差 ,并与总体的平均数与标准差进行比较,得到的 结论是什么?
E( p ) X p P
sp
2
P(1 P) n
p sp
n
P(1 P) n (1 ) n N
2.在不重复抽样条件下
E( p ) X p P
sp
2
P(1 P) N n P(1 P) n (1 ) n N 1 n N
p sp
本章小结
1.抽样的相关概念包括:总体、样本、参数、统计 量、样本容量、样本个数、抽样误差和非抽样误 差;基本的抽样方法是重复抽样和不重复抽样。 2.基本的抽样组织方式有以下几种:简单随机抽样 、等距抽样、类型抽样、整群抽样和多阶段抽样 等,这些组织方式各有其特点。 3.抽样分布就是样本统计量的概率分布。 4.常用的抽样分布有样本平均数的抽样分布和样本 比率 的抽样分布,两种分布又都可以分为重复抽 样和不重复抽样两种情况。 5.抽样分布在推断统计中具有重要作用,只有掌握 了统计量的抽样分布,才能进行参数估计和假设 检验。
思考与练习
3.利用Excel的“随机数发生器”工具产生100个服 从标准正态分布N(0,1)的数据,然后利用RAND 、INDEX和CEILING函数抽取20个样本容量n = 30 的样本,来验证样本平均数的抽样分布与总体分 布之间的关系。 三、实践题 如果总体容量为100,抽取样本容量为10的样本, 按重复抽样和不重复抽样的方法,样本可能数目 分别是多少?
第4章 抽样及抽样分布
有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的
2.
样本 (sample)
从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量
样本容量和大小样本
样本容量:一个样本所包含的总体基本单元数
n 30 的样本叫小样本 n 30 的样本叫大样本
第四章 抽样与抽样分布
第一节 抽样技术 第二节 正态分布及几个重要的统计分布 第三节 样本统计量的抽样分布
学习目标
1. 2.
3.
4.
5.
6. 7. 8.
掌握抽样技术中的基本概念 掌握简单随机抽样的做法和适用性 了解分层抽样、系统抽样、整群抽样、多阶段抽样和不 等概抽样等抽样技术的基本做法和适用性 了解正态分布、分布、卡方分布、分布等几个重要的统 计分布及其在统计推断中的意义 掌握样本均值、样本比例、样本方差的抽样分布 理解中心极限定理的含义及其在统计推断中的意义 掌握两个样本均值之差、两个样本比例之差、两个样本 方差之比的抽样分布 熟悉Excel中随机抽样的实现
n M CN
N! n ( !术
抽样方式
概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
概率抽样(probability sampling)
1.
2.
根据一个已知的概率来抽取样本单位, 也称随机抽样 特点
3.
4.
5.
标准正态分布
(standardize normal distribution)
1. 2.
随机变量具有均值为0,标准差为1的正态分布 任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布 X Z ~ N (0,1)
第4章抽样与抽样分布
精选可编辑ppt
4
4·整群抽样(cluster sampling)
•方法: 将总体全部单位分为许多个““群”,然 后随机抽取若干““群”,对被抽中的各““群 ”内的所有单位登记调查。
精选可编辑ppt
5
例:
总体群数R=16 样本群数r=4
样本容量
A D E
B F G
CM L
J K
H
N P
O
I
LP HD
•3、为了调查某大学大学生的购书费用支出情况,从全校抽 取4个班级的学生进行调查,这种调查方法是i()
•4、为了调查某大学大学生的购书费用支出情况,将全校学 生的名单按拼音顺序排序后,每隔50个人抽取1名进行调查 ,这种调查方法是()
精选可编辑ppt
8
抽样分布
抽样分布
单样本抽样分布
两个样本抽样分布
答案:B A
精选可编辑ppt
24
二、抽样分布-样本方差的抽样分布
例:第一个 2 分布的方差为10,第二个 2分布的方差为20,
则它们的和的分布是 () ,方差是()
A、服从 2 分布 B、近似正态分布 C、二项分布 D、 F 分布
A、10 B、20 C、30 D、 15
例:如果 2 分布的均值为32, 其标准差为()
E p 1 p 2 12
2 p 1p2
111 n 1
212 n2
精选可编辑ppt
30
三、两个统计样本的抽样分布(例题)
例:甲校中男生所占比例为60%,乙校中男生所占比例40% ,若果从甲校中随机抽取100名学生,从乙校中随机抽取100 名学生,则甲乙两校样本中男生比例之差的期望值为()
x 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无偏性:估计量抽样分布的数学期望等于被 无偏性: 估计的总体参数
ˆ P(θ )
无偏 有偏
A
B
4 - 28
θ
ˆ θ
统计学
STATISTICS
有效性
(efficiency) efficiency)
量,有更小标准差的估计量更有效
ˆ P(θ )
ˆ θ1 的抽样分布
有效性:对同一总体参数的两个无偏点估计 有效性:
概率抽样
(probability sampling) sampling)
1. 根据一个已知的概率来抽取样本
单位, 单位,也称随机抽样 2. 特点
•
按一定的概率以随机原则抽取样 本
抽取样本时使每个单位都有一定的机 会被抽中
每个单位被抽中的概率是已知的, 每个单位被抽中的概率是已知的 , 或是可以计算出来的 当用样本对总体目标量进行估计 时 , 要考虑到每个样本单位被抽 中的概率
µ = 2.5
σ2 =1.25
4 - 19
µx = 2.5 2 σ x = 0.625
统计学
STATISTICS
中心极限定理
统计学
STATISTICS
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N 当总体服从正态分布 N(µ,σ2) 时 , 来自该总体的所有 容量为n 的样本的均值 也服从正态分布, 容量为 n 的样本的均值 x也服从正态分布 , x 的数 学期望为µ 方差为σ 学期望为µ,方差为σ2/n。即x~N(µ,σ2/n)
4-5
统计学
STATISTICS
简单随机抽样
(simple random sampling) sampling)
1. 2. 3.
从总体N个单位中随机地抽取n个单位作为样本, 从总体N个单位中随机地抽取n个单位作为样本,使 得每一个容量为样本都有相同的机会(概率) 得每一个容量为样本都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样 特点
先从数字1 先从数字 1 到 k 之间随机抽取一个数字 r 作为 之间随机抽取一个数字r 初始单位,以后依次取r 初始单位,以后依次取r+k,r+2k…等单位
2. 优点:操作简便,可提高估计的精度 优点:操作简便, 3. 缺点:对估计量方差的群抽样
(cluster sampling) sampling)
1. 将总体中若干个单位合并为组(群),抽样时 将总体中若干个单位合并为组( ),抽样时
直接抽取群, 直接抽取群,然后对中选群中的所有单位 全部实施调查 2. 特点
抽样时只需群的抽样框, 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用, 调查的地点相对集中,节省调查费用,方便 调查的实施 缺点是估计的精度较差
4 - 25
统计学
STATISTICS
抽样分布与总体分布的关系
总体分布
正态分布
非正态分布
大样本 小样本
正态分布
4 - 26
正态分布
非正态分布
统计学
STATISTICS
4.3 抽样分布的性质
—无偏性与最小方差
统计学
STATISTICS
无偏性
(unbiasedness) unbiasedness)
4-7
统计学
STATISTICS
系统抽样
(systematic sampling) sampling)
1. 将总体中的所有单位 ( 抽样单位 ) 按一定顺 将总体中的所有单位( 抽样单位)
序排列, 序排列,在规定的范围内随机地抽取一个 单位作为初始单位, 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
样本均值的抽样分布
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x) 16个样本的均值( 个样本的均值 第一个 观察值 1 2 3 4 4 - 18 第二个观察值 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
4 - 22
µx = µ
x
统计学
STATISTICS
中心极限定理
(central limit theorem) theorem)
x 的分布趋 于正态分布 的过程
4 - 23
统计学
4 - 12
统计学
STATISTICS 总体
抽样分布的形成过程
(sampling distribution) distribution)
样 本
计算样本统计 量 如:样本均值 、比例、方差
4 - 13
统计学
STATISTICS
样本均值的抽样分布
统计学
STATISTICS
样本均值的抽样分布
1. 在重复选取容量为n的样本时,由样本均 在重复选取容量为n
STATISTICS
样本均值的抽样分布
(数学期望与方差) 数学期望与方差)
1. 样本均值的数学期望
E(x) = µ
2. 样本均值的方差
重复抽样
2 σx =
σ2
n
2 不重复抽样 σ x =
σ 2 N −n
n N −1
4 - 24
统计学
STATISTICS
样本均值的抽样分布
(数学期望与方差) 数学期望与方差)
值的所有可能取值形成的相对频数分布
2. 一种理论概率分布 3. 推断总体均值µ的理论基础
4 - 15
统计学
STATISTICS
样本均值的抽样分布
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
.3 .2 .1 0 1
4 - 16
均值和方差
µ=
∑x
i=1
N
i
N
N i=1
= 2.5
2
3
4
σ =
2
(xi − µ)2 ∑ N
= 1.25
统计学
STATISTICS
样本均值的抽样分布
(例题分析) 例题分析)
现从总体中抽取n 现从总体中抽取n=2的简单随机样本,在重复抽 的简单随机样本, 样条件下,共有4 16个样本。 样条件下,共有42=16个样本。所有样本的结果为
σ =10
n=4 σx = 5 n =16 σ x = 2.5
µ = 50
X
µx = 50
x
总体分布
4 - 21
抽样分布
统计学
STATISTICS
中心极限定理
(central limit theorem) theorem)
中心极限定理: 中心极限定理:设从均值为µ,方差为σ 2的一个任意总 体中抽取容量为n的样本, 体中抽取容量为n的样本,当n充分大时,样本均值的抽 充分大时, 样分布近似服从均值为µ 方差为σ 样分布近似服从均值为µ、方差为σ2/n的正态分布
i n
1.0 +1.5 +L+ 4.0 µx = = = 2.5 = µ M 16
i=1
n 2 σx =
∑x
i=1
(xi − µx )2 ∑
M (1.0 − 2.5)2 +L+ (4.0 − 2.5)2 σ2 = = 0.625 = 16 n
M为 本 样 数目
比较及结论: 样本均值的均值(数学期望) 比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n 样本均值的方差等于总体方差的1/n
4-9
统计学
STATISTICS
4.2 抽样分布与中心极限定理
一、抽样分布的概念 二、样本均值抽样分布的形式 三、样本均值抽样分布的特征 四、中心极限定理
统计学
STATISTICS
抽样分布的概念
统计学
STATISTICS
抽样分布
(sampling distribution) distribution)
0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 0.3 0.2 P(x)
样本均值的抽样分布
x
样本均值的分布与总体分布的比较 统计学 (例题分析) 例题分析) STATISTICS
总体分布
.3 P(x)
抽样分布
.3 .2 .1 0 1 2 3 4
.2 .1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
B A
ˆ θ2 的抽样分布
4 - 29
θ
ˆ θ
统计学
STATISTICS
本章小结
1. 了解抽样的概率抽样方法 2. 理解抽样分布的意义 3. 了解抽样分布的形成过程 4. 理解中心极限定理 5. 理解抽样分布的性质
4 - 30
统计学
STATISTICS
4.1 常用的抽样方法
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
统计学
STATISTICS
抽样方法
抽样方式
概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
4-4