统计学第六章抽样调查

合集下载

统计学第六章抽样调查

Part
05
系统抽样技术
系统抽样原理及步骤
• 系统抽样原理：系统抽样是一种等距抽样方法，它首先确定一个抽样间隔，然后在总体中按照这个间隔进行抽样。这种方法适用于总体单位排列有序且周期性变化的情况。
系统抽样原理及步骤
01
系统抽样步骤
02
确定总体范围和抽样框；
03
计算抽样间隔，确定样本量；
系统抽样原理及步骤
01
03 02
分层标准选择与确定方法
• 以调查对象的某些自然特征或社会特征作为分层标准。
分层标准选择与确定方法
专家判断法
依靠专家经验判断选择合适的分层标准。
数据分析法
通过对历史数据或相关数据的分析，找出影响调查指标的主要因素，作为分层标准。
试验法
通过试验确定不同分层标准对调查结果的影响程度，选择最优的分层标准。
缺点
由于样本可能被重复抽取，导致样本的代表性降低。
缺点
操作相对复杂，需要记录已经抽取过的样本。
简单随机抽样优缺点分析
操作简单
简单随机抽样的操作过程相对简单，易于理解和实施。
等概率原则
保证了每个单位被抽中的机会相等，避免具有代表性：当样本量足够大时，简单随机抽样可以获得具有代表性的样本。
整群抽样优缺点比较
• 适用于某些特定情况：对于某些总体分布不均匀或难以划分的情况，整群抽样可能更为适用。
整群抽样优缺点比较
抽样误差较大
01
由于是以群为单位进行抽样，可能导致抽样误差较大。
样本代表性不足
02
如果群的划分不合理或随机性不足，可能导致样本代表性不足。
对群内个体差异考虑不足
03

统计学第六章抽样推断

尖山一委…
尖山二委
居民一组
居民二
组
…
第六章抽样推断
某外国公司在##进行微波炉市场调查：
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章抽样推断
连续出产的产品总体可以编制抽样框：均STAT 匀的出产时间、可以预见到的产品总量.
连续到加油站加油的汽车总体无法编制抽样框：时间不定、总量也无法确定.
抽样估计的特点
第六章抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章抽样推断
不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目：
C N n N N 1 N n 1
第六章抽样推断
第六章抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数：
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差：
第六章抽样推断

统计学原理-第六章抽样调查(复旦大学第六版)

全体。其单位数用N来表示。
2．样本总体：简称样本，是从全及总体中随机
抽取出来，代表全及总体部分单位的集合体。单位数用n表示。
5
二．全及指标和抽样指标
（一）全及指标
X 总体平均数： X N 总体成数：P
2
XF 或X F Q＝
2 2
N1 N N
（X－X）总体方差：＝总体标准差：＝（X－X）
（一）考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
（二）考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
（三）不考虑顺序的不重复抽样数目
Ex X
28

2、一致性当抽样单位数充分大时，抽样指标和未知的总体指标之间的绝对离差为任意小的可能性也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标，要求作为优良估计量方差应该比其他估计量的方差小。

2
x X f
2
f

2
x X f
x
x E ( x)
2
18
说明：根据数理统计理论，在重复抽样条件下，抽样平均误差与全及总体的标准差成正比例关系。与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下，抽样平均误差计算公式如下：
x x

N n 250 4－2 ( )＝（）＝9.13(件) n N 1 2 4－1
2
N
X X F 或 F X X F 或 F

统计学第 6 章抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的，或是可以计算出来的当用样本对总体目标量进行估计时，要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本，每个单位入抽样本的概率是相等的最基本的抽样方法，是其它抽样方法的基础特点简单、直观，在抽样框完整时，可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时，不易构造抽样框抽出的单位很分散，给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近，从而提高估计的精度组织实施调查方便既可以对总体参数进行估计，也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列，在规定的范闱内随机地抽取一个单位作为初始单位，然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位，以后依次取r+k,r+2k…等单位优点：操作简便，可提高估计的精度缺点：对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群)，抽样时直接抽取群，然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框，可简化工作量调查的地点相对集中，节省调查费用，方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时，样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布，即把某种样本统计量看作一个随机变量，这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值，样本比例，样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值，样本比例，样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息，是进行推断的理论基础，也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布，也不是样本分布，是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布（例题分析）【例】设一个总体，含有4个元素（个体），即总体单位数N=4。

统计学第六章抽样法

31
第六章抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
－
x
x E(x)
总体
研究如何利用样本数据来推断总体特征。
内容包括：参数估计和假设检验。
目的：对总体
特征作出推
样本
断。
这是推断统计学研究的问题
5
第六章抽样法
描述统计与推断统计的关系
反映客观现象的数
据
概率论
（包括分布理论、大数定律和中心极限定
理等）
样本数
描述统计
推断统计
据
总体数据
（统计数据的搜集、整理、显示和分
13
第六章抽样法
第二节有关抽样的基本概念（2）
（二）抽样总体
也称子样，样本或样本总体，它是从全及总体中随机抽取出来的，代表全及总体的那部分单位的集合体。抽样总体的单位数称为样本容量，用n表示，对于N来说，n是很小的。
总体
样本
14
第六章抽样法
第二节有关抽样的基本概念（3）
• 二全及指标和抽样指标p.249 （一）全及指标
研究总体中的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章抽样法
第二节有关抽样的基本概念（5）
（二）抽样指标
抽样指标是由样本总体各单位标志值或标志特征计算的综合指标，也称统计量。与全及指标相对应有：样本平均数，样本标准差；样本成数，样本成数的标准差。

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题： ▪ 1、总体和总体参数； ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
（1）总体：指根据研究目的确定的所要研究的同类事物的全体，是所要说明其数量特征的研究对象。按所研究标志性质不同，分为变量总体和属性总体，分别研究总体的数量特征和品质特征。构成总体的个别事物（基本单元）就是总体单位，也称个体。总体单位的总数称为总体容量，记作N。
缺点：受主观影响易产生倾向性误差；不能计算、控制误差，无法说明调查结果的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
（1）重复抽样：又称重置抽样，是指从总体中抽出一个样本单位，记录其标志值后，又将其放回总体中继续参加下一轮单位的抽取。特点是：第一，n个单位的样本是由n次试验的结果构成的。第二，每次试验是独立的，即其试验的结果与前次、后次的结果无关。第三，每次试验是在相同条件下进行的，每个单位在多次试验中选中的机会(概率)是相同的。在重复试验中，样本可能的个数是 N n ，N为总体单位数，n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
（2）非重复抽样：又称为不重置抽样，即每次从
总体抽取一个单位，登记后不放回原总体，不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是：第一，n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分布
第六章抽样与抽样分布

胡德华版统计学第六章

6.2.2 机械抽样
机械抽样又称等距抽样或系统抽样，机械抽样又称等距抽样或系统抽样，就是将总体的各单位按某一标志的大小进行排队，用总体单位数除以样本单位数求得抽样间隔，志的大小进行排队，用总体单位数除以样本单位数求得抽样间隔，然后按照相同的间隔等距抽取样本的一种抽样方式。按照相同的间隔等距抽取样本的一种抽样方式。根据总体单位排列方法，等距抽样可分为两类：根据总体单位排列方法，等距抽样可分为两类：一是按有关标志排二是按无关标志排队。队；二是按无关标志排队。所谓有关标志就是指与调查问题直接相关的标志。所谓有关标志就是指与调查问题直接相关的标志。采用等距抽样法，主要应解决以下两个问题：采用等距抽样法，主要应解决以下两个问题：一是要计算抽样间隔，代表抽样间隔，代表总体单位数代表总体单位数，代一是要计算抽样间隔，若K代表抽样间隔，N代表总体单位数，n代代表抽样间隔表抽取的样本单位数，表抽取的样本单位数，则K=N / n 。二是要确定起点样本，即第一个样本。二是要确定起点样本，即第一个样本。通常的方法可采取在第一组 1-K个样本单位中随机抽取的方法，也可以在第一组个样本单位中随机抽取的方法，个样本单位中随机抽取的方法也可以在第一组1-K个样本单位中采个样本单位中采用取中间值的方法，然后，每隔K个单位抽取一个样本个单位抽取一个样本，用取中间值的方法，然后，每隔个单位抽取一个样本，直到抽够样本为止。为止。等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分，等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分，因而使样本具有更高的代表性，减少了抽样误差；因而使样本具有更高的代表性，减少了抽样误差；采用机械顺序抽取样简单易行，便于操作。但是，在应用等距抽样方法时，本，简单易行，便于操作。但是，在应用等距抽样方法时，要注意抽样间隔与现象本身所具有的规律不能重叠，否则，会加大抽样误差。间隔与现象本身所具有的规律不能重叠，否则，会加大抽样误差。等距随机抽样方法比较适合于同质性较高的总体。等距随机抽样方法比较适合于同质性较高的总体。

经济应用统计学-第六章抽样推断

非参数检验优缺点总结
• 易于理解和实现：非参数检验方法通常基于直观和易于理解的思想，计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比，非参数检验方法的检验效能通常较低，即当原假设为真时，非参数检验方法更容易犯第二类错误（接受原假设）。
对数据信息的利用不充分
非参数检验方法通常只利用数据的部分信息（如排序信息），而忽略了数据的其他有用信息（如数值大小），因此可能无法充分利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验等方法，用于比较同一总体内两个配对样本的差异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法，用于比较两个独立样本所来自的总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时，应充分考虑样本量的大小。当样本量较小时，应选择较低的置信水平以避免过大的估计误差；当样本量较大时，可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时，可以参考相关领域的文献或行业标准，了解通常采用的置信水平及其依据。这有助于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的假设，而备择假设则是研究者希望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出的用于检验原假设的统计量，而拒绝域则是根据显著性水平和检验统计量的分布确定的，当检验统计量落入拒绝域时，我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时，即备择假设只可能大于或小于原假设时，应选择单侧检验。例如，在比较两种药物疗效的研究中，如果研究者预期新药疗效优于旧药，则应选择单侧检验。

统计学课件第六章抽样调查PPT课件

特点
每个样本被选中的机会都相等，样本的代表性相对较好。
分层抽样
定义
先将总体按一定标准分成若干层次或群，然后从各层或群中按随机原则抽取样本。
方法
分类抽样、比例抽样、类型抽样。
特点
能够提高样本的代表性，降低误差，减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列，然后按照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术，如分层抽样、系统抽样等，以提高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差，如无回答、不完整数据等，以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图，为后续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式，以提高问卷的易用性和回答率。
确定调查方式
选择合适的调查方式，如自填式、面访式等，并确定数据收集的途径。
测试与修正
对问卷进行测试和修正，确保问卷的准确性和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训，确保他们了解调查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组，然后从每个群集或组中抽取一定数量的样本，也称为簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者进行调查，了解市场需求、消费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员进行调查，了解社会现象、人口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课件

统计学抽样调查

引言
简要介绍调查的目的、背景和意义。
结果
详细呈现调查结果，包括图表、数据和解释。
结论
总结调查的主要发现，提出建议和展望。
报告的撰写技巧
语言简练准确
使用简洁明了的语言，避免专业术语过多。
数据可视化
利用图表、图像等形式展示数据，提高可读性。
逻辑清晰
按照逻辑顺序组织内容，使读者易于理解。
客观公正
对不同因素对总体变异的影响进行分析，判断因素之间的交互作用。
方差分析应用
结果解释与结论
举例说明方差分析在实践中的应用，如实验设计、市场调研等。
解释方差分析的结果，得出结论并提出相应的建议。
05
抽样调查报告的撰写
报告的结构与内容
方法
描述抽样方法、样本规模、调查工具和数据分析方法。
讨论
对结果进行解释和讨论，探讨可能的原因和影响。
统计学抽样调查
汇报人： 202X-01-04
目录
• 抽样调查的基本概念 • 抽样调查的设计与实施 • 抽样调查的误差控制 • 抽样调查的数据分析 • 抽样调查报告的撰写
01
抽样调查的基本概念
定义与特点
定义
抽样调查是一种统计学方法，通过对总体中的一部分进行调查，来推断总体的特征和规律。
特点
抽样调查具有经济性、高效性和代表性，能够以较小的样本量来推算总体的数据，节省资源和时间。
避免主观臆断，以客观事实为基础进行分析。
报告的审核与发布
审核
由专家或同行对报告进行审核，确保数据的准确性和分析的可靠性。
发布
选择合适的发布渠道，如学术期刊、政府机构或企业报告等。
反馈

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

n
N
例题2
xf
x
f
8400 200
42
s (x x)2 f 12200 7.81
f
200
2 (1 n ) 7.812 (1 200 ) 0.55
x
n
N
200
2000
例题3
❖某冷库的10万只冻鸡合格率为97%，如果按重复抽样与不重复抽样各抽取1000只和2000只，分别计算抽样平均误差。
A
B
较小的样本容量
X
成数
❖ 总体成数
每个总体单位标志值设为0或1 1：具有某种属性的总体单位标志值 0：不具有某种属性的总体单位标志值总体中具有某种特征的单位占全部总体单位
数的比例称为总体成数，记作P 成数总体方差：P(1-P)
总体成数和样本成数
❖ 样本成数
从成数总体中抽取样本容量为n的样本样本中具有此种特征的单位占全部样本单位
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
16
1、1 2、1 3、1 4、1
1、2 2、2 3、2 4、2
1、3 2、3 3、3 4、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样考虑顺序 12
2、1 3、1 4、1
1、2
3、2 4、2
1、3 2、3
- 2.58x
-1.65 x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
区间估计
❖ 根据一个样本的观察值给出总体参数的估计范围 ❖ 给出总体参数落在这一区间的概率 ❖ 例如: 总体均值落在50~70之间，置信度为 95%
置信区间
样本统计量 (点估计)
解：已知 x＝26, =6，n=100, 1- =
0.95，Ｚ/2=1.96
x Z 2
n , x Z 2
n
26 1.96
6 ,26 1.96 100
6 100
24.824,27.176
结论：我们可以95％的概率保证平均每天参加锻炼的时间在24.824～27.176 分钟之间
成数的区间估计 p tu p
总体参数和样本统计量符号
总体参数
总体容量： N 总体平均数：
总体成数： P 总体方差： 2 总体标准差：
样本统计量
样本容量： n 样本平均数： x
样本成数： p 样本方差： S 2 样本标准差： S
抽样调查的基本概念
❖ 概率抽样与非概率抽样
概率抽样:又称随机抽样，是按随机原则抽取样本单位。本章所指的均为概率抽样。
置信下限
置信上限
区间估计
设总体参数为，由样本确定的两个统计量，
对于给定的，有
P(1 2 ) 1
则称 (1,2 )为参数的置信度为 1 的置信区间，该区间的两个端点 1,2 分别称为置信
下限和置信上限，统称为置信限。为显著
性水平，1 则称为置信度。
置信水平
❖ 总体未知参数落在区间内的概率,表示为 (1 -
简单随机抽样调查
❖ 简单随机抽样
从总体单位中不加任何分组、排队，完全随机地抽取调查单位。
❖ 评价：
简单易行，最符合随机原则，是抽样调查的基本形式
❖ 适用情况：
当总体单位数不多且分布比较均匀，或总体单位之间数量特征值差异较小，或总体单位有现成的编号时，采用这种方式比较适宜。
简单随机抽样调查
抽样调查
❖ 抽样调查的特点
遵守随机原则：无人为因素、公正、公平
用抽样指标推断总体的指标：方便、快捷、节约费用
抽样误差可以事先计算并加以控制准确、能够满足调查目的的要求
抽样调查的适用范围
实际工作不可能进行全面调查观察，而又需要了解其全面资料的事物；
虽可进行全面调查观察，但比较困难或并不必要；
❖ 区间估计
点估计
❖ 从总体中抽取一个样本，根据该样本的统计量对总体的未知参数作出一个数值点的估计
▪ 例如: 用样本均值作为总体未知均值的估计值就是一个点估计
❖ 点估计没有给出估计值接近总体未知参数程度的信息
点估计
❖ 常用的点估计量有：
❖
落在总体均值某一区间内的样本
x = Zx
x_
抽样极限误差
❖ 样本平均数的抽样极限误差：以绝对值形式表示的样本平均数的抽样误差的可能范围，用符号表示为：
x x
即：
x
x
x
抽样极限/允许误差
❖ 样本成数的抽样极限误差：以绝对值形式表示的样本比例的抽样误差的可能范围，用符号表示为：
p P p
即：
Pp p Pp
❖ 点估计
抽样估计
对普查或全面调查统计资料的质量进行检查和修正；
抽样方法适用于对大量现象的观察，即组成事物总体的单位数量较多的情况
利用抽样推断的方法，可以对于某种总体的假设进行检验，判断这种假设的真伪，以决定取舍。
抽样的基本概念
❖ 抽样涉及的基本概念有：
总体与样本(见第一章) 总体参数与样本统计量重复抽样与不重复抽样
，试建立该种零件平均长度的置信区间，给定置信水平为0.95。
❖ 解：已知x ~N(，0.152)，x＝2.14, n=9, 1 = 0.95，Ｚ/2=1.96，总体均值的置信区
间为
x Z 2
n
,
x
Z
2
n
21.4
1.96
0.15 9
,21.4
1.96
0.15 9
21.302,21.498
❖ 通常有以下四种组织形式：
直接抽选法
总体单位不编号，不编制抽样框
抽签法
对总体所有单位进行编号，且签需外形一致
随机数表法
总体所有单位编号，使用随机数表抽样
计算机模拟法
将随机数字编程
简单随机抽样
❖ 总体和样本的平均数
❖ 总体和样本的方差和标准差
有偏(n>30) 无偏(n≤30)
❖ 数理统计表明：
结论：我们可以95％的概率保证该种零件的平均长度在 21.302～21.498 mm之间
总体均值的区间估计
（非正态总体：实例）
【例】某大学从该校学生中随机抽取100 人，调查到他们平均每天参加体育锻炼的时间为26分钟。试以95％的置信水平估计该大学全体学生平均每天参加体育锻炼的时间（已知总体方差为36小时）。
有偏
A
C
X
估计量的优良性准则——有效性
有效性：一个方差较小的无偏估计量称为一个更
有效的估计量。如，与其他估计量相比，样本均值是一个更有效的估计量
P(X )
均值的抽样分布
B
中位数的抽样分布
A
X
估计量的优良性准则——一致性
❖ 一致性：随着样本容量的增大，估计量越来越接
近被估计的总体参数
P(X )
较大的样本容量
x
1 n
n i 1
xi
n1 n
p
成数是一种特殊的平均数
总体中具有某个属性的单位占全体单位的比重
样本成数p是总体成数P的无偏、一致、有效估计量
样本成数的无偏方差是成数总体方差的无偏估计量
例题1
❖某市有140 000户，从中随机抽取40 户，每户家庭人口数如P243表9-2，试用这一样本资料估计全市每户平均人口数，3人家庭在全市户数中所占的比例和标准差
❖ 这些概念是统计学特有的，体现了统计学的基本思想与方法。
抽样调查的基本概念
❖ 总体：由被调查对象的全部单位所构成的集
合体总体单位数用N表示。
❖ 抽样总体：抽取出来调查观察的单位。
抽样总体的单位数用n表示。 n ≥ 30 大样本 n < 30 小样本
抽样估计的概念和特征
❖抽样估计：在抽样调查的基础上，利用样本的数据资料计算样本指标，以样本特征值对总体特征值做出具有一定可靠程度的估计和判断。
数的比例称为样本成数，记作p p=n1/n
样本成数
❖ 样本成数的方差
样本成数的无偏方差（n<=30）
s
2 p
n n 1
p(1
p)
样本成数的有偏方差(n>30)
s02p p(1 p)
❖ 样本成数的标准差
样本成数
❖ 样本成数的性质
❖ x1,x2……xn的各标志值中有n1个值为1，有n0个
值为0，所以：
4、3
1、4 2、4 3、4
从1、2 、3、4中随机抽取2个的样本数
重复抽样不考虑顺序 10
1、1
1、2 2、2
1、3 2、3 3、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样不考虑顺序
1、2
1、3 2、3
6
1、4 2、4 3、4
抽样调查的组织形式
❖ 简单随机抽样 ❖ 类型随机抽样 ❖ 等距抽样 ❖ 整群抽样
pˆ －tu p ≤P ≤ pˆ + tu p
成数的置信区间
❖ 假定条件两类结果总体服从二项分布可以由正态分布来近似
为显著性水平，是总体参数未在区间内的概率
❖ 常用的置信水平值有 99%, 95%, 90%, 相应的为0.01，0.05，0.10
区间与置信水平
均值的抽样分布
x
/2
1-
/2
X
x
(1 - ) % 区间包含了 % 的区间未包含
总体均值的置信区间 (２已知)

统计学第六章抽样调查