第六章-抽样调查
自考-市场调查与预测-第6章-抽样方法

1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…
2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名
B 平均值估计 C 百分比估计样本容量
根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4
其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息
–
例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法
6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样
1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法
统计学第六章抽样调查

Part
05
系统抽样技术
系统抽样原理及步骤
• 系统抽样原理:系统抽样是一种等距抽样方法,它首先确定一个抽样间隔,然后在总体中按照这个间隔进行抽 样。这种方法适用于总体单位排列有序且周期性变化的情况。
系统抽样原理及步骤
01
系统抽样步骤
02
确定总体范围和抽样框;
03
计算抽样间隔,确定样本量;
系统抽样原理及步骤
01
03 02
分层标准选择与确定方法
• 以调查对象的某些自然特征或社会特征作 为分层标准。
分层标准选择与确定方法
专家判断法
依靠专家经验判断选择合 适的分层标准。
数据分析法
通过对历史数据或相关数据的 分析,找出影响调查指标的主 要因素,作为分层标准。
试验法
通过试验确定不同分层标准 对调查结果的影响程度,选 择最优的分层标准。
缺点
由于样本可能被重复抽取,导致样本的代表性降 低。
缺点
操作相对复杂,需要记录已经抽取过的样本。
简单随机抽样优缺点分析
操作简单
简单随机抽样的操作过程相对简单,易于理解和实施。
等概率原则
保证了每个单位被抽中的机会相等,避免 具有代表性:当样本量足够大时,简单随机抽样可以获得具有代表性的样本。
整群抽样优缺点比较
• 适用于某些特定情况:对于某些总体分布不均匀或难以划分的情况,整群抽样 可能更为适用。
整群抽样优缺点比较
抽样误差较大
01
由于是以群为单位进行抽样,可能导致抽样误差较大。
样本代表性不足
02
如果群的划分不合理或随机性不足,可能导致样本代表性不足。
对群内个体差异考虑不足
03
市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。
第六章抽样调查习题答案

第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、C 13、B 14、 A 15、A16、 B 17、 B 18、D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、CD2、AE3、BCD4、ABDE5、ABD6、AB7、ABCD8、AC9、ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、×12、√13、√14、×15、×16、√17、√18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三7、大样本、小样本8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。
差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。
在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。
抽样方法不同,抽样误差也不相同。
一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。
抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
(1)只抽取总体中的一部分单位进行调查。
(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
统计学原理-第六章 抽样调查(复旦大学第六版)

2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
第六章抽样调查练习及答案

第 六章 抽样调查一、填空题1.抽选样本单位时要遵守 原则,使样本单位被抽中的机会 。
2.常用的总体指标有 、 、 。
3.在抽样估计中,样本指标又称为 量,总体指标又称为 。
4.全及总体标志变异程度越大,抽样误差就 ;全及总体标志变异程度越小,抽样误差 。
5.抽样估计的方法有 和 两种。
6.整群抽样是对被抽中群内的 进行 的抽样组织方式。
7.误差分为 和代表性误差;代表性误差分为________和偏差;偏差是____________________________,也称为________________。
8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下: ;不重复抽样条件下: 。
9.误差范围△,概率度t 和抽样平均误差μ之间的关系表达式为 。
10.抽样调查的组织形式有: 。
二、单项选择题1.所谓大样本是指样本单位数在( )及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.是非标志方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.总体平均数和样本平均数之间的关系是( )A 总体平均数是确定值,样本平均数是随机变量B 总体平均数是随机变量,样本平均数是确定值C两者都是随机变量 D两者都是确定值6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。
A 95.45%B 99.7396C 68.27%D 90%7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( )A 扩大为原来的3倍B 扩大为原来的2/3倍C 扩大为原来的4/9倍D 扩大为原来的2.25倍8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50%一等品产品比重的抽样平均误差为 ( )A 甲企业大B 两企业相同C 乙企业大D 无法判断9.是非标志的平均数是( )A -P)1P(B P(1-P)C pD (1-P)210.重复抽样的误差一定( )不重复抽样的误差。
第六章 抽样调查
第六章抽样调查第一节抽样调查的意义及全然概念一、抽样调查的意义抽样调查(随机抽样):按照随机原那么从总体中抽取一局部单位进行瞧瞧,并运用数理统计的原理,以被抽取的那局部单位的数量特征为代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必定选择,和普查相比,它具有正确度高、本钞票低、速度快、应用面广等优点。
一般适用于以下范围:1.实际工作不可能进行全面调查瞧瞧,而又需要了解其全面资料的事物;2.虽可进行全面调查瞧瞧,但比立困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的瞧瞧,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,能够关于某种总体的假设进行检验,判定这种假设的真伪,以决定取舍。
三、抽样调查的全然概念(一)全及总体和抽样总体(总体和样本)全及总体:所要调查瞧瞧的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查瞧瞧的单位。
抽样总体的单位数用n表示。
n≥30大样本n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。
抽样指标:抽样总体的那些指标。
第二节抽样调查的组织形式通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如:1.直截了当抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原那么抽取样本,组成一个总的样本。
类型的划分:一是必须有清楚的划类界限;二是必须明白各类中的单位数目和比例;三是分类型的数目不宜太多。
类型抽样的好处是:样本代表性高、抽样误差小、抽样调查本钞票较低。
要是抽样误差的要求相同的话那么抽样数目能够减少。
两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。
第六章抽样调查习题答案
第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、 C 13、 B 14、 A 15、A16、 B 17、 B 18、 D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、 CD2、 AE3、 BCD4、 ABDE5、ABD6、 AB7、 ABCD8、 AC9、 ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、× 12、√ 13、√ 14、×15、×16、√ 17、√ 18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三 7、大样本、小样本 8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。
差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。
在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。
抽样方法不同,抽样误差也不相同。
一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。
抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
(1)只抽取总体中的一部分单位进行调查。
(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
第六章 抽样调查
第六章 抽样调查一、单项选择题1.随机抽样的基本要求是严格遵守( )①准确性原则;②随机原则;③代表性原则;④可靠性原则。
2.抽样调查的主要目的是( )①广泛运用数学的方法; ②计算和控制抽样误差;③修正普查的资料; ④用样本指标来推算总体指标。
3.抽样总体单位亦可称( )①样本; ②单位样本数; ③样本单位; ④总体单位。
4.反映样本指标与总体指标之间抽样误差可能范围的指标是( )①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。
5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )①抽样单位数占总体单位数的比重很小时;②抽样单位数占总体单位数的比重很大时;③抽样单位数目很少时; ④抽样单位数目很多时。
6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大;②抽样单位数目越大,抽样误差越小;③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的21。
7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )①2倍; ②3倍; ③4倍; ④5倍。
8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( )①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。
9.全及总体按其各单位标志性质不同,可以分为( )①有限总体和无限总体; ②全及总体和抽样总体;③可列无限总体和不可列无限总体;④变量总体和属性总体。
10.抽样指标是( )①确定性变量; ②随机变量; ③连续变量; ④离散变量。
11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。
12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数;③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:
(1)
2
n
(1 )
12 2 (1
100
) 1.19(千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X x 400 2 1.19 397.62 ~ 402.38( 千克 ) x
2 N n
n N1
但实际中,往往N很大,n很小,故改用下列公式:
2
n
(1 )
x
nN
上例中,若为不重复抽样,则:
400 (1
100
) 1.99(小时)
x 100 10000
(二) 成数的抽样平均误差
已知:成数的方差为p(1-p)
在重复抽样情况下:
p (1 p )
第六章 抽样调查
第一节 抽样调查的意义 第二节 抽样调查的基本概念 第三节 抽样平均误差 第四节 全及指标的推断 第五节 抽样方案设计 第六节 必要抽样单位数的确定 第七节 假设检验
第一节 抽样调查的意义
一、抽样调查的概念 抽样调查是按随机原则,从全部研
究对象中抽取一部分单位进行观察,并 根据样本的实际数据,对总体的数量特 征做出具有一定可靠程度的估计和判断 其中心问题是如何根据已知的部分资料 来推断未知的总体情况。
(3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均 亩产量的可能范围为:
X 400 3 1.19 396.43 ~ 403.57( 千克 )
例2
某机械厂日产某种产品8000件,现采用纯 随机重复抽样方式,从中抽取400件进行观 察,其中有380件为一级品,试以概率 95.45%的可靠程度推断全部产品的一级品率 的范围。
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃杯,现 按重复抽样方式从中抽取150只进行质量检验,结 果有147只合格,其余3只为不合格品,试求这批印 花玻璃杯合格率(成数)的抽样平均误差。
N 15000 n 150
p 147 98% 150
样本平 均数 x
40 42 44 46 48 42 44 46 48 50
重置抽样分布--样本平均数的分布
样本平均数 x
34 36 38 40 42 44 46 48 50 合计
频数
1 2 3 4 5 4 3 2 1
25
E(x)xff 42(元)
2(x)(x X f)2f16(元 2)
调查来确定S,代替σ; 4. 用估计的方法。
抽样平均误差的影响因素:
1. 全及总体标志变异程度。——正比关系 2. 抽样单位数目的多少。 ——反比关系 3. 不同的抽样方式。 4. 不同的抽样组织形式。
随机抽样的抽样平均误差
(一) 平均数的抽样平均误差 重复抽样
x
n
或 2
x
n
例
二、抽样调查的特点
1.抽样调查是非全面调查。 2.抽样调查是用样本的指标数值去推算总体 的指标数值。 3.抽样调查是按随机原则抽选调查单位。 4.抽样调查中产生的抽样误差,可以事先计 算并加以控制。
第二节 抽样调查的基本概念
一、全及总体和抽样总体 二、抽样方法
1.重复抽样分布 2.不重复抽样分布
A B DC D E
A B EC D E
– 考虑顺序时:样本个数=Nn=52=25
– 不考虑顺序时:样本个数= CN nn-1((NN-1n)-!n1)!!
不重复抽样
• 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2
A
A
B
B
AC BC
D
D
C D
•
E
考虑顺序时:样本个数
m n
p
1
当试验次数n充分大时,可以用 频率代替概率。
大数定理的意义:个别现象受偶然因素影响,但是,对总体 的大量观察后进行平均,就能使偶然因素的影响相互抵消, 从而使总体平均数稳定下来,反映出事物变化的一般规律。
中心极限定理
中心极限定理:
1.独立同分布中心极限定理:
x
~
N
p
p(1 p) n
0.98(10.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n )
n
N
0.98(10.98) (1 150 ) 1.1374%
150
15000
抽样误差的作用
1. 在于说明样本指标的代表性大小。
误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。
2. 说明样本指标和总体指标相差的 一般范围。
第四节 全及指标的推断
一、优良估计
• 无偏性 • 一致性 • 有效性
二、点估计
• 点估计的含义:直接以样本指标作为相应 全及指标的估计量。
x X
p
P
S
2
2
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得
重复抽样:又称有放回抽样。
例
1 ,1 ,1 , LL
5000 5000 5000
不重复抽样:又称不放回抽样。
例
1 ,1 ,1 , LL
5000 4999 4998
重复抽样
• 例如从A、B、C、D、E五个字母中随机
抽取两个作为样本。N=5,n=2
A B AC D E
A B BC D E
A B CC D E
N
• 总体成数P是指具有某种特征的单位在总体中 的比重。成数是一种结构相对数,设总体单 位总数目是N,总体中有该特征的单位数是N1。 设x是0、1变量,则有:
P N1 N
样本成数
• 现从总体中抽出n个单位,如果其中有相应特 征的单位数是n1,则样本成数是:
p n1 n
• P也是一个随机变量,利用样本平均数的分布
性质结论,即有:
E(p) p
p
np 1 p
n-1
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数, 用n表示。
• 样本个数:又称样本可能数目,指从一 个总体中所可能抽取的样本的个数。对 于有限总体,样本个数可以计算出来。 样本个数的多少与抽样方法有关。
二、抽样方法
• 验证了以下两个结论:
E(x)X 2 ( x ) 2
n
• 抽样平均数的标准差 反映所有的样本平均 数与总体平均数的平 均误差,称为抽样平 均误差,用 表示。
x
x
n
取得σ的途径有:
1. 用过去全面调查或抽样调查的资料,若同时 有n个σ的资料,应选用数值较大的那个;
2. 用样本标准差S代替全及标准差σ; 3. 在大规模调查前,先搞个小规模的试验性的
解: 抽样一级品率:
注 抽样误差是由于抽样的随机性而产生的样本
指标与总体指标之间的平均离差。
按照定义:
x
(xX )2 K
重复抽样分布--样本平均数的分布
• 某班组5个工人的日工 资为34、38、42、46、 50元。
• = 42
• 2 = 32
• 现用重复抽样的方法 从5人中随机抽2个构 成样本。共有52=25个 样本。如右图。
X
, 2 n
2.德莫福-拉普拉斯中心极限定理:
X~Nnp,npq
大样本的平均数近似服从正态分布。
第三节 抽样平均误差
一、抽样误差的概念及其影响程度
在统计调查中,调查资料与实际情况不 一致,两者的偏离称为统计误差。
登记误差 统计误差代表性误差随 偏机 差误差实 抽际 样误 平差 均误差
• 全及指标:反映总体数量特征的指标。 其数值是唯一的、确定的。
• 抽样指标:根据样本分布计算的指标。 是随机变量。
全及指标和抽样指标
总体
样本
全及指标X、2Fra bibliotekP抽样指标
平均数
x
标准差、方差 S、 S2
成数
p
变量总体和属性总体
• 变量总体各单位标志值可用数量表示
X X
显著性水平,其取值大小由实际问题确定,经常取 1%、5%和10%。
参数估计的两个要求:
– 精度:估计误差的最大范围,通过极限 误差来反映。显然,Δ越小,估计的精度 要求越高,Δ越大,估计的精度要求越低。 极限误差的确定要以实际需要为基本标 准。
– 可靠性:估计正确性的一个概率保证, 通常称为估计的置信度。
x1
x1
x2
x2
x3
x3
x4
表示有(1)100%的
区间包含了X
x4
当F(t)=68.27%时,抽样极限误差等于抽样平均误差 的1倍(t=1); 当F(t)=95.45%时,抽样极限误差等于抽样平均误差 的2倍(t=2); 当F(t)=99.73%时,抽样极限误差等于抽样平均误差 的3倍(t=3);
到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X1002克 , 合 格 率 P 98% 。
三、全及指标估计概述
• 设待估计的全及指标是 X ,用以估计该
参数的统计量是 x ,抽样估计的极限误
差是 x ,即: