统计学抽样极限误差与平均误差的关系及抽样方案的设计
统计学-抽样分布与抽样方法

保持不变,每一次抽样中各总体单位被抽到的机会 都相同,每次抽样结果相互独立。 ②每一总体单位都有被重复抽取的可能。
5.2 抽样调查的方法
一、两种抽样方式(续):
(2)不重复抽样 ——也称不放回抽样,指被抽到的单位不再放回总
体,每次仅在余下的总体单位中抽取下一个样本的 抽样方法。 特点: ①任一总体单位都不会被重复抽到; ②每次抽样结果都受到以前各次抽取结果的影响,因 此各次抽取结果是不独立的; ③可以一次抽取所需要的样本单位数。 ❖ 在实际应用中通常采用的都是不重复抽样方法。
总体
群1
群2
…… 群k
个体1 个体2 个体3 个体4 个体5 个体6
5.2 抽样调查的方法
3.整群抽样
❖特点:
▪ 抽样时只需群的抽样框,可简化工作量 ▪ 调查的地点相对集中,节省调查费用,方便
调查的实施 ▪ 当群中的元素差异性大时,整群抽样得到的
结果比较好。在理想状态下,每一群是整个 总体小范围内的代表。如对人口普查资料进 行复查,就采用整群抽样的方式。
5.1 抽样调查的概念、特点和作用
五、全及总体和抽样总体 ❖全及总体,简称总体,是指所要认识对象的全
体,是许多同质性单位的集合。通常用大写字 母N来表示(容量)。 ❖抽样总体,简称样本,是从全及总体中随机抽 取出来,代表全及总体部分单位的集合。通常 用小写字母n来表示(容量) 。
▪ 样本容量(Sample size):样本中所含个体的数量。分为 大样本(>30)、小样本(<30)。
▪ 样本个数:又称为样本可能数目。是指从一个总体中可以 抽取的样本个数。
5.2 抽样调查的方法
《统计学》复习题_3

《统计学》复习题一、选择题(有且仅有一个答案是正确的)1、劳动生产率是个()指标①动态②质量③流量④强度2、社会经济统计是()的有力武器①解决问题②克服困难③认识社会④进行合作3、计划完成程度是个()指标①动态②流量③强度④质量4、统计有三种含义,其中()是基础①统计学②统计活动③统计资料④统计部门5、把一个工厂的工人组成总体,每一个工人是()①总体单位②数量标志③指标④品质标志6、人口普查中规定统一的标准时间是为了()①登记的方便②避免重复或遗漏③扩大宣传效果④确定调查单位7、人口普查中,居民按年龄分组,宜编制()数列①组距②单项③离散④均可8、变量数列的组成要素一般是()①一个②两个③三个④四个9、某电视机厂为了检验全厂产品质量,应采用()①普查②重点调查③典型调查④抽样调查10、统计分组的关键是()①搜集各种原始资料②注意资料的真实性③正确选择分组标志与划分各组界限④绘制次数分配图11、某种产品单位成本计划规定比基期下降3%,实际比基期下降3.5%,则其单位成本计划完成程度相对指标为()① 116.7% ② 100.5% ③ 85.7% ④ 99.5%12、我国1993年轻工业增加值为重工业增加值的89.8%,该指标为()①结构相对指标②比例相对指标③比较相对指标④动态相对指标13、总量指标数值的大小()①随总体范围扩大而增大②随总体范围扩大而减少③随总体范围缩小而增大④与总体范围大小无关14、标志变异指标中,由总体中两上极端数值大小决定的是()①全距②平均差③标准差④标准差系数15、计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()①小于100% ②大于100% ③等于100% ④不等于100%16、某种商品的年末库存额是()①时期指标并实物指标②时点指标并实物指标③时期指标并价值指标④时点指标并价值指标17、统计表的分类中不含()①一览表②简单表③分组表④复合表18、时期指标的特点是()① 不具有可加性 ② 具有可加性 ③ 与时间间隔无关 ④ 只能间断计数19、对于不同变量数列之间标志值离散程度的比较,只能计算( )① 标准差 ② 平均差 ③ 全距 ④ 标准系数20、是非标志标准差数值的取值范围是()① 0-0.25 ② 0-0.5 ③ 0-1 ④ 0.5-121、以1949年为最初水平,1994年为最末水平,计算钢产量的年递增率时,需要开( )次方。
统计学原理作业三答案

统计学原理作业三答案一、判断题1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)3、在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大(×)4、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
√5、在其它条件不变的情况下,提高抽样估计的可*程度,可以提高抽样估计的精确度。
(×)6、抽样极限误差总是大于抽样平均误差。
(×)7、相关系数是测定变量之间相关关系的唯一方法(×)8、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ )9、利用一个回归方程,两个变量可以互相推算( ×)10、估计标准误指的就是实际值y与估计值yc 的平均误差程度(√)二、单项选择题1、在一定的抽样平均误差条件下( A )A、扩大极限误差范围,可以提高推断的可*程度B、扩大极限误差范围,会降低推断的可*程度C、缩小极限误差范围,可以提高推断的可*程度D、缩小极限误差范围,不改变推断的可*程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )A、抽样误差系数B、概率度c、抽样平均误差D、抽样极限误差3、抽样平均误差是(D )A、全及总体的标准差B、样本的标准差c、抽样指标的标准差 D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C )A、等于78%B、大于84% c、在此76%与84%之间 D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( B )A、甲厂比乙厂大B、乙厂比甲厂大c、两个工厂一样大 D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。
抽样技术简答题及答案

抽样技术各类简答题参考答案习题一1.请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。
3.抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4.样本可能数目及其意义;答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差
•
有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体
•
称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。
统计学抽样与抽样分布

3. 需要包含所有低阶段抽样单位的抽样框;同时由于
实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
概率抽样(小结)
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。
n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。
样本分量:其中每一个Xi是一个随机变量,称为样本 分量。
样本观察值:一次抽样中所观察到的样本数据x1、x2、 x3称为样本观察值。 对于某一既定的总体,由于抽样的方式方法不同,样 本容量也可大可小,因而,样本是不确定的、而是可5
一、 几个概念
(二)样本总体与样本指标
样本指标(统计量)。在抽样估计中,用来反 映样本总体数量特征的指标称为样本指标,也 称为样本统计量或估计量,是根据样本资料计 算的、用以估计或推断相应总体指标的综合指 标。
3
总体和参数(续)
通常所要估计的总体指标有
X
NX
一、 几个概念
(二)样本总体与样本指标
样本总体。简称样本(Sample),它是按照随机原则, 从总体中抽取的部分总体单位的集合体 。
样本容量:样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
(二)抽样平均误差(抽样标准误)
抽样平均误差是反映抽样误差一般水平的指标(因为 抽样误差是一个随机变量,它的数值随着可能抽取的 样本不同而或大或小,为了总的衡量样本代表性的高 低,就需要计算抽样误差的一般水平)。通常用样本 估计量的标准差来反映所有可能样本估计值与其中心 值的平均离散程度。
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
统计学
一、名词解释1、定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据。
(定类数据是对事物进行分类的结果,表现为类别,由定类尺度计量而成。
定序数据是对事物按照一定的排序进行分类的结果,表现为有顺序的类别,由定序尺度计量而成。
)2、定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。
(定距数据是一种不仅能反映事物所属的类别和顺序,还能反映事物类别或顺序之间数量差距的数据,由定距尺度计量而成。
定比数据是一种不仅能体现事物之间数量差距,还能通过对比运算,即计算两个测度值之间的比值来体现相对程度的数据,由定比尺度计量而成。
)3、长期趋势是指时间数列中指标值在较长一段时间内,由于受普遍的、持续的、决定性的基本因素的作用,使发展水平沿着一个方向持续向上或向下发展或持续不变的基本态势。
4、季节变动是指数列中各期指标值随着季节交替而出现周期性的、有规则的重复变动,这里的时间通常指一年。
5、循环变动是指时间数列中各项指标值随着时间变动发生周期性的重复变化,但循环变动所需的时间更长,重复变动的规律性、变动周期和时间也不像季节变动来得稳定、可以预测。
6、不规则变动是由未能得到解释的一些短期波动所组成的,常指时间数列由于受偶然因素或意外条件影响,在一段时间内(通常指短期内)呈现不规则的或自然不可预测的变动。
7、相关关系,也称统计相关,是指现象之间存在的非确定性的数量依存关系。
8、点估计也称定值估计,就是以样本观测数据为依据,对总体参数做出确定值的估计,也就是用一个样本的具体统计值去估计总体的未知参数。
9、区间估计,就是指用一个具有一定可靠程度的区间范围来估计总体参数,即对于未知的总体参数θ,想办法找出两个数值θ1和θ2(θ1<θ2),使θ处于区间(θ1,θ2)内的概率为1-α,即π(θ1<θ<θ2)=1-α。
区间(θ1,θ2)为总体参数的估计区间或置信区间,θ1为估计下限或置信下限,θ2为估计上限或置信上限。
统计学原理第五章习题
《统计学原理》第五章习题河南电大贾天骐一.判断题部分题目1:从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
()答案:×题目2:在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。
()答案:√题目3:抽样成数的特点是:样本成数越大,则抽样平均误差越大。
()答案:×题目4:抽样平均误差总是小于抽样极限误差。
()答案:×题目5:在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。
()答案:√题目6:从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数。
()答案:√题目7:抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。
()答案:√题目8:在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。
()答案:√题目9:抽样估计的优良标准有三个:无偏性、可靠性和一致性。
()答案:×题目10:样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比。
()答案:×题目11:抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。
()答案:×题目12:用来测量估计可靠程度的指标是抽样误差的概率度。
()答案:√题目13:总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差的概率度。
()答案:×二.单项选择题部分题目1:抽样平均误差是()。
A、抽增指标的标准差B、总体参数的标准差C、样本变量的函数D、总体变量的函数答案:A题目2:抽样调查所必须遵循的基本原则是()。
A、准确性原则B、随机性原则C、可靠性原则 C、灵活性原则答案:B题目3:在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的()。
统计学第六章抽样调查
n
N
例题2
xf
x
f
8400 200
42
s (x x)2 f 12200 7.81
f
200
2 (1 n ) 7.812 (1 200 ) 0.55
x
n
N
200
2000
例题3
❖某冷库的10万只冻鸡合格率为97%, 如果按重复抽样与不重复抽样各抽 取1000只和2000只,分别计算抽样 平均误差。
A
B
较小的样本容量
X
成数
❖ 总体成数
每个总体单位标志值设为0或1 1:具有某种属性的总体单位标志值 0:不具有某种属性的总体单位标志值 总体中具有某种特征的单位占全部总体单位
数的比例称为总体成数,记作P 成数总体方差:P(1-P)
总体成数和样本成数
❖ 样本成数
从成数总体中抽取样本容量为n的样本 样本中具有此种特征的单位占全部样本单位
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
16
1、1 2、1 3、1 4、1
1、2 2、2 3、2 4、2
1、3 2、3 3、3 4、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样考虑顺序 12
2、1 3、1 4、1
1、2
3、2 4、2
1、3 2、3
- 2.58x
-1.65 x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
区间估计
❖ 根据一个样本的观察值给出总体参数的估计范围 ❖ 给出总体参数落在这一区间的概率 ❖ 例如: 总体均值落在50~70之间,置信度为 95%
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学(抽样极限误差与平均误差的关系及抽样方案的设计)
1 / 4
➢ 抽样极限误差与抽样平均误差的关系
抽样极限误差通常用抽样平均误差的倍数表示,即
pp
t
2
pp
Z
t称为概率度
xx
t
2
x
x
Z
3、可信程度
可信程度是表示估计的可靠程度
如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。
而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t
决定的。因而可靠程度与t之间有一定正比关系。
概率度t与概率保证程度(可靠程度)之间的关系见下表。
概率度t 误差范围() 概率F(t) 概率度t 误差范围() 概率F(t)
0.5 1.00 1.50 0.5 1.00 1.50 0.3829 0.6827 0.8664 1.96 2.00 3.00 1.96 2.00 3.00 0.9500
0.9545
0.9973
例:若概率为0.95,查表得t=1.96
三、抽样推断(区间估计)
抽样推断(区间估计)的步骤如下:
⒈计算抽样平均误差
⒉给定概率保证程度,查表得概率度t
⒊计算抽样极限误差
xx
t
⒋估计总体指标区间
统计学(抽样极限误差与平均误差的关系及抽样方案的设计)
2 / 4
xx
xXx
接前面灯泡例题:
灯泡样本平均使用时间 为1057小时,合格率为91.5%,重复抽样下,灯泡的使用时间
抽样平均误差 小时,合格率的平均误差为 ,计算在不同概
率保证下,平均数和成数的抽样极限误差?
当t=1?
当t=2?
当t=3?
第五节 抽样方案设计(P96)
一、抽样方案设计的基本原则
➢ 保证实现抽样随机性的原则
(保证消除代表性误差中的偏差)
➢ 保证实现最大的抽样效果原则
注意:
➢ 调查费用取决很多因素,其中最重要的是抽样单位数目,要确定适当的抽样单位数
目,取决于抽样的精度和可靠性的要求;
➢ 精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大
越好;
➢ 在样本容量确定的条件下二者是矛盾的,因此抽样设计的原则是在一定的误差和可
靠性的要求下选择费用最少的样本设计。
二、简单随机抽样(既不分组也不排队)
➢ 简单随机抽样又称纯随机抽样,是按照随机的原则直接从N个总体单位中抽取n个
单位作为样本。
注意:简单随机抽样最符合随机原则
➢ 直接抽选法
➢ 抽签法
➢ 随机数码表法
三、类型抽样 (分层抽样)
➢ 类型抽样又称分类抽样或分层抽样,是先对总体各单位按一定标志加以分类,然后
再从各类中按随机原则抽取样本,由各类内的样本组成一个总样本。
➢ 将总体N分成N1、N2、Nm,从N1中抽取n1个单位、N2中抽取n2个单位、Nm
中抽取nm个单位组成样本。
➢ 总体单位数N=N1+N2+…Nm
样本单位数n=n1+n2+…nm
注意:在类型抽样的情况下,因为从各类型组都抽取了样本单位,所以,对各类型组来说
是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的总方差是组内方差。
四、机械抽样(系统抽样)
➢ 机械抽样又称等距抽样,它是对总体按一定的顺序排列,每隔一定的间隔抽取一个
或若干个单位,并把这些单位组成样本的一种抽样方法。
➢ 等距抽样按排队的标志不同,分为无关标志排队和有关标志排队的等距抽样 。
➢ 随机起点等距抽样
➢ 半距起点等距抽样
3.7922x1.972%p
统计学(抽样极限误差与平均误差的关系及抽样方案的设计)
3 / 4
➢ 对称等距抽样
五、整群抽样
➢ 整群抽样是将总体划分为由总体单位的组成的若干群,然后以群为抽样单位,抽取
若干群作为样本,对群内所有单位进行全面调查的抽样方法。
➢ 影响整群抽样误差大小的是群间方差,误差一般大于简单随机抽样。
六、多阶段抽样
➢ 在抽样调查抽选样本时并不是一次直接从总体中抽取,而是分成两个或者两个以上
的阶段来进行。
➢ 多阶段抽样的前几个阶段类似整群抽样
➢ 两阶段抽样和类型抽样、整群抽样的联系
第六节 必要抽样单位数的确定(P141)
一、确定抽样单位数的意义和原则
➢ 在选定了抽样方式后,必须确定样本容量n。
➢ n的大小同抽样推断的效果成正比,同抽样组织需要耗费的人力、物力、财力等也
成正比。
➢ 在组织抽样调查的时候,需要在确保抽样推断的可靠程度和精确程度的要求下,力
求抽样组织工作更简单。
二、确定抽样单位数的依据
➢ 总体各单位标志变异程度 :即总体方差或p(1-p)的大小。总体标志变异程度大,要
求样本容量大一些;反之,总体标志变异程度小,样本容量可以小些。
➢ 允许的极限误差 或 的大小 :允许的极限误差越大,样本容量越小;反之,
极限误差越小,样本容量越大
➢ 抽样方法:在其它条件相同的情况下,重置抽样比不重置抽样要抽取多一些样本单
位。
➢ 抽样方式:采用类型抽样的样本容量要小于简单随机抽样的样本容量。
三、确定抽样单位数的计算公式(只要求掌握简单随机抽样)
➢ 简单随机重复抽样平均指标的必要抽样单位数公式
➢ 简单随机不重复抽样平均指标的必要抽样单位数公式
简单随机重复抽样成数的必要抽样单位数公式
➢ 简单随机不重复抽样成数的必要抽样单位数公式
注意:
➢ 公式的运用要求事先取得全及总体的标准差 或 ,这往往无法知道,
所以一般用抽样指标的标准差 或 来代替。
2222
22
xx
xx
t
ttnn
2222
22222
(1)xxxxnNtNttnnNNtN
2
22
(1)(1)(1)pppppptppppttnn
2
222
(1)(1)(1)(1)(1)(1)ppppppnNtppNppttnnNNtppNpp
(1)PP
(1)pp
统计学(抽样极限误差与平均误差的关系及抽样方案的设计)
4 / 4
➢ 如果缺少成数资料,可以直接假定P=0.5来计算,这样P(1-P)取得最大值为0.25
➢ 在同一个抽样调查中,如果既需要推断全及平均数,也需要推断全及成数,依据成
数和平均数计算出来的必要抽样单位数不一致的时候,取较大的n作为统一的抽样
单位数。
例题:详见教材142、143页例4.12和4.13做题时,如果没有指出时重复抽样还是不重复
抽样,需要计算两种情况下的抽样单位数。注意,不重复抽样单位数一定比重复抽样单位
数要小。
本章结束!