第5章 抽样调查

合集下载

第5章抽样调查2

第5章抽样调查2

n
n
n
P( x ˆ2 z x ˆ1 ) 1 a
p(1 p)
p(1 p)
n
n
5 - 35
统计学
STATISTICS
x ˆ1
p(1 p)
z 2
n
x ˆ2
p(1 p)
z 2
n
ˆ1 x z 2
p(1 p) n
ˆ2 x z 2

P(
x
ˆ2

x

x


ˆ1
)
n
n
n

P(
x
ˆ2

z

x


ˆ1
)

1

a
5 - 20
n
n
统计学
STATISTICS
x
ˆ1

z 2
n
x
ˆ2

z 2
n
ˆ1 x z 2

n
112.56 1.96
5 100
ˆ2 x z 2
STATISTICS
xn
2
2

x
n

N N
n 1


n
1
n N

5 - 42
统计学
STATISTICS
p 1 p
p
n
x
p
1
n
p

N N
n 1


p
1
n
p
1
n N

5 - 43
某外贸公司出口一种茶叶,规定每包规格

第五章 抽样

第五章 抽样

• 二是抽样要求不同:配额注重量的分配, 而判断抽样注重质的分配 • 三是抽样方法不同:配额抽样的方法复杂 精密,而判断抽样的方法简单、易行。
(二)独立控制配额抽样
• 独立控制配额抽样规定按独立的控制特征 分配并抽取样本。 • 例如,假设某调查项目需要对客户进行调 查,选定的控制特征为年龄、性别、和收 入三种,确定的样本数为360个。其独立控 制配额抽样如下表:
五、抽样数目的确定
• 第一,总体中各单位之间标志值的变异程 度; • 第二,允许误差的大小,允许误差又称为 极限误差或最大可能误差,是抽样误差的 范围。用 ∆ 来表示,公式为 ∆ =tµ ,式中t代 表概率度是指扩大或缩小抽样误差范围的 倍数, µ 代表抽样误差。 • 第三,不同的抽样方法也会影响抽样数目。
• 2、分层随即抽样:是把调查总体按其属性不 、分层随即抽样: 同分为若干层次然后在各层中随即抽取样本的 技术。例如:调查人口,可按年龄、收入、职 业、居住位置等标志划分不同的阶层。 • 3、分群随即抽样:又称整群抽样,是把调查 、分群随即抽样: 总体区分为若干个群体,按后用单纯随机抽样 法,从中抽取某些群体进行全面调查的技术。 • 4、系统随即抽样 、系统随即抽样:又称等距离抽样,它是在 总体中先按一定标志顺序排列,并根据总体单 位数和样本单位数计算出抽样距离,然后按相 同的距离或间隔抽选样本单位的技术。
四、固定样本连续抽样调查法
• (一)固定样本连续调查法的含义和特点 • 定义:是把选定的样本单位固定下来,长 期进行调查。 • 优点:调查对象稳定,可以及时、全面取 得各种可靠的资料;费用低效果好。 • 缺点:调查对象登记、记账的工作量很大, 长年累月记录,负担较重。
• • • • • • • •
二、分层随即抽样技术及其应用

第五章 抽样调查

第五章 抽样调查

第二种方案:洛阳市所有小学的名单(第一抽样框), 从中抽取10所学校(抽样单位是学校);被抽中 学校的所有班级名单(第二抽样框),每个学校抽 10个班级,共抽取100个班级。(抽样单位是 班级);被抽中班级的所有学生名单(第三抽样 框),每个班级抽20名学生,共抽取2000名 学生,(抽样单位是学生).
18-30 31-50 50以上 小计 总计
200

缺点 虑其中的几种,不可能做出很细的分类
1. 分层不可能兼顾总体的众多属性,只能考 2. 总体分布变化的最新信息不容易得到,因
而配额的合理性很难保证
3. 主观性很大。如一个访问员会本能地避免 访问难以找到的受访者。
四、滚雪球抽样(Snowball Sampling)
(4)依据从随机数表中选出的数码,到抽样 框中寻找它所对应的元素。 练习: 试用简单随机抽样方法在洛阳师范学院抽取 2000名学生。 请思考:操作的难点是什么?
优点:概率抽样的理想类型,简单易行,误差小。 缺点: 1. 需要为总体每个要素编号,当总体所含个 体的数目太多时采用这种方法费时费力; 2. 总体内分类明显时,这种抽样无法按类别 特征自动分配样本数,若想保证样本的代表性,必 须增大样本量,使工作量增大。

院系——专业——班级——学生
抽样框 抽样单位 院系 专业 班级
第一抽样框:所有院系的名单 第二抽样框:抽中院系的所有专 业名单 第三抽样框:抽中专业的所有班 级名单
第四抽样框:抽中班级的所有学 生名单
学生
四、 抽样的原则

随机原则(random principle):在完全
排除主观上人为选择的前提下,使总体中 每一个单位有相同被抽中的机会。——概 率抽样

第五章 市场调研抽样

第五章 市场调研抽样

2、总体指标与抽样指标
总体指标,是根据调研总体各个体指标值计算的综合指标。 总体指标,是根据调研总体各个体指标值计算的综合指标。 总体平均数、总体成数、总体方差和均方差。 有:总体平均数、总体成数、总体方差和均方差。 抽样指标,又称样本指标, 抽样指标,又称样本指标,是根据样本各单位标志值计算的 综合指标。 抽样平均数、抽样成数、抽样方差和均方差。 综合指标。有:抽样平均数、抽样成数、抽样方差和均方差。
© fyq2009
12
3、系统抽样的优缺点 、
优点
抽中的样本比较均匀的分布在总体中,利于推算总体目标 量,是应用最广泛的一种抽样方式。
缺点
(1)前提是要有总体每个单位的相关资料,特别是按 有关标志排队时。 (2)当抽选间隔和被调查对象本身的节奏性(或循环 周期)重合时,会影响调查精度。 (3)抽样误差计算较复杂。
受客观条件限制,无法进行严格的随机抽样; 为了快速获得调查结果; 对调查对象不确定或无法确定的情况; 总体各单位间离散程度不大且调查员具有丰富经验时采用。
非随机抽样技术有四种: 非随机抽样技术有四种: 方便抽样、判断抽样、配额抽样、 方便抽样、判断抽样、配额抽样、雪球抽样
© fyq2009
20
一、方便抽样
© fyq2009
11
二、系统抽样
1、定义 、
系统抽样(Systematic sampling):又称等距抽样,就是先将 调研总体的各个体按一定标志排列起来,然后按照固定顺序和 一定间隔来抽取样本个体。
2、排队标志、抽样间隔、抽样起点 、排队标志、抽样间隔、
排队标志 • 一种是按与调查项目无关的标志排队。 • 另一种是按与调查项目有关的标志排队。 抽样间隔(距离)=调研总体数(N)/样本数(n) 抽样起点确定 –在第一段距离中,用简单随机抽样方式抽取第一个样本。 –从距离的1/2处抽取第一个样本。 –便利方式。

第5章 市场调查的抽样技术

第5章 市场调查的抽样技术
其大小受四个因素影响:总体标准差、抽取样本量、抽样方式、抽样方法 非抽样误差:由于其他多种原因引起的估计值与总体参数之间的差异。 其误差来源:抽样框误差、无回答误差、计量误差
二、抽样调查的特点
抽样调查数据之所以能用来代表和推算总体,主要是因 为抽样调查本身具有其他非全面调查所不具备的特点, 主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个 单位被抽取的机会是均等的,因此,能够保证被抽中的 单位在总体中的均匀分布,不致出现倾向性误差,代表 性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用 整个“代表团”来代表总体,而不是用随意挑选的个别 单位代表总体。
二、系统抽样技术
系统抽样又称机械抽样或等距抽样,是指先将总 体各个单位按某一标志值的大小排列,再分成若 干个组,每个组的样本数基本相等,依照时间或 空间上相等的间隔来抽取调查单位。
抽样间隔(样本距离) =总体单位数/样本单位 数
系统抽样的步骤: 第一步:将总体中每一个个体按顺序排列并加以编号 第二步:计算抽样距离 第三步:抽取第一个样本 第四步:抽取所有的样本 系统抽样优缺点 优点:
即应包括全部总体单位。 例如:名单抽样框、区域抽样框、时间表抽样框 抽样单元:构成抽样框的基本元素。 抽样单元可以分级:初级单元、二级单元、三级单元等。 例如:抽取学校、抽取班级、抽取学生 (五)抽样误差和非抽样误差
抽样误差:指在遵守随机原则条件下,样本指标与总体指标之间的差异,是抽样 调查中不可避免的误差。
域之内
(3)群内差异大,而群间差异小
五、几种概率抽样方案的选择和比较
抽样技术
优点
缺点
简单随机抽样
易理解;结果可投影,可推广 到总体
抽样框难于构制;费用高; 精度低;不一定能保证代表

统计学课件05第5章抽样与参数估计

统计学课件05第5章抽样与参数估计

反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。

第5章抽样调查及参数估计(练习题)

第5章抽样调查及参数估计(练习题)

第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。

2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。

3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。

4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。

5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。

6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。

7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。

8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。

三、选择题1.抽样调查需要遵守的基本原则是( B )。

A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。

A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。

A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。

A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。

(完整版)第五章抽样调查习题答案

(完整版)第五章抽样调查习题答案

《统计学》习题五 参考答案、单项选择题:1、抽样误差是指( )。

CA 在调查过程中由于观察、测量等差错所引起的误差B 人为原因所造成的误差C 随机抽样而产生的代表性误差D 在调查中违反随机原则出现的系统误差2、抽样平均误差就是( )。

DA 样本的标准差B 总体的标准差C 随机误差D 样本指标的标准差3、抽样估计的可靠性和精确度( )。

BA 是一致的B 是矛盾的C 成正比D 无关系4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。

A A 增加 8 倍B 增加 9 倍C 增加 1.25 倍D 增加 2.25 倍5、当有多个参数需要估计时,可以计算出多个样品容量 n 为满足共同的要求,必要的样本容量 一般应是( )。

BA 总体的标志变异程度B 允许误差的大小C 重复抽样和不重复抽样D 样本的差异程度E 估计的可靠度三、填空题:3、 实施概率抽样的前提条件是要具备( )。

抽样框4、 对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的( 虑估计的( )问题。

准确性 可靠性四、简答题:1、抽样调查与重点调查的主要不同点。

A 最小的n 值 B 最大的n 值 6、抽样时需要遵循随机原则的原因是( C 中间的n 值 D 第一个计算出来的n 值)。

CA 可以防止一些工作中的失误B 能使样本与总体有相同的分布C 能使样本与总体有相似或相同的分布D 可使单位调查费用降低二、多项选择题:1、抽样推断中哪些误差是可以避免的( A 工作条件造成的误差 B D 人为因素形成偏差 E2、区间估计的要素是( A 点估计值 B D 抽样极限误差 E3、影响必要样本容量的因素主要有( )。

A B D系统性偏差 C 抽样随机误差 抽样实际误差)。

A C D样本的分布 C 估计的可靠度总体的分布形式)。

A B C E1、抽样推断就是根据( )的信息去研究总体的特征。

样本2、样本单位选取方法可分为( )和( )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.抽样调查的特征 (1)抽取样本的客观性 (2)抽样调查可以比较准确的推断总体 (3)抽样调查是一种比较节省的调查方法 (4)抽样调查的应用范围广泛
5.1.2 抽样调查中常用的基本概念
1.总体和样本 2.总体单位和样本单位 3.总体指标和样本指标 (1)总体指标 ①总体平均数 ②总体成数 ③总体数量标志的标准差 ④总体是非标志的标准差 (2)样本指标 ①样本平均数 ②样本成数 ③样本数量标志的标准差 ④样本是非标志标准差
2.等距抽样
等距抽样又称机械抽样或系统抽样,它是先 将总体各单位按某一标志排队,并根据总体单 位数和样本单位数计算出抽样距离(即相同的 间隔),然后按相等的距离或等间隔来抽取样 本单位。
(1)等距抽样的过程 【例5-6】从5000名学生中随机抽取100名进行调 查。采用等距抽样法如何抽取样本? (2)等距抽样法的优缺点及适用范围 【小思考5—1】老师依照某种规律点名(如:2号、 12号、22号、32号……)是采用了哪种抽样方法?
简单随机抽样 等距抽样 分层抽样 整群抽样 多阶段抽样 任意抽样 判断抽样 配额抽样 滚雪球抽样 自愿抽样
5.3.1 随机抽样 1.简单随机抽样
也称纯随机抽样,即是在总体单位均匀混合的情况 下,随机逐个抽出样本的抽样方式,它是概率抽样的 最基本类型。 (1)直接抽取法 (2)抽签法 (3)随机数表法 (4)简单,它是先将总体按某一标志分 成若干个类型组,使各组组内标志值比较接近, 然后分别在各组组内按随机原则抽取样本单位, 最后把各层中抽出的样本合在一起构成总体的 样本的方法。
5.2.3 确定抽样数目 1、抽样数目的影响因素 (1)统计方面的因素 ①总体的性质和特点 ②抽样误差的大小 ③抽样的方式、方法 (2)管理方面的因素 ①经费预算 ②精度要求 (3)调查实施方面的因素 ①问卷的回收率 ②问题的回答率
2、抽样数目的计算
(1)公式法
①当测定的指标是平均数时,重复抽样的抽样数目的
总体 规模
100 以下
100~ 1000
1 000~ 5000
5000~ 10000
10000~ 100000
100000 以上
抽样数 占总体 比重(%)
50以上
50~20
30~10
15~3
5~1
1以下
5.2.4 选择抽样方式 5.2.5 抽样调查的实施
5.3 抽样调查方式
抽样调查 方式
随机抽样 非随机抽样
经国务院批准,我国于2005年底开展了全国1%人口抽样调查工作。这 次调查以全国为总体,以各省、自治区、直辖市为次总体,采取分层、 多阶段、整群概率比例的抽样方法。最终样本单位为调查小区。这次调 查的样本量为1705万人,占全国总人口的1.31%。
截止2005年11月1日零时,全国总人口为130,628万人,与2000年11 月1日零时第五次全国人口普查的总人口126,583万人相比,增加了 4,045万人,增长3.2%;年平均增加809万人,年平均增长0.63%。 根据调查数据推算,2005年年末总人口为130756万人。 全国人口中, 男性为67,309万人,占总人口的51.53%;女性为63,319万人,占总 人口的48.47%。性别比(以女性为100,男性对女性的比例)为 106.30,与第五次全国人口普查相比下降0.44。
第5章 抽样调查
5.1 抽样的基本问题 5.2 抽样调查程序 5.3 抽样调查方式
引导案例
2005年全国1%人口抽样调查
我国是世界第一人口大国,人口问题始终是一个关系经济社会发展全局 的重要问题。新中国成立56年来,我国已经先后开展了五次全国人口普 查。从20世纪80年代起,为了及时掌握人口变动情况,国务院决定在每 两次人口普查中间,进行一次1%人口抽样调查。
p
P(1 P) (1 n )
n
N
(3)极限抽样误差(允许误差)
5.2 抽样调查程序
确定调查 总体
选择样本 框
确定抽样 数目
选择抽样方 式
抽样调查的 实施
5.2.1 确定调查总体 调查总体是指研究者根据一定研究目的而规
定的所要调查对象的全体。 5.2.2 选择样本框 (1)有效性 (2)完整性
5.1 抽样的基本问题
5.1.1 抽样调查的概念与特征 1.抽样调查的概念
抽样调查的概念有广义和狭义之分。 广义上,抽样调查是指从总体中抽取一部分单位进 行观察,根据观察结果来推断总体的调查方法。包括 随机抽样和非随机抽样。随机抽样就是按随机原则抽 样,抽样时要保证总体内所有单位具有相同的被抽中 和不被抽中的机会;非随机抽样就是调查者根据自己 的认识和判断,选取若干个有代表性的单位。 狭义上,抽样调查就是指随机抽样。 一般我们所说的抽样调查,大多是指随机抽样。
计算公式为:
n
t 2 2
x2
不重复抽样的抽样数目的计算公式为:
n
Nt 2 2 N x 2 t 2 2
②当测定的指标是成数时,重复抽样的抽样数 目的计算公式为:
n
t2P(1 P2
P)
不重复抽样的抽样数目的计算公式为:
n
Nt2P(1 P) NP2 t2P(1
P)
(2)经验法 经验法确定抽样数目的范围
4.抽样误差的计算 (1)样本平均数的抽样平均误差的计算 ①重复抽样方法下的计算公式:
x
2
nn
②不重复抽样方法下的计算公式:(总体单位 数很大时)
x
2 (1 n )
nN
(2)样本成数的抽样平均误差的计算 ①重复抽样方法下的计算公式:
p
P(1 P) n
②不重复抽样方法下的计算公式:(总体单位 数很大时)
3.抽样误差的意义
抽样误差的意义首先表现在它可以说明样本 指标的代表性大小。显然,抽样误差大,说明 样本指标对总体指标的代表性低;抽样误差小, 则说明样本指标对总体指标的代表性高。其次 它还是计算样本指标和总体指标变异范围的主 要依据;最后,在组织抽样调查时,抽样误差 也是确定抽样数目的依据之一。
5.1.3 抽样误差
1.抽样误差的概念 统计误差可分为: 登记误差 代表性误差 代表性误差又有两种不同的情况: 偏差 随机误差 随机误差又有两种: 实际误差 抽样平均误差 抽样误差指的就是抽样平均误差。
2.抽样误差的影响因素 (1)抽样数目的多少 (2)总体各单位之间的差异程度 (3)不同的抽样组织方式和方法
相关文档
最新文档