第四章、抽样

合集下载

统计学(抽样估计)

统计学(抽样估计)
2
第四章第一节
二、抽样调查的特点
➢按随机原则抽取调查单位; ➢要抽取足够多的调查单位;
基本原则
➢可从数量上推断总体
基本目的及任务
➢要运用概率估计的方法
➢抽样调查中所产生的抽样误差可以事先计算
并加以控制。
科学性体现
3
第四章第一节
三、抽样调查的使用范围 ➢ 有些事情在测量或实验时有破坏性,不可能进行
1、用样本标准差替代总体标准差。大样本情况下,可 以直接用样本标准差S代表代表总体标准差;在小样
本的情况下,则采用样本修正标准差 S *来代替。
S* (xi x)2 n 1 S n n 1
2、用以前(近期)的总体标准差或同类地区的总体标 准差来代表所研究的标准差。若同时有多个可供参 考的数值时,应选择其中最大者。对于成数P,应选 最接近0.5的比率。
up
P(1 P)(重复) n
up
P(1 n
p)
(
N N
n 1
)或up
ux
σ 2 (N n)或 n N1
ux
σ 2 (1 n )(不重复) nN
P(1 P) (1 n )(不重复)
n
N
26
第四章第三节
注意:在上述公式中, 或 P(1 P)总体标准差,但
是实际中这两个数据却是未知的。计算抽样平均误 差时通常采用以下替代方法。
进行检验,来判断这种假设的真伪,以决定取舍
4
第四章第一节 四、抽样估计的一般步骤 1、设计抽样方案 2、抽取样本单位 3、搜集样本资料 4、整理样本资料 5、推断总体指标
5
第四章第二节 第二节 调样调查的基本概念及理论依据 一、全及总体和抽样总体(教材没有) ➢ 全及总体-简称总体(N):研究对象的全 体 (唯一确定) ✓ 变量总体 :各单位可用数量标志计量 A 有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续 ✓ 属性总体 :各单位用品质标志描述

社会调查方法

社会调查方法

具体做法
先从总体中随机抽取若干大群(组) 再从这几个大群(组)内抽取几个小群(组) 一层层抽下去,直至抽到最基本的抽样元素。
五、多段抽样
如何确定每一级抽样的单位数目:
各个抽样阶段中的子总体同质性程度 各层子总体的人数 研究者所拥有的人力和经费
例子
调查某市青年工人的状况 以企业为单位抽样 以全市企业为抽样框,随机抽取一部分企业 在抽中企业,以车间为抽样单位,随机抽取若干车间 在抽中车间,随机抽取青年工人。
分层抽样适用于总体由差异明显的几部分组成的情况,每 一部分称为层,在每一层中实行简单随机抽样。这种方法较充 分地利用了总体己有信息,是一种实用、操作性强的方法。 分层抽样的一个重要问题是一个总体如何分层。分层抽样中 分多少层,要视具体情况而定。总的原则是:层内样本的差异要 小,而层与层之间的差异尽可能地大,否则将失去分层的意义。
一、抽样的概念与类型
抽样的类型
概率抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 抽样方法 多段抽样 偶遇抽样
判断抽样
非概率抽样 定额抽样 雪球抽样
二、概率抽样的原理与程序
概率抽样的原理
在社会各种总体都普遍存在异质性的现实面前,严 格的概率抽样程序与方法就必不可少。 概率样本所要放映的正是总体本身所具有的那种内 在的异质性。
四、整群抽样
整群抽样与分层抽样的使用条件
分层抽样:不同子群之间差别很大,每个子群内部 差异不大。 整群抽样:不同子群之间差异不大,每个子群内部 异质性程度比较大。
五、多段抽样
适用条件
适用于范围大、总体多的社会调查。
含义
又称多级或分段抽样,是按抽样元素的隶属关系或层次 关系,把抽样过程分为几个阶段进行。

第4章__抽样调查

第4章__抽样调查

4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体

第四章 抽样与抽样估计

第四章 抽样与抽样估计

(一)样本统计量的极限分布 1、如果总体服从正态分布,且均值和方差均为已知,即
Y ~ N (, 2 )
则可以证明不论样本量大小如何,样本均值都围绕总体 均值而服从正态分布,并且其抽样分布的方差等于总体方差 的n分之一,即 y ~ N (, 2 / n)
2、对于非正态总体,若均值μ 和σ 2有限,则根据中心极限 定理,当样本量n充分大时,样本均值仍然围绕着总体均值 而近似地服从正态分布,即
3、缺点: (1)若群内个单元有趋同性,效率将会降低; (2)通常无法预先知道总样本量,因为不知道群内有 多少单元; (3)方差估计比简单随机抽样更为复杂。
(四)分层抽样
1、定义:在抽样之前将总体分为同质的、互不重叠 的若干子总体,也称为层。然后在每一个层独立地随机 抽取样本。 分层抽样示意图:
2、优点:
抽取样本
总体 样本
推断总体


抽样调查中的总体是有限的。在抽样以前,必须根
据实际情况把总体划分成若干个互不重叠并且能组合成 总体的部分,每个部分称为一个抽样单元,不论总体是 否有限,总体中的抽样单元数一定是有限的,而且是已 知的,因此说抽样调查的总体总是有限的。 抽样调查中影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。 (2)抽样单元数的多少(或称样本量的大小)。 (3)抽样方法。

通常将反映总体数量特征的综合指标称为总体参
数。常见的总体参数主要有:总体总和;总体均值;总
体比率;总体比例。 一般将反映样本数量特征的综合指标称之为统计


量。统计量是n元样本的一个实值函数,是一个随机变
量,统计量的一个具体取值即为统计值。主要的样本统 计量有:样本总和;样本均值;样本比率;样本比例。

第四章 抽样

第四章 抽样
第四章 抽 样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质

(04)第4章+抽样与抽样分布

(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大

[高等教育]现代社会调查 第四章 抽样

27
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型

第四章 抽样技术


• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术

第四章 抽样


• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。

第四章 抽样

抽样的类型
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

获得了大量的样本,对此进行了精确的计算,根据,兰登将以370∶161的优
势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,
一个名叫乔治•盖洛普的人,对《文学文摘》调查结果的可信度
提出质疑.他也组织了抽样调查,进行民意测验.他的预测与
《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福
第四章、抽样
一、抽样的意义与作用
2.抽样的概念
n 在我们的日常生活中经常存在着抽样。如抽血化验,尝 试水温,窥一斑而知全豹。
n 抽样(sampling) 从组成某个总体的所有元素的集合中, 按一定的方式选择或抽取样本的过程
n 抽样调查,就是从研究总体中抽取一部分代表加以调查 研究,然后用所得结果推论和说明总体的特性。
候选人
布什 克林顿 克林顿 老布什 里根 里根 卡特 尼克松 尼克松 约翰逊 肯尼迪 艾森豪威尔 艾森豪威尔 杜鲁门 罗斯福 罗斯福 罗斯福
盖洛普民意测验结果(%)
48.0 52.0 49.0 56.0 59.0 47.0 48.0 62.0 43.0 64.0 51.0 59.5 51.0 44.5 51.5 52.0 55.7
n 制定抽样框:依据已经明确界定的总体范围,收集总体 中全部抽样单位的名单,并通过对名单进行统一编号来 建立起供抽样使用的抽样框
n 决定抽样方案:选择抽样方法,确定样本规模 n 实际抽取样本:1.先抽好样本,再调查 2.一边抽样一
边调查 n 评估样本质量:对样本的质量、代表性、偏差等进行初步
的检验和衡量
•小样本
•正态分布 •非正态分布
第四章、抽样
•样本均值的抽样分布
1. 样本均值的数学期望 2. 样本均值的方差(方差的概率意义在于刻画了随
机变量取值的分散程度。方差越小,随随机变量 的取值越集中在期望值附件。) • 重复抽样
第四章、抽样
抽样的一般程序
n 界定总体:对从中抽取样本的总体范围与界限作明确的 界定
n 总体分布、样本分布、抽样分布
当样本容量继续增大,样本平均数的分布会进 一步发生变化。这种变化趋势是:平均数的范 围将逐步缩小(即底部越来越窄);相同的平均数 会相应增多;全部平均数的分布向总体平均数 集中的趋势也会越来越明显.
第四章、抽样
总体分布(population distribution)
•一个任意 分布的总体
•当样本容量足 够大时(n 30) ,样本均值的抽
样分布逐渐趋于 正态分布
•x
第四章、抽样
•中心极限定理(central limit theorem)
•x 的分布 趋于正态 分布的过 程
第四章、抽样
•抽样分布与总体分布的关系
•总体分布
•正态分布 •正态分布
•非正态分布
•大样本
以62%比38%压倒性地大胜兰登.这一结果使《文学文摘》销
声匿迹,而盖洛普则名声大噪.
第四章、抽样
•从美国总统大选预测看抽样的效率:
年代
2000 1996 1992 1988 1984 1980 1976 1972 1968 1964 1960 1956 1952 1948 1944 1940 1936
• 总体分布:

总体中各元素的观察值所形成的相对频数(频率)分

• 分布通常是未知的(因为几乎得不到总体所有观察值)
• 可以(根据理论分析)假定它服从某种分布
•总 体
第四章、抽样
(sample distribution)
样本分布也称经验分布,指一个样本中各观察 值的形成的相对频数(频率)分布。当样本容
复杂的社会现象 •抽样 有限的研究资源
抽样主要涉及和处理有关总体与部分之间的关 系问题。抽样作为人们从部分认识整体这一过 程的关键环节,其基本作用是向人们提供一种 实现“由部分认识总体”这一目标的途径和手 段。
第四章、抽样
一、抽样的意义与作用
1.抽样的作用
n 抽样是社会研究的主要内容之一,也是社会调 查的一个重要步骤。
•用从个体数为N的总体中抽取一个容量为n 的样本,那么每个个体被抽取的概率等于
第四章、抽样
三、概率抽样的方法
1.简单随机抽样
n 抽签法(抓阄法)
将总体中的所有个体(共N个)编号(号码可以从 1到N),并把号码写在形状、大小相同的号签上 ( 号签可以用小球、卡片、纸条等制作),然后 将这些号签放在同一个箱子里,进行均匀搅拌。抽 签时,每次从中抽出1 个号签,连续抽取n次,就 得到一个容量为n的样本。对个体编号时,也可以 利用已有的编号。例如学生的学号,座位号等。
第四章、抽样
样本均值的抽样分布
n 在重复选取容量为n的样本时,由样本 均值的所有可能取值形成的相对频数分 布
第四章、抽样
•总体分布、样本均值的抽样分布(例题分析)
•【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体分布、总体的均值、方差及分布如下
第四章、抽样
二、概率抽样的原理与程序
n 概率抽样的逻辑
(3)代表性和选择的概率
如果总体中的每一个体都具有同等机会被选入样本,那 么从这一总体中抽取的样本就能够代表总体。 概率抽样的优点 (1)样本对总体更具代表性(相对其它类型抽样) (2)可以对样本的精确性和代表性作出估计
第四章、抽样
二、概率抽样的原理与程序
38
n 1936年美国正从经济大恐慌中复苏,全国仍有9百万人失
业进•. 行当角年逐的.美《国文总学统文大摘选》,(由Lit民era主ry党D员ig罗es斯t)福杂与志共对和结党果员进兰行登了
调查预测.他们根据当时的电话号码簿及该杂志订户俱乐部会
员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员
第四章、抽样
三、概率抽样的方法
练习
n 1.高二(21)班有53名同学,现要从中抽取8名去参加一个
n 置信区间(confidence intevalue) 上述“某一区 间”,就是置信区间
第四章、抽样
二、概率抽样的原理与程序
n 概率抽样: (1)每一个体有同等机会被抽取 (2)每一个体的抽取都是相互独立的
第四章、抽样
二、概率抽样的原理与程序
n 概率抽样的逻辑
(1)同质性和异质性 ➢ 如果研究总体是完全同质的,抽样就没有必要; ➢ 社会科学中的研究总体往往具有较强的异质性; ➢ 为了实现“通过部分认识整体”,样本应该包含
•总体分布
•均值和方差
•.3
•.2
•.1
•0 •1
•2 •3 •4
第四章、抽样
• 现从总体中抽取n=2的简单随机样本,在重复抽样条件下 ,共有42=16个样本。所有样本的结果为
•所有可能的n = 2 的样本(共16个)
•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1,1
•1,2
•1,3
•1,4
•2
•2,1
•2,2
•2,3
•2,4
•3
•3,1
•3,2
•3,3
•3,4
•4
•4,1
•4,2
•4,3
•4,4
第四章、抽样
• 计算出各样本的均值,如下表。并给出样 本均值的抽样分布
•16个样本的均值(

•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1.0 •1.5 •2.0 •2.5
•2
•1.5 •2.0 •2.5 •3.0
第四章、抽样
2020/11/28
第四章、抽样
第四章 抽样
•1.抽样的意义与作用 2.概率抽样的原理与程序 3.概率抽样方法 4.非概率抽样方法 5.样本规模与抽样误差
第四章、抽样
一、抽样的意义与作用
1.抽样的意义与作用
人们在研究某个自然现象或社会现象时, 往往会遇到不方便、不可能或不必要对所有的 对象作调查的情况,于是从中抽取一部分对象 作调查,这就是抽样
期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
• =10
•n = 4
•n =16
• = 50 •X
•总体分布
•x
•抽样分布
第四章、抽样
•中心极限定理 (central limit theorem)
• 中心极限定理:设从均值为,方差为 2的一个任意总体 中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近 似服从均值为μ、方差为σ2/n的正态分布
•3
•2.0 •2.5 •3.0 •3.5
•4
•2.5 •3.0 •3.5 •4.0
•P ( x •0. ) 3
•0.2
•0. 1
•0 •1. •1. •2. •2. •3. •3. •4. 0 5 0 5 0 5 0•
•样本均值的抽样分 布
第四章、抽样
•样本均值的分布与总体分布的比较 (例题分析) • 的分布形式与原有总体和样本容量n的大小有关
量n逐渐增大时,样本分布逐渐接近总体的分
布。
•样 本
第四章、抽样
抽样分布(sampling distribution)
n 抽样分布:样本统计量的概率分布,是 一种理论分布。在重复选取容量为n的样 本时,由该统计量的所有可能取值形成 的相对频数分布
n 样本统计量是样本的函数,依据不同的 样本计算出来的值是不同的,所以统计 量是随机变量样本均值, 样本比例,样本 方差等
总统选举真实结果(%)
47.9 49.2 43.3 53.9 59.2 50.8 50.1 61.8 43.5 61.3 50.1 57.8 55.4 49.5 53.8 55.0 62.5
相关文档
最新文档