抽样技术课件
合集下载
抽样与抽样估计课件

抽样与抽样估计课件
$number {01}
目 录
• 抽样的基本概念 • 抽样分布 • 参数估计 • 样本量的确定 • 抽样误差与非抽样误差 • 实际应用案例
01
抽样的基本概念
定义与意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对样本的研究,可以推断出 总体的特征和规律,从而提高研 究效率和准确性。
误差的评估
误差的评估方法包括通过历史数据或置信区间来评估误差的 大小和分布,以及通过对比不同调查方法或不同时间点的调 查结果来评估误差的可控性和稳定性。
06
实际应用案例
市场调查抽样
实施调查
按照抽样计划进行调查,收集所 需数据,并确保数据质量和完整 性。
选择抽样方法
根据调查目的和资源限制,选择 合适的抽样方法,如简单随机抽 样、分层抽样、系统抽样等。
抽样的常见方法
01
随机抽样
按照随机原则从总
体中抽取样本。
02
系统抽样
按照一定的间隔或 顺序从总体中抽取
样本。
04
整群抽样
将总体分成若干群
03
,然后从各群中随
机抽取样本。
分层抽样
将总体分成若干层 ,然后从各层中随
机抽取样本。
抽样的原则与步骤
原则
随机性、代表性、可行性、经济性。
步骤
确定研究目的和总体范围、选择抽样方法、确定样本量和样本分布、实施抽样、 分析样本数据并推断总体特征。
02 抽样分布
随机抽样与概率分布
1 2
3
随机抽样
在统计学中,随机抽样是从总体中选取一部分个体的过程, 每个个体被选中的机会均等且不受其他因素的影响。
$number {01}
目 录
• 抽样的基本概念 • 抽样分布 • 参数估计 • 样本量的确定 • 抽样误差与非抽样误差 • 实际应用案例
01
抽样的基本概念
定义与意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对样本的研究,可以推断出 总体的特征和规律,从而提高研 究效率和准确性。
误差的评估
误差的评估方法包括通过历史数据或置信区间来评估误差的 大小和分布,以及通过对比不同调查方法或不同时间点的调 查结果来评估误差的可控性和稳定性。
06
实际应用案例
市场调查抽样
实施调查
按照抽样计划进行调查,收集所 需数据,并确保数据质量和完整 性。
选择抽样方法
根据调查目的和资源限制,选择 合适的抽样方法,如简单随机抽 样、分层抽样、系统抽样等。
抽样的常见方法
01
随机抽样
按照随机原则从总
体中抽取样本。
02
系统抽样
按照一定的间隔或 顺序从总体中抽取
样本。
04
整群抽样
将总体分成若干群
03
,然后从各群中随
机抽取样本。
分层抽样
将总体分成若干层 ,然后从各层中随
机抽取样本。
抽样的原则与步骤
原则
随机性、代表性、可行性、经济性。
步骤
确定研究目的和总体范围、选择抽样方法、确定样本量和样本分布、实施抽样、 分析样本数据并推断总体特征。
02 抽样分布
随机抽样与概率分布
1 2
3
随机抽样
在统计学中,随机抽样是从总体中选取一部分个体的过程, 每个个体被选中的机会均等且不受其他因素的影响。
抽样技术第七章整群抽样ppt课件

NM
NM
故有 可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc
sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式:
《抽样技术》第七章
1
第七章 整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
2
§7.1 概述
设总体由N个大单元,即初级单元组成,每个初级 单元又由若干个较小的次级单元或二级单元组成。 从总体中按某种方式抽取n个初级单元,观测其中所 包含的所有次级单元。这种抽样称为整群抽样。确 切地说,应称为单阶整群抽样。
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。
抽样技术-课件全-抽样技术-第11章全文

CPS的样本轮换采用的是4—8—4模式,即一个 住户单位在连续的4个月内接受调查,在接下来 的8个月中退出样本,然后再接受连续4个月的调 查,最终退出样本。轮换方案的设计使得具有相 同特征的住户单位替换退出的住户单位。
CPS的样本轮换具有如下主要特征
1.在任何一个月内,都有八分之一的住户单位第一次接受 调查,八分之一的住户单位第二次接受调查,如此下去
2.每个月都有新的样本组代替从样本中永久退出的老样本 组
3.每个月都有一个样本组在8个月的闲置后重新接受调查。 重新接受调查的样本组代替了刚刚退出,进入闲置期的 样本组
4.设计保证了每个样本单元在两个年份的4个相同月份中 接受调查
5.在连续的两个月内,有四分之三的样本是相同的;在连 续的两年中,有二分之一的样本是相同的。
劳动力特征
3. 抽样时以州为总体,因而设计也是以州为总体的设 计
4. 样本量由变异系数CV及可靠性要求所决定 5. 在失业率为6%的自定义下,各州对变异系数的要求 在8%—9%之间。这样就能保证进行全国估计的变异系 数控制在1.8%之内
11.2.2第一阶段的抽样
第一阶段的抽样涉及三个方面的工作。这些工 作是:初级抽样单元(PSU)的界定;将初级抽 样单元PSU分层;PSU的抽选
11.4.5 广义方差(Generalized Variance)
广义方差函数GVF用于产生人口总量x估计值的估计方差。 函数形式为
Var( Xˆ ) aX 2 bX 式中,a和b是用最小二乘法得到的估计参数。该模型的原理是假定x的方差可以表示为简 单随机样本的方差与设计效应(deff)的乘积。设计效应deff是指某一复杂抽样设计相对于
第11章 设计与方法-美国CPS案例
美国人口现状调查(Current Population Survey,简称CPS)被认为是全国性大规模居 民住户抽样调查的典范。
CPS的样本轮换具有如下主要特征
1.在任何一个月内,都有八分之一的住户单位第一次接受 调查,八分之一的住户单位第二次接受调查,如此下去
2.每个月都有新的样本组代替从样本中永久退出的老样本 组
3.每个月都有一个样本组在8个月的闲置后重新接受调查。 重新接受调查的样本组代替了刚刚退出,进入闲置期的 样本组
4.设计保证了每个样本单元在两个年份的4个相同月份中 接受调查
5.在连续的两个月内,有四分之三的样本是相同的;在连 续的两年中,有二分之一的样本是相同的。
劳动力特征
3. 抽样时以州为总体,因而设计也是以州为总体的设 计
4. 样本量由变异系数CV及可靠性要求所决定 5. 在失业率为6%的自定义下,各州对变异系数的要求 在8%—9%之间。这样就能保证进行全国估计的变异系 数控制在1.8%之内
11.2.2第一阶段的抽样
第一阶段的抽样涉及三个方面的工作。这些工 作是:初级抽样单元(PSU)的界定;将初级抽 样单元PSU分层;PSU的抽选
11.4.5 广义方差(Generalized Variance)
广义方差函数GVF用于产生人口总量x估计值的估计方差。 函数形式为
Var( Xˆ ) aX 2 bX 式中,a和b是用最小二乘法得到的估计参数。该模型的原理是假定x的方差可以表示为简 单随机样本的方差与设计效应(deff)的乘积。设计效应deff是指某一复杂抽样设计相对于
第11章 设计与方法-美国CPS案例
美国人口现状调查(Current Population Survey,简称CPS)被认为是全国性大规模居 民住户抽样调查的典范。
《常用的抽样方法》课件

可能会受到随机误差的影响, 导致样本结果不稳定。
非随机抽样的优点和缺点
优点 可以根据研究目的和要求,有针对性地选择样本。
可以利用已有资料或数据进行抽样,节省时间和成本。
非随机抽样的优点和缺点
• 在某些特定情况下,非随机抽样可能更符合实际 情况。
非随机抽样的优点和缺点
缺点 难以控制样本质量和数量,可能导致结果不准确。
但同时也需要研究者具备一定的专业知识和经验。
THANKS
容易受到主观因素的影响,导致样本偏差。 在某些情况下,可能存在抽样难度较大的问题。
不同抽样方法的比较和选择
比较
随机抽样和非随机抽样各有优缺点, 适用于不同的情况和目的。
随机抽样更适用于大规模、全面的调 查,而非随机抽样更适用于有针对性 的调查和研究。
选择
根据研究目的、资源、时间和成本等 因素综合考虑选择合适的抽样方法。
判断抽样
定义
适用范围
判断抽样依据研究者的主观判断和经验选 择样本,通常基于对总体特征的了解和对 样本的初步观察。
适用于总体规模较小、内部差异较大或具 有特定特征的群体。
优点
缺点
能够根据研究目的和范围选择有针对性的 样本。
依赖于研究者的主观判断,可能存在偏见 和误差。
配额抽样
定义
配额抽样是根据总体中某些特征的比例分配一定 数量的样本,以满足特定的代表性要求。
制定调查问卷或指导语
数据收集
根据研究目的设计调查问卷或指导语 ,确保问题清晰、简洁且无歧义。
在调查过程中收集所需的数据,并确 保数据的准确性和完整性。对于无法 直接获取的数据,考虑使用替代方法 进行估算。
实施调查
按照抽样计划进行调查,确保每个样 本单位都有被选中的机会。同时,遵 守伦理和法律规范,保护受访者的隐 私和权益。
抽样技术及样本计算方法课件

• 因此,选择合适的科学的抽样方法和样本显得非 常重要。
PPT学习交流
5
抽样误差
• 指通过调查部分客户,而非全部客户,来估计总 体特征所产生的误差,形成原因在于所选择的特 定样本不能完美地代表总体。这是由于抽样的偶 然性造成的、是不可避免的误差。
PPT学习交流
6
抽样误差与样本量的关系
抽 样 误 差
PPT学习交流
12
随机抽样—简单随机抽样
• 总体中的每一个元素都有一个相等的被抽中概率。 简单随机抽样可以通过抽签法、随机数字表法和 EXCEL随机函数来实现。先确定或搜集一个抽样框, 将抽样框中的每个元素都编上号。然后把所有抽 签抽中的号码的元素或随机数字对应的号码的元 素做为样本进行调查。
• 例如:应用随机数表进行抽样。若想从500名中抽100名,则从数字表 上取出500个数字依次记在卡上,再按随机数目大小排列成序,以其中 连续100名为样本。
• 可能导致高的非抽样误差;
• 涉及费用高。
相对而言,通过严密的设计和实施控制,抽样调查也可用相对低廉
PPT学习交流
3
什么是误差
• 在CSI中,由于各方面因素的作用,调查结果总会 存在误差。通常,调查误差分为两种主要类型:
• 抽样误差 • 非抽样误差
PPT学习交流
4
•误差=抽样误差+非抽样误差
• 总的来说,普查不存在抽样误差,但可能存在较 大的非抽样误差;而抽样调查会产生抽样误差和 非抽样误差。
P靠性是用可重复性来评判的。 • 即随机选取的一组样本再做完全一样的调查,你
会得到同样的结果吗? • 抽样是否可靠主要由样本量大小决定的。而样本
量的大小除了与调查的目的相关,主要由以下五 个方面决定。
PPT学习交流
5
抽样误差
• 指通过调查部分客户,而非全部客户,来估计总 体特征所产生的误差,形成原因在于所选择的特 定样本不能完美地代表总体。这是由于抽样的偶 然性造成的、是不可避免的误差。
PPT学习交流
6
抽样误差与样本量的关系
抽 样 误 差
PPT学习交流
12
随机抽样—简单随机抽样
• 总体中的每一个元素都有一个相等的被抽中概率。 简单随机抽样可以通过抽签法、随机数字表法和 EXCEL随机函数来实现。先确定或搜集一个抽样框, 将抽样框中的每个元素都编上号。然后把所有抽 签抽中的号码的元素或随机数字对应的号码的元 素做为样本进行调查。
• 例如:应用随机数表进行抽样。若想从500名中抽100名,则从数字表 上取出500个数字依次记在卡上,再按随机数目大小排列成序,以其中 连续100名为样本。
• 可能导致高的非抽样误差;
• 涉及费用高。
相对而言,通过严密的设计和实施控制,抽样调查也可用相对低廉
PPT学习交流
3
什么是误差
• 在CSI中,由于各方面因素的作用,调查结果总会 存在误差。通常,调查误差分为两种主要类型:
• 抽样误差 • 非抽样误差
PPT学习交流
4
•误差=抽样误差+非抽样误差
• 总的来说,普查不存在抽样误差,但可能存在较 大的非抽样误差;而抽样调查会产生抽样误差和 非抽样误差。
P靠性是用可重复性来评判的。 • 即随机选取的一组样本再做完全一样的调查,你
会得到同样的结果吗? • 抽样是否可靠主要由样本量大小决定的。而样本
量的大小除了与调查的目的相关,主要由以下五 个方面决定。
简单随机抽样PPT课件

误差可控
通过计算样本量,可以控制抽样误差在可接 受的范围内。
操作简便
简单随机抽样方法相对简单,易于实施和操 作。
适用于各种类型的数据
简单随机抽样适用于各种类型的数据,如定 量数据和定性数据。
缺点
样本量较大时实施困难
当总体样本量较大时,简单随机抽样 需要大量的时间和资源来实施。
对总体分布敏感
如果总体分布不均匀,简单随机抽样 的代表性可能会受到影响。
详细描述
在市场调研中,企业或机构通常会采用简单随机抽样方法来选取一定数量的样 本,然后通过问卷调查、电话访问等方式收集数据,以了解市场趋势、消费者 偏好和竞争情况等信息。
学术研究案例
总结词
学术研究领域中,简单随机抽样被广泛应用于社会学、心理学、经济学等学科, 以验证假设和得出科学结论。
详细描述
在学术研究中,研究者通常会采用简单随机抽样方法来选取样本,然后通过实验 、调查等方式收集数据,以验证假设和得出科学结论。这种方法有助于提高研究 的可靠性和有效性。
02
简单随机抽样的方法
抽签法
定义:抽签法是将总体中的每一个单位分别写在签上, 并放入一个容器中充分搅拌,然后从中随机抽取若干个 签,对应签上的单位即为被抽取的单位。 步骤
2. 从容器中随机抽取若干个签。
适用范围:适用于总体容量较小,或者虽然总体容量较 大,但总体结构简单,各单位间差异不大的情况。
产品测试与改进
通过简单随机抽样,选取一部分 消费者作为测试对象,了解他们 对产品的反馈和意见,以便对产 品进行改进或优化。
人口普查
统计人口数据
在人口普查中,简单随机抽样被广泛 应用于统计人口数量、年龄、性别、 教育程度等数据,为政府制定政策和 规划提供依据。
通过计算样本量,可以控制抽样误差在可接 受的范围内。
操作简便
简单随机抽样方法相对简单,易于实施和操 作。
适用于各种类型的数据
简单随机抽样适用于各种类型的数据,如定 量数据和定性数据。
缺点
样本量较大时实施困难
当总体样本量较大时,简单随机抽样 需要大量的时间和资源来实施。
对总体分布敏感
如果总体分布不均匀,简单随机抽样 的代表性可能会受到影响。
详细描述
在市场调研中,企业或机构通常会采用简单随机抽样方法来选取一定数量的样 本,然后通过问卷调查、电话访问等方式收集数据,以了解市场趋势、消费者 偏好和竞争情况等信息。
学术研究案例
总结词
学术研究领域中,简单随机抽样被广泛应用于社会学、心理学、经济学等学科, 以验证假设和得出科学结论。
详细描述
在学术研究中,研究者通常会采用简单随机抽样方法来选取样本,然后通过实验 、调查等方式收集数据,以验证假设和得出科学结论。这种方法有助于提高研究 的可靠性和有效性。
02
简单随机抽样的方法
抽签法
定义:抽签法是将总体中的每一个单位分别写在签上, 并放入一个容器中充分搅拌,然后从中随机抽取若干个 签,对应签上的单位即为被抽取的单位。 步骤
2. 从容器中随机抽取若干个签。
适用范围:适用于总体容量较小,或者虽然总体容量较 大,但总体结构简单,各单位间差异不大的情况。
产品测试与改进
通过简单随机抽样,选取一部分 消费者作为测试对象,了解他们 对产品的反馈和意见,以便对产 品进行改进或优化。
人口普查
统计人口数据
在人口普查中,简单随机抽样被广泛 应用于统计人口数量、年龄、性别、 教育程度等数据,为政府制定政策和 规划提供依据。
抽样调查第2章简单随机抽样ppt课件

记录样本
将读取到的随机数对应的个体作为样本,并记录其编号。
计算机模拟法
编号
选择随机数生成器
设置参数
生成随机数
筛选样本
将总体的个体编号,并将 编号数据输入计算机。
在计算机中选择一个合适 的随机数生成器。
根据需要设置随机数生成 器的参数,如生成随机数 的范围、数量等。
使用随机数生成器生成 一定数量的随机数。
详细记录每个被抽中样本的信息和特征,如 姓名、性别、年龄、职业等。
处理异常情况
保密原则
如遇到无法联系或拒绝接受调查的样本,需 按照预先设定的方案进行处理,如替换或重 新抽取等。
在整个抽样过程中,需严格遵守保密原则, 确保被调查者的隐私不被泄露。
05
数据分析与结果解读
数据整理与初步分析
1 2
数据来源与采集方式
根据生成的随机数,从总 体中筛选出对应的个体作 为样本,并记录其编号。 如果需要,还可以对样本 进行进一步的处理和分析。
03
样本容量确定与误差控制
样本容量确定原则及方法
原则
在满足调查精度和可靠性的前提下, 尽可能减少样本容量,以节约成本和 提高效率。
方法
根据总体大小、总体方差、调查精度要 求等因素,采用适当的统计公式或经验 法则来确定样本容量。
01
介绍点估计和区间估计的概念、方法和应用场景,并比较其优
缺点。
假设检验的基本原理
02
阐述假设检验的基本原理和步骤,包括原假设和备择假设的设
定、检验统计量的选择、显著性水平的确定等。
常用统计检验方法
03
介绍常用的统计检验方法,如t检验、F检验、卡方检验等,并
说明其应用场景和注意事项。
将读取到的随机数对应的个体作为样本,并记录其编号。
计算机模拟法
编号
选择随机数生成器
设置参数
生成随机数
筛选样本
将总体的个体编号,并将 编号数据输入计算机。
在计算机中选择一个合适 的随机数生成器。
根据需要设置随机数生成 器的参数,如生成随机数 的范围、数量等。
使用随机数生成器生成 一定数量的随机数。
详细记录每个被抽中样本的信息和特征,如 姓名、性别、年龄、职业等。
处理异常情况
保密原则
如遇到无法联系或拒绝接受调查的样本,需 按照预先设定的方案进行处理,如替换或重 新抽取等。
在整个抽样过程中,需严格遵守保密原则, 确保被调查者的隐私不被泄露。
05
数据分析与结果解读
数据整理与初步分析
1 2
数据来源与采集方式
根据生成的随机数,从总 体中筛选出对应的个体作 为样本,并记录其编号。 如果需要,还可以对样本 进行进一步的处理和分析。
03
样本容量确定与误差控制
样本容量确定原则及方法
原则
在满足调查精度和可靠性的前提下, 尽可能减少样本容量,以节约成本和 提高效率。
方法
根据总体大小、总体方差、调查精度要 求等因素,采用适当的统计公式或经验 法则来确定样本容量。
01
介绍点估计和区间估计的概念、方法和应用场景,并比较其优
缺点。
假设检验的基本原理
02
阐述假设检验的基本原理和步骤,包括原假设和备择假设的设
定、检验统计量的选择、显著性水平的确定等。
常用统计检验方法
03
介绍常用的统计检验方法,如t检验、F检验、卡方检验等,并
说明其应用场景和注意事项。
抽样技术(第5版)课件PPT课件第2章

n i 1
n i j
1 n N
1 n(n 1)
2 (Yi Y ) 2 2
(Yi Y )(Y j Y )
n N i 1
n N ( N 1) i j
n 1 N
n 1 N
1 N
n 1
2
2
(Yi Y )
(Yi Y ) 2
1.5
4.5
10
平均
5
6
5.5
2.5
0.5
3
0
6.5
方差1.95
y -Y
2
证明 性质1
对于固定的有限总体,估计量的期望是对所有可能样本求平均得
到的,因此
y y1 y 2 y n
E y n
CN
nCNn
总体中每个特定的单元
在不同的样本中出现的次数。C n 1
小写符号表示样本的标志值
符号
总
1
Y
N
体
Y1 Y2 YN
Y
i
N
i 1
N
N
Y Yi Y1 Y2 YN
i 1
A 1
P
N N
N
Y Yi 0或1
i 1
i
1 N
N
2
S
Y
Y
2
i
N 1 i 1
N 1
2
样
y y2 yn
i 1
n
i 1
y
x
n i j
1 n N
1 n(n 1)
2 (Yi Y ) 2 2
(Yi Y )(Y j Y )
n N i 1
n N ( N 1) i j
n 1 N
n 1 N
1 N
n 1
2
2
(Yi Y )
(Yi Y ) 2
1.5
4.5
10
平均
5
6
5.5
2.5
0.5
3
0
6.5
方差1.95
y -Y
2
证明 性质1
对于固定的有限总体,估计量的期望是对所有可能样本求平均得
到的,因此
y y1 y 2 y n
E y n
CN
nCNn
总体中每个特定的单元
在不同的样本中出现的次数。C n 1
小写符号表示样本的标志值
符号
总
1
Y
N
体
Y1 Y2 YN
Y
i
N
i 1
N
N
Y Yi Y1 Y2 YN
i 1
A 1
P
N N
N
Y Yi 0或1
i 1
i
1 N
N
2
S
Y
Y
2
i
N 1 i 1
N 1
2
样
y y2 yn
i 1
n
i 1
y
x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Wh
S
2 h
若各层方差相同,即
S
2 h
S
2 w
则V
(
yst)1nfS
2 w
回到简单随机抽样,分层没有作用。
总量估计:
比例估计:
Yˆst Nyst
V (Yˆst ) N 2V ( yst )
Nh (Nh
nh )
S
2 h
nh
L
Pˆst W hPh
V (Pˆst )
1 N2
N
2 h
(
N
h
1. 不同分配方式 n 300
层 Wi Si 常 数 分 配 1 0.2 20 100
与 Si2成 正 比
49
2 0.3 30 100
110
与 Wi成 正 比
60
90
3 0.5 34 100
141
150
n
300
300
300
内曼分配
40 90 170
300
V ( y)
3.86
3.11
3.09
3.00
1. 常数分配,实际中采用不多;
2.
与S
2 i
成正比;
3. 与Wi 成正比,按比例分配,常采用
ni
n Ni N
nWi
4. 内曼分配
ni n
Ni Si n Wi Si
Ni Si
Wi Si
最优分配
分配样本量时考虑费用因素
费用函数C C0 niCi
yst
L
Wh yh
1 N
Nh yh
Wh
Nh N
V ( yst )
Wh2
S
2 h
nh
(1
fh)
L
Wh2
Sh2 nh
L
Wh Sh2 N
式中:
fh
nh Nh
,
S
2 h
1 Nh 1
Nh i 1
(Yhi
Yh )2
若采用比例抽样,即nh
n.
Nh N
, 将此代入前式
则:V
(
yst
)
1
n
f
抽样技术与方法
学分:2 课时 10:00——11:30 教科书:抽样:理论与应用(高教出版社) 参考书:抽样:设计与分析 60元 主要问题:学生不同的知识背景 处理:前快后慢 学习方式:讲授与讨论 考试方式:平时30%,期末考试70%
第一章 基本概念
调查步骤
一个完整的调查包括几个阶段性的工作。 1. 调查目标确定
N
(1-f):finite population corrections——fpc
有限总体校正系数
Total
Yˆ Ny Var(Yˆ) Var(Ny) N 2Var( y)
proportion
1 Yi 0
如果单位 i 具备某特征 如果单位 i 不具备某特征
P A 1 NN
N
Yi Y (总体)
特点与作用
2. 非概率抽样
(1)方便选样 (2)目的选样 (3)自愿样本 (4)配额选样
特点
四、 等概抽样与不等概抽样
1. 等概抽样 2. 不等概抽样
五、抽样误差与非抽样误差
1. 抽样误差
• 可以计算 • 可以控制
2. 非抽样误差
(1)抽样框误差 (2)无回答误差 (3)计量误差
六. 有关方差的概念
SRS Without replacement wor
现实中通常以wor为主体。 当总体规模 N 很大时,二者没有什么区别,但wr样本单元 之间独立,构造估计量要方便一些。
一.基本概念
1. 简单随机抽样概念: 属于等概率抽样
2. WOR定义 样本组合数:
(
N n
)
=
N! n!(N n)!
每个样本被抽中的概率:
一. 基本问题
什么是分层随机抽样 ? N N1 N2 NL
n n1 n2 nl
作用:可以对各层的参数进行估计,有助于提高估计精度。
应用条件:各层差异较大, 有进行分层的辅助信息。
分层原则 • 层内方差尽可能小 • 层间方差尽可能大
应用特点:在层内可采用不同的抽样方法。
二 分层抽样基本公式: 均值:
P(S)=
1
(
N n
)
每个单元被选入样本的概率
P(i)=
(11
)(
N 1 n1
)
=
(
N n
)
n N
二 基本公式
Mean
Y 1 N
N
Yi
y 1 n
n
yi
1 n
N
i yi
i =
1 0
is is
性质:
E(y) Y
Var( y) (1 f ) S 2
n
f n (Sampling fraction 抽样比)
总体方差: S (Y Y )2
N 1
样本方差: s ( y y)2
n 1
抽样方差(估计量方差)
S2 V ( y) (1 f )
n
抽样方差估计 v( y) (1 f ) s2 n
七、精度与费用
100%
精 95% .………….. 度
…….
60%
20%
40%
费用
第二章 简单随机抽样
Simple Random Sampling (SRS) With replacement wr
nh ).
phqh
Nh 1
nh
当
Nh
很大,N h
-1
N
时
h
V (Pˆst )
Wh2 ph qh nh
(1
fh)
若估计具有某特征的单位总数A
L
Aˆst N.Pˆst N h Ph
V ( Aˆst )
Nh (Nh nh ) nh 1
phqh
如估计不同年龄组智力残疾儿童的人数
三.各层中样本单位数的分配
一、总体与样本 1. 总体 2. 样本
样本:集合的概念(与总体对应)
样本单元:样本中的基础元素(与总体单元对应)
初级单元,二级单元,……最终单元
样本量:样本单元的数量(与总体规模对应)
二、目标总体与抽样总体 1. 目标总体 2. 抽样总体 3. 抽样框
良好抽样框的标志
三、概率抽样与非概率抽样
1. 概率抽样
属于调查策划。明确通过调查所要获取的信息,确定调查内容,决定 向谁进行调查(确定调查对象) 2. 调查问卷设计 3. 抽样设计 4. 调查方式(数据收集)确定 5. 数据编码与录入
6. 数据审核与插补 7. 数据估计(包括权数确定,计算置信区间) 8. 调查结果表述(调查报告)
抽样设计中涉及一些概念
0, n n0,wr 与 wor 几乎没有区别。
三. 有关问题 1 样本的抽选
* 随机数字表 * 计算机抽取
2 总体方差的预先估计
计算样本量需要总体方差
历史资料 预调查 两步抽样
两步抽样 第一步:先抽n1个单位用来估计S2,进而确定n 第二步:在抽其余的n-n1个单位
第三章 分层抽样(Stratified Sampling)
N
其中 Yi A
Pˆ a y n
由于S 2 n pq n 1
Var(Pˆ) (1 f ) 1 n pq (1 f ) pq
n n 1
n 1
Sample Size
n n0 1 n0 N
n0为重复抽样条件下的样本量
t2S2 n0 2
n0
( ts rY
)2
(tc)2 r
当N很大时,n0 N