中国综合社会调查抽样设计方案
抽样方案都有哪些

抽样方案都有哪些引言在统计学和市场调研等领域中,我们通常需要对一个庞大的总体进行调查和分析。
然而,由于时间和资源的限制,我们往往无法对整个总体进行全面的调查。
这时候,我们需要使用抽样方案,从总体中选择一个相对较小的样本来进行研究和推断。
本文将讨论一些常见的抽样方案。
简单随机抽样简单随机抽样是最常见和最根本的抽样方案之一。
它的特点是从总体中按照随机的方式选择样本,每个样本被选择的概率相等且独立。
简单随机抽样通常需要使用随机数生成器来实现。
例如,在一次市场调研中,我们希望调查一组消费者的购置行为。
我们可以使用简单随机抽样,从总体中随机选择一局部消费者来进行调查。
系统抽样系统抽样是另一种常见的抽样方案,它是一种有系统地选择样本的方法。
在系统抽样中,我们首先确定一个固定的间隔,然后从总体中选择一个起始点,之后按照固定的间隔选择样本。
例如,假设我们有一个装满产品的生产线。
我们可以使用系统抽样,每隔一定间隔选择一件产品来进行质量检验。
分层抽样分层抽样是基于总体的某些特征对总体进行分层,然后在每个层中进行抽样的方法。
这种方法可以提高样本的代表性和效率。
例如,我们想了解一个国家的电视收视率情况。
我们可以将总体分为城市和农村两个层次,然后在每个层次中分别进行抽样调查,以获取更全面的数据。
整群抽样整群抽样是将总体划分为假设干个相似的群体〔或称簇〕,然后随机选择一局部群体进行调查。
在每个选中的群体中,我们选择所有个体作为样本。
例如,我们想研究一个学校的学生体育锻炼情况。
我们可以将学生按班级分为假设干个群体,然后随机选择几个班级进行调查,调查所有被选中班级的所有学生。
效应抽样效应抽样是一种特殊的抽样方案,它根据疑心变量〔被选样本对某个变量产生特定的影响〕选择样本。
例如,我们想了解某种新的药物对患者心率的影响。
我们可以先选择一些有心脏病的患者作为样本,然后观察他们再使用药物后的心率变化情况。
概率比例抽样概率比例抽样是根据总体中每个个体所占比例来选择样本的方法。
抽样调查项目计划书范文

抽样调查项目计划书一、项目名称社会心态调查二、项目概述本次项目是为了深入探讨社会心态现状,以及了解广大民众的思想倾向和信仰观点,为政府和社会提供更加客观的数据支持。
本次项目将采用抽样调查的方式,对广大民众进行相关问卷调查,并将结果进行统计分析,形成一份分析报告。
三、项目目的通过本次社会心态调查,达到以下目的:1.了解广大民众的家庭状况、人生观和价值观,探究当今社会的发展趋势;2.研究民众对于社会问题的态度和看法,并发现存在的问题;3.为政府和企业提供决策支持,为社会发展提供有价值的数据和参考建议。
四、项目计划1.研究和策划针对本次社会心态调查,我们的团队需要根据市场需求和社会环境,制定相关调查方案和问卷模板。
这个阶段需要我们的团队进行充分的市场调研和分析,制定出具有代表性的抽样方案。
2.实施调查本次社会心态调查将采用随机抽样的方式,选取2,000名样本对象进行调查。
我们将派遣专业的调查员前往各个城市和乡村地区,通过面对面和网络问卷的方式,进行调查工作。
调查的时间将定为2个月。
3.数据归档与处理本次的调查结果将会形成大量的数据,我们需要通过各种手段对数据进行归档和处理。
这个过程需要我们的团队的专业技术水平有一定保障,同时需确保数据的保密性。
4.统计分析和报告撰写对于收集到的数据,我们还需要进行统计分析和报告的撰写。
这个过程需要我们的团队有较高的统计分析能力,同时要求分析报告的内容表述清晰、简洁明了,能够为政府和企业提供有价值的参考建议。
五、项目组织架构本项目将设置以下组织架构:1.项目负责人:负责项目的整体工作进度把控,协调各部门关系。
2.调查员:负责实施调查,收集和整理数据。
3.数据处理员:负责数据的归档和清晰,保证数据的安全性和保密性。
4.分析师:负责对数据进行分析和撰写分析报告。
六、预算及投资回收期1.预算及投资回收期本项目的预算总额为100万人民币,其中包括调查人员的出行费、住宿费、工资以及数据分析人员和分析师的劳务费用。
社会调查研究方法教案第章 抽样

第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(samplingunit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(samplingframe)又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。
[高等教育]现代社会调查 第四章 抽样
![[高等教育]现代社会调查 第四章 抽样](https://img.taocdn.com/s3/m/659306be6bec0975f465e2f8.png)
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
抽样调查项目计划书

抽样调查项目计划书项目名称:抽样调查项目项目目标:1. 进行精确的抽样调查,以获取代表性的数据样本。
2. 分析和解读调查结果,获得对目标群体的深入了解。
3. 提供基于调查结果的决策支持和建议。
项目背景:在许多领域,抽样调查被广泛应用于数据收集和分析。
通过采用合适的调查方法和样本规模,可以通过统计分析获得对整个群体的准确估计。
本项目旨在根据特定目标群体进行抽样调查,以获取有关该群体的重要信息。
项目范围:1. 定义目标群体:明确项目研究的目标群体,并进行相关背景研究和分析。
2. 设计调查问卷:根据目标群体的特点和研究目标,设计合适的调查问卷。
3. 抽样方法:选择合适的抽样方法,以确保样本的代表性和有效性。
4. 数据收集:通过在线调查、面访、电话调查等方式收集调查数据。
5. 数据分析:对收集到的数据进行统计分析和解读,以得出有关目标群体的重要结论。
6. 报告撰写:根据调查结果撰写清晰、详细的报告,包括调查目的、样本描述、调查结果和建议。
项目资源:1. 人力资源:项目经理、调查员、数据分析师等。
2. 调查工具:包括问卷设计软件、调查平台等。
3. 数据分析工具:包括统计软件、数据可视化工具等。
4. 资金资源:用于调查问卷的设计、数据收集和分析等。
项目计划:1. 确定项目目标和范围。
2. 进行目标群体的背景研究和分析。
3. 设计调查问卷,并进行测试和修正。
4. 选择合适的抽样方法,并确定样本规模。
5. 执行调查,并进行数据收集。
6. 对收集到的数据进行统计分析和解读。
7. 撰写调查报告,并进行内部审核和修改。
8. 最终报告的提交和汇报。
项目风险管理:1. 抽样误差:可能由于抽样方法选择不当或样本规模不足而导致抽样误差。
2. 数据收集困难:可能由于目标群体的难以接触或不愿意参与调查而导致数据收集困难。
3. 数据分析错误:可能由于分析方法选择不当或统计分析错误而导致数据分析错误。
4. 时间和资源限制:项目进展可能受到时间和资源限制的影响。
中国综合社会调查(CGSS)

中国综合社会调查(CGSS)第二期(2010-2019)抽样方案目录一、调查背景 (3)二、调查目标总体 (3)三、抽样设计原则 (3)四、抽样设计中的几个问题 (4)(一)关于分层 (4)(二)各阶段抽样单元 (4)(三)样本量的界定及分配 (5)五、具体设计 (6)(一)必选层的样本抽取 (6)(二)抽选层的样本抽取 (8)六、最终样本的构成 (10)七、样本权数的确定 (10)(一)设计权数 (10)(二)实际执行情况调整 (11)(三)最终权数的确定 (11)八、主要估计量 (11)(一)各小层内部目标量的估计 (12)(二)全国目标量的估计 (13)九、估计量的方差估计 (14)十、附录:抽选层100个样本初级单元 (16)中国综合社会调查抽样设计方案(2010)一、调查背景我国是世界上人口最多的国家,随着我国市场经济的发展,社会正在发生巨大的变革,经济发展使得对全国社会多方面信息的需求日益突出。
及时、全面、客观地了解我国收入、医疗卫生、教育、失业保障等方面的信息,将为国家宏观调控政策的制定和企业的更好发展提供保障,对于促进城乡社会的协调发展、保持国民经济可持续发展都有着重大的现实意义。
中国综合社会调查是一项全国性的大型调查项目,调查总体是全国城镇居民和农村居民。
本次调查的总体要求:(1)能够全面了解我国城乡社会发展情况;(2)能够对城市群体和农村群体进行对比分析;(3)能够在地理概念或者区域发展水平方面体现我国社会发展的地域差异性。
本方案着重介绍此次调查项目的抽样方案设计以及样本数据的权数调整方法。
设计方案充分考虑了全国及不同地域估计的需要,对调查总体进行了科学、细致的分层,在一定程度上提高了估计精度;特别是在城乡样本配比、设立自我代表层、样本数据加权等问题的处理上体现了本方案的科学性、高效性、可操作性等特点。
二、调查目标总体此次调查的目标总体为全国31个省、自治区、直辖市(不含港澳台)的所有城市、农村家庭户。
社会调查问卷如何抽样分析

社会调查问卷如何抽样分析社会调查问卷是一种常用的社会科学研究工具,通过收集大量的调查数据来了解社会现象及其相关因素。
然而,在进行社会调查时,研究者往往很难对整个人群进行全面调查,因此需要采用抽样方法来代表整体人群进行分析。
下面将介绍一些常见的抽样方法及其分析原理。
首先,简单随机抽样是最基本的抽样方法之一。
在进行调查时,研究者从总体中随机选择一定数量的样本进行调查。
这种抽样方法的优点是简单易行,样本具有代表性。
在分析时,可以使用统计学中的方法,如平均数、比例等,来推断整体人群的特征。
其次,系统抽样是另一种常用的抽样方法。
研究者将总体按照一定的规则排列,然后从中随机选择一个起始点,然后按照固定的间隔选择样本。
这种抽样方法适用于总体有一定的规律性分布的情况。
在分析时,可以根据样本的特征,进行类似于简单随机抽样的分析。
另外,分层抽样也是常见的抽样方法之一。
研究者将总体按照某些特征进行分层,然后从每个层中随机选择一定数量的样本进行调查。
这种抽样方法可以保证不同层次的样本都能得到充分的代表性。
在分析时,可以对每个层次进行单独的分析,并综合得出整体人群的特征。
此外,整群抽样是一种适用于特定情况的抽样方法。
研究者将总体分为若干个互不重叠的群体,然后随机选择一部分群体进行调查。
这种抽样方法适用于群体内部差异较小的情况。
在分析时,可以根据群体的特征进行分析,并推断整个总体的特征。
最后,需要强调的是,不同的抽样方法适用于不同的调查对象和研究目的。
在实际应用中,研究者应根据具体情况选择合适的抽样方法,并且在分析时要注意样本的代表性和可靠性。
同时,还应注意抽样误差的控制,以提高研究结果的准确性和可信度。
总之,社会调查问卷的抽样分析是一项重要的研究工作。
通过合理选择抽样方法,并在分析时考虑样本的代表性和误差控制,可以提高研究结果的可靠性和有效性。
希望本文能对读者理解和应用社会调查问卷的抽样分析方法有所帮助。
中国人民大学抽样设计综合社会抽样调查方案共41页

Discussion——stratification
Consideration
➢Economic level ➢Educational level ➢Degree of openness
Self-representative
➢Futher stratification
selected category
Other regions excluding the self-representatives
Discussion——stratification
Consideration
➢District level(and country level
3. Sampling Method
➢ Three-Stage stratified probability sampling ➢ A respondents selected randomly from the ultimate unit (household)
Outline
1 Background 2 Discussion 3 Sampling Design 4 The Final Sample
Discussion——stratification
Consideration
➢District level and country level
selected category Other regions excluding the self-representatives
cluster analysis
To make comparisions
between urban and rural groups
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国综合社会调查(CGSS)第二期(2010-2019)抽样方案目录一、调查背景 (3)二、调查目标总体 (3)三、抽样设计原则 (3)四、抽样设计中的几个问题 (4)(一)关于分层 (4)(二)各阶段抽样单元 (4)(三)样本量的界定及分配 (5)五、具体设计 (6)(一)必选层的样本抽取 (6)(二)抽选层的样本抽取 (8)六、最终样本的构成 (10)七、样本权数的确定 (10)(一)设计权数 (10)(二)实际执行情况调整 (11)(三)最终权数的确定 (11)八、主要估计量 (11)(一)各小层内部目标量的估计 (12)(二)全国目标量的估计 (13)九、估计量的方差估计 (14)十、附录:抽选层100个样本初级单元 (16)中国综合社会调查抽样设计方案(2010)一、调查背景我国是世界上人口最多的国家,随着我国市场经济的发展,社会正在发生巨大的变革,经济发展使得对全国社会多方面信息的需求日益突出。
及时、全面、客观地了解我国收入、医疗卫生、教育、失业保障等方面的信息,将为国家宏观调控政策的制定和企业的更好发展提供保障,对于促进城乡社会的协调发展、保持国民经济可持续发展都有着重大的现实意义。
中国综合社会调查是一项全国性的大型调查项目,调查总体是全国城镇居民和农村居民。
本次调查的总体要求:(1)能够全面了解我国城乡社会发展情况;(2)能够对城市群体和农村群体进行对比分析;(3)能够在地理概念或者区域发展水平方面体现我国社会发展的地域差异性。
本方案着重介绍此次调查项目的抽样方案设计以及样本数据的权数调整方法。
设计方案充分考虑了全国及不同地域估计的需要,对调查总体进行了科学、细致的分层,在一定程度上提高了估计精度;特别是在城乡样本配比、设立自我代表层、样本数据加权等问题的处理上体现了本方案的科学性、高效性、可操作性等特点。
二、调查目标总体此次调查的目标总体为全国31个省、自治区、直辖市(不含港澳台)的所有城市、农村家庭户。
三、抽样设计原则首先,作为全国性的抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区具有代表性。
其次,抽样方案必须保证具有较高的效率,即在相同的样本量条件下,方案设计应使抽样误差尽可能小,调查精度尽可能高。
最后,方案必须具有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。
四、抽样设计中的几个问题(一)关于分层根据本次调查的研究需要,将调查总体分为两大类:一是必选层,该层总体为入选大城市的市辖区家庭户;二是抽选层,该层总体为除去必选层市辖区以外全国所有家庭户。
1、必选层根据调查需要及以往调查经验,本次调查对那些发展处于国内领先水平的大城市将特殊对待,将该类城市市辖区家庭户作为单独一层进行设计,作为必选层。
对于大城市的界定,着眼于直辖市、省会城市和副省级城市共36座城市,从经济水平、教育水平及城市开放性程度等角度出发,选取GDP、拥有教师总数、外国直接投资(FDI)实际使用外资金额这三个总量指标进行考察,采用因子分析方法确定排名前五的城市进入必选层。
需要特别说明的是:该层的调查对象为这些城市的市辖区居民,该层最终调查单元均划为城市家庭户。
2、抽选层抽选层的调查总体由必选层以外的城市、农村家庭户组成。
为了便于在后期数据分析中采用平衡半样本进行方差估计,对初级抽样单元的分层划分打破省级地域限制,进一步增加分层的层数。
将抽选层划分为区层和县层(包含县级市和县),采用人口密度、非农业人口比重和人均地区生产总值三个指标,在区层和县层中分别进行因子分析,得到区层和县层内各个区县的综合因子得分;在对综合因子得分进行排名的基础上将区层进一步分为19层,县层划进一步分为31层,抽选层共计细分划分为50个层。
(二)各阶段抽样单元本次调查采用分层三阶段概率抽样,视所在层情况,各阶段抽样单元略有不同,详见表1。
表1 各阶段抽样单元这样设计的原因在于:对于必选层,选择街道作为初级抽样单元可以细化抽样框,使得样本点相对分散,有利于总体信息的采集,避免由于抽样框过粗而导致样本有偏。
对于抽选层,全国区、县级市、县的数量较多,以其作为初级抽样单元比较合适。
(三)样本量的界定及分配1、目标样本量目标样本量是指在一定精度要求下,实现调查目标所必需的样本量。
根据以往调查经验,本次调查设定目标样本量为12000户,其中必选层2000户,抽选层10000户。
后续部分涉及的样本量分配均立足于目标样本量。
2、各阶段样本量分配由于必选层与抽选层设计的各阶段抽样单元略有不同,因此,分别介绍两者各阶段样本量的分配。
对于必选层,该层总样本量为2000户,计划抽取40个初级抽样单元(街道),每个初级抽样单元(PSU)抽取2个二级抽样单元(居委会),每个二级抽样单元(SSU)中抽取25个家庭户。
对于抽选层,该层总样本量为10000户,计划抽取100个PSU(区、县级市、县),每个PSU中抽取4个SSU(居委会、村委会),每个居委会(村委会)中抽取25个家庭户。
最终,本方案共需抽取140个PSU,480个SSU。
3、样本城乡分配为了能切实反映全国范围城乡社会的真实情况,并在后续研究中能够对城乡进行对比研究,需要保证样本在城乡分配上与实际情况一致。
首先明确本方案中的城乡样本概念,本方案设计基于这样的假设:居委会的家庭户为城市居民,村委会的家庭户为农村居民。
统计资料显示,目前我国城市常住人口数与农村常住人口数基本持平,由于城市居民主体的各方面差异相对明显,方差较大,因此将样本量的城乡分配比例确定为6∶4。
根据第一阶段样本量的分配结果,必选层中共抽取80个居委会,共计2000户,因此抽选层内城乡家庭户数需分别为5200和4800户才能满足6:4的要求。
由于抽选层每个PSU下抽取4个SSU(居委会或村委会),每个SSU内最终抽样单元的目标样本量均为25,因此对城乡样本比例的控制,主要是使得抽选层居委会与村委会下的城乡样本比例达到5200:4800,也即抽选层中的居委会与村委会样本个数比约为208:192。
为了实现样本二级单元208:192的目的,需要根据样本初级单元的城市化水平(非农业人口比重)分配样本居委会和村委会的数量。
这里采用分别在区层和县层样本初级单元内,根据各个区县的城市化水平(用非农人口比重表示)进行分段,形成若干个区间,然后根据不同的区间对样本区县中的居委会、村委会个数进行分配的方法来实现样本居委会和村委会的比例要求。
4、接触样本量如果回答率达到100%,则调查时需要的接触样本量即为有效样本量,但现实中无回答现象不可避免。
要克服这个困难,可以采取替换样本的方法,但样本替换在实际操作中存在缺陷,因此本方案采取利用膨胀系数扩大样本量的方法,对第三阶段样本量进行放大。
根据往年调查经验,发达城市的市辖区居民由于种种原因,回答率在50% 左右,即膨胀系数在2左右,因此在必选层每个二级单元抽取50户家庭,该层接触样本量扩大至4000;抽选层的居民群体回答率高于必选层,但其内部还有差异,大体上城市居民的回答率在65% 左右,农村居民的回答率高于城市居民,大致在85%左右,因此,对于抽选层,在每个居委会抽取38户,在每个村委会内抽取30户。
五、具体设计(一)必选层的样本抽取1、必选层入样城市的确定首先对全国36座城市(包括直辖市、省会城市、副省级城市)市辖区的GDP 、拥有教师总数、外国直接投资(FDI )实际使用外资金额这三项指标进行因子分析,最终确定5个城市进入必选层。
这里给出进行因子分析之后,综合得分排名前五的城市名单(见表2)。
表2 36座城市中前5座城市2、初级单元的抽取根据最新的全国行政规划,这5座城市市辖区总数为67个,如果以67个市辖区为初级阶段抽样框,初级单元个数有限,可能会导致样本在分布上过于集中,影响样本对该层总体的代表性,为了使样本点分布较为分散,将初级抽样单元细化为街道,由此,必选层的抽样框为入选城市市辖区的街道,且该层人口规模均只采用城市人口。
以必选层入选城市市辖区的街道作为抽样框,以各街道的城市人口规模为辅助信息,采取与人口规模成比例的PPS 抽样抽取40个街道作为该层的PSU ,这里:最终抽样单元为家庭户,理论上应该以街道的户数作为辅助信息,但目前这方面信息缺乏,因而用街道人口数作近似处理。
具体步骤说明如下:设共有N 个初级单元(街道),第i 个初级单元的人口规模为i M (1,2,,i N =),首先按地理区域将街道进行排序并产生累计人口数列,即排序第一位二级抽样单元为1M ,对应的累积人口为1M ;排序第二位的单元人口数为2M ,对应的累积人口为12M M +,依次进行,则排序第i 的单元对应的人口数为i M ,对应的累积人口为1i i j M =∑(1,2,,i N =),需要注意的是:这里的i 是指排序后单元对应序号。
接下来,对第一个单元赋以11M ~共1M 个代码;对第二个单元赋以1121M M M +~+共2M 个代码,……,对第i 个单元赋以1111i i j j j j MM -==+~∑∑共i M 个代码,人口总数为01N i i M M ==∑。
若已知初级单元样本量为n ,则首先可以确定抽样间隔k ,理论上0M k n =,实际中一般取最接近于0M n的整数。
接下来从1k ~范围内随机地产生一个整数r 作为抽样起点,则代码为,,,(1)r r k r n k ++-所对应的单元即为被抽中的初级单元,且第i 个抽样单元被抽中的概率为0i i M Z M =。
3、二级单元的抽取在确定初级抽样单元(街道)后,二级单元抽样框为样本街道内所有居委会名单,同时收集各个居委会人口数。
二级单元的抽取方法:在入选街道内,采用与各居委会人口规模成比例的系统PPS 抽样抽取2个居委会。
具体抽取过程同初级单元部分。
4、最终单元的抽取最终单元的抽取在每个入选的居委会中进行,在每个居委会内,按家庭户的门牌号进行排序,采取等概率系统抽样抽出50户家庭作为最终调查单元。
这里,实际接触样本量在调查时视回答率状况分批投放,以达到既满足目标样本量,同时各二级样本单元(居委会)下最终样本(家庭户)数量差异不至于悬殊。
必选层样本抽取情况见表3。
表3 必选层样本抽取情况(二)抽选层的样本抽取抽选层的初级抽样单元总体为:除去必选层城市市辖区以外的区、县级市、县,根据《中国统计年鉴2009》的行政区划设置信息,除去必选层67个区后,抽选层共有792个区和2003个县级市和县。
1、抽样框的构建为了实现样本分布与总体分布的一致,根据《全国分县市人口统计资料2008年》的户籍人口统计,区层和县层的人口规模比约为7:18,差异较大,为了区县两层样本初级单元分配数量差异,采用与人口规模平方根成比例的分配方法,将抽选层中的50个层划分为为19个区层和31个县层。