抽样技术 概念
抽样技术

小结
一、抽样调查的一般理论 二、随机抽样 四种方法:简单随机抽样 类型抽样 机械抽样 整群抽样 三、非随机抽样法 三种方法: 任意抽样法 判断抽样法 配额抽样法 四、抽样误差和样本容量确定
THANK YOU!!!
(三)配额抽样法 1.含义:是指按照一定的标准确定地区别和职业别等不同群体的 样本配额,然后由调查人员主观地抽取配额内样本的方法。 2.适用范围:通常适用于小型的市场调查 3.步骤:(1)选择“控制特征”作为细分总体的标准; (2)将总体按“控制特征”组成 若干子总体; (3)决定各子总体样本的大小; (4)选择样本单位。
什么是抽样技术??? 最通俗的理解就是从统计调查总体中 抽取样本进行调查,获取数据,然后 对总体数量特征作出推断的技术。抽 样技术是一种非全面统计调查的技术, 运用抽样技术所进行的调查称为抽样 调查。
抽样调查的概念
总体和 抽样总体
抽样框 抽样调查
总体指标与 样本指标
抽样指标
总体方差 和均方差
一、重要术语:
(二)判断抽样法
1.含义:又称立意抽样法,它是指由市场调查的专家依据 自己的判断来选取样本的一种方法。 2.适用范围:总体的构成单位差异较大而样本数又很小的 情况 3. 优缺点: 优点因为是按照调查人员的需要来选定样本,所以较好 地满足了特殊的调查需要。 缺点:如果调查人员在选取样本时主观判断出现偏差, 则判断抽样极易发生较大的抽样误差。 4.采用判断抽样法应注意的问题:一要选好专家,二要应极 力避免挑选极端情况的样本,“多数型”、“平均型”
样本设计 1.总样本数:1500个。 2.样本分配方案 第一阶段分层后样本分配(见下表):
地区 广州、珠三角 粤东、粤西、粤北
样本比例
70%
统计学中的抽样技术

统计学中的抽样技术统计学是一门研究数据收集、整理、分析和解释的学科。
而抽样技术则是其中最基础的技术之一。
在进行统计分析前,必须先通过抽样技术从样本中取得代表性的数据,才能从中推断出总体的各项指标。
一、抽样技术的基本概念抽样是从大量样本中选取一定数量的个体作为观测对象的过程。
选择的个体必须具有代表性,能够反映总体的特征。
这样才能保证分析出来的数据有效可靠。
随机抽样是一种常用的抽样方法。
在随机抽样中,每个个体被选中的概率是相等且独立的。
也就是说,每个个体被选中的概率是不受其它个体选中与否的影响的。
这样能够保证选出来的样本具有代表性,反映总体的特征。
二、抽样技术的类型1. 简单随机抽样简单随机抽样是从总体中随机抽取若干个体作为样本的方法。
在简单随机抽样中,每个个体被选中的概率是相等的。
2. 分层抽样分层抽样是将总体分成若干层(或区)后,分别从每一层中随机抽取若干个体作为样本的方法。
在分层抽样中,每层中个体的特征相近,能够更好地反映总体的特征。
3. 系统抽样系统抽样是从总体中按照某个规则选择若干个体作为样本的方法。
例如,在一个有序的样本中,每隔一定的间隔选择一个个体。
这种方法适用于总体比较规律的情况。
4. 分组抽样分组抽样是将总体分成若干组,然后从每组内随机抽取若干个体作为样本的方法。
分组抽样能够更好地反映总体的特征,避免某一组内的个体被选取过多或过少。
三、抽样技术的优缺点1. 优点抽样可以减少实验的时间和成本,节省资源。
抽样能够反映总体的真实情况,避免了统计结果的误差。
抽样的结果能够更好地解释,便于进行数据分析和预测。
2. 缺点抽样可能会造成样本数据的偏差,不能完全代表总体的情况。
抽样的过程需要一定的技术和方法,需要经过专业的培训和指导。
抽样的样本容量可能会受到客观条件的限制,从而影响结果的准确性。
四、结语抽样技术在统计学中有着重要的作用。
不同的抽样技术适用于不同的场景,需要根据实际情况进行选择和使用。
抽样技术主要概念、术语与问题(兼作复习提纲)

一、主要概念、术语1、(作为数据收集方法的)观察研究,普查与抽样调查,实验设计在观察研究中,把观察到的事实都记录下来,而不考虑或很少考虑它们对总体的代表性。
在普查与抽样调查中,基于样本代表性的观念,把对总体或样本中的每一个成员进行观察得到的事实记录下来。
在实验设计中,涉及实验条件的控制。
2、非概率抽样;判断抽样,方便抽样,自愿样本,配额抽样,滚雪球抽样○偶遇抽样(方便抽样)(便利样本)〖含义〗事先不预定样本,碰到即问或自动回答者。
○判断抽样(立意样本)〖含义〗基于调研者对总体的了解和经验,从总体中抽选"有代表性的""典型的"单位作为样本。
○配额抽样〖含义〗按母体某些特征予以配置样本,但抽样时却由调查员任意抽取。
○滚雪球抽样(滚式样本)(辐射样本)〖含义〗利用样本寻找样本目标总体:所要研究对象的全体抽样总体:从中抽取样本的总体在实践中并非皆一致。
3、概率抽样;有限总体,样本及其四种类型,选取概率;抽样设计;抽样单位,目标单位,抽样框○抽样单元:一个抽样单元或直接是抽样总体中的一个个体的具体表现或其对应之物,或是抽样总体中的一个个体集的具体表现或其对应之物。
抽样单元可以有层次结构:初级单元由二级单元构成…○抽样框:由抽样单元组成,是抽样总体的具体表现或其对应之物。
常有名录框,区域框,自然框;可为多重抽样框 12 , , , M F F F F◎概率抽样(Probability Sampling)样本以随机方式取出,即:对每一个可能的样本,预先确定一选取概率。
* s * p s4、均方误差(MSE),估计量的方差,估计量的偏差5、抽样误差,非抽样误差6、SRSWOR(数学定义,直观定义)7、样本的三种形式8、分层抽样,分层随机抽样9、样本的代表性10、按比例分配样本,奈曼分配,最优分配11、查特吉法,12、事后分层13、简单估计,(分别、联合)比率估计,(分别、联合)回归估计,14、(总体、样本)回归系数15、整群抽样,群内相关系数,设计效应16、有放回不等概率抽样,抽取概率,PPS抽样,HH估计17、不放回不等概率抽样,(一阶、二阶)包含概率, PS抽样,HT估计,布鲁尔法,水野法,耶茨-格伦迪法,Raj估计量二、主要问题1、抽样调查主要有哪些作用?2、抽查调查与普查相互关系如何?表现在哪些方面?3、抽样框有哪些主要类型?试各举一例。
抽样技术及其重要性

抽样技术及其重要性在现代科学研究和数据分析中,抽样技术是一种至关重要的工具。
面对庞大的数据集,完整调查所有数据不仅耗时耗力,而且成本高昂。
因此,抽样成为解决这一问题的有效手段。
本文将探讨抽样技术的基本概念、方法以及其在研究和实际应用中的重要性。
一、抽样技术基本概念抽样的定义抽样是从总体中选取一部分个体(称为样本),以期通过对样本的研究来推断总体特征的一种统计方法。
在许多情况下,由于时间、费用或者其他限制条件,研究者无法对整个总体进行调查或测试,这时就需要采用抽样技术。
总体与样本总体是研究对象的全体,而样本是从总体中随机选取出来的一部分。
一个好的样本应该能够代表总体,使得通过样本所得出的结论能够推广到整体。
例如,在对某一地区居民饮食习惯的调查中,若能随机选取一定数量的居民作为样本,并保证其多样性和代表性,则可以更准确地反映该地区居民的饮食习惯。
二、抽样方法随机抽样随机抽样是最基本的抽样方法,它确保每个个体都有相同的被选中机会。
这种方式可以消除选择偏差,从而提高结果的可信度。
随机抽样又可分为简单随机抽样、系统抽样和分层抽样。
简单随机抽样:从总体中每个个体都有同等概率被选中的方式。
比如将所有个体编号,然后随机抽取。
系统抽样:按一定规则选取个体,如每隔一定数量选择一次。
假设要从100个个体中选取10个,可以每10个选择1个。
分层抽样:总体被划分为不同的层次(如年龄、性别等),然后从每一个层次中进行随机抽取,以保证各层次特征都能被涵盖。
整群抽样整群抽样是将总体划分为若干群体(集群),然后随机选择一些群体进行全面调查。
这种方法适合于总体现象高度一致且因子差异较大的情况。
比如对某一地区学校教育质量进行研究,可以选择某些学校作为群体进行研究。
非随机抽样非随机抽样方法则不保证每个个体有相等机会,被选中的机会可能因各种因素而不同。
这种方法通常用于探索性研究或对少数群体特征进行初步了解。
常见的非随机抽样方法包括便利抽样、判断抽样和配额抽样。
抽样技术及其重要性

抽样技术及其重要性在科学研究、市场调查、社会调查等领域,我们经常需要从一个庞大的总体中选取一部分个体作为样本,通过对样本的研究和观察来推断总体的特征和规律。
而抽样技术就是为了从总体中选取样本而设计的一系列方法和工具。
本文将介绍抽样技术的定义、分类及其在各个领域的重要性。
抽样技术的定义抽样技术是为了从总体中选择样本而设计的一系列方法和工具。
通过合理使用这些方法和工具,我们可以在总体规模庞大且多种多样的情况下,准确地从中获取代表性的样本。
抽样技术主要包括随机抽样、分层抽样、整群抽样等方法。
抽样技术的分类根据不同的目标和情况,抽样技术可以分为以下几类:随机抽样随机抽样是指在总体中每个个体都有相等机会被选中为样本的抽样方法。
这种方法可以消除选择偏差,使得每个个体都有同等机会成为样本。
常见的随机抽样方法有简单随机抽样、系统抽样等。
分层抽样分层抽样是指将总体按照一定属性进行划分,然后分别从每个层次中选取一定比例的个体作为样本。
这种方法可以保证不同层次特征的充分反映,并控制属性差异对结果影响的程度。
整群抽样整群抽样是指将总体按照某种特定分类方式划分成若干群体,然后从每个群体中选取全部或部分个体作为样本。
这种方法适用于总体群体内部差异较大,并且群体间相对较为均匀的情况。
便捷抽样便捷抽样是指根据自身方便和可行性选择个体作为样本的抽样方法。
这种方法虽然容易引入选择偏差,但在某些情况下也能提供重要的参考信息。
抽样技术在科学研究中的重要性科学研究是通过对代表性样本进行观察和实验,来推断总体规律和特征的过程。
而正确使用和应用抽样技术可以有效提高研究结果的准确性和可靠性:代表性:合理使用抽样技术可以确保所选取的样本具有代表性,能够全面反映总体特征。
节约成本:通过合理选择合适的抽样方法,在保持结果可靠性的前提下,节约人力、物力和时间成本。
可行性:在某些情况下,直接对整个总体进行观察或实验是不可行或困难的,而使用合适的抽样技术可以更加灵活地进行研究。
抽样技术。

抽样技术 6.28一、名词解释1.抽样调查技术:抽样调查技术是一门应用广泛的学科,它是以概率论和数理统计为基础,专门研究抽样理论、抽样方法及其应用的学科。
2.简单随机样本:从含有N个单元总体中,随机、独立的抽取n个单元组成样本,这种方法叫简单随机抽样。
3.等距抽样:从含有N个单元的总体中,随机地确定起点后,按照预先规定的间隔抽取n个单元组成样本,用以估计总体的方法称为等距抽样,亦称系统抽样。
4.分层随机抽样:按照总体各部分的特征,把总体划分成若干个层(或类型),然后在各层中进行简单随机抽样,借以估计总体的方法。
5.回归抽样估计:应用回归统计分析的原理进行抽样推断。
6.比估计:利用一个辅助变量对所调查的目的变量的特征值进行抽样估计的一种方法。
二、简答题1、抽样调查方法的优点:(1)费用较低(2)速度快(3)精度高,有概率保证(4)抽样方法的灵活性(5)应用范围广:①无限总体。
②包括未来时间序列的总体。
③破坏性的产品质量检验。
2、总体与样本(1)总体①总体:我们把调查对象的全体称为总体。
②总本单元:组成总体的每个基本单位。
③标志:为说明总体单元在某一方面的特征而采用的名称即为标志。
④每个总体单元在数量标志上所观察到的数值称为单元标志值。
⑤总体特征数:总体特征数是指描述总体所有单元在某标志上数量特征的数值。
(2)样本①样本:从全部总体单元中,按照预先规定的方法抽取一部分单元,则被抽出的这部分单元之集合称为样本,又称子样。
②样本单元:样本单元是总体单元的一部分。
3、简答随机抽样样本大小的设计,主要从以下几个方面考虑:(1)总体变异情况。
一般的说,总体各单元标志值变动越大,即总体方差越大,则需样本单元数越多;反之则少些。
总体方差S2与抽样及样本单元数n的大小无关,当n愈大,S2愈接近于σ2,故S2的大小是由σ2即总体变异的大小这一客观情况决定的。
(2)调查精度要求。
允许误差范围,即误差限越小,抽样估计精度越高,则要求样本单元数越多,反之则少。
抽样技术概述

• 学习要点
一、理解和掌握抽样调查的概念、特点和作用。 二、掌握抽样技术中常用的基本概念。 三、熟练掌握抽样平均误差的概念、影响因素和计算方法 四、熟练掌握极限抽样误差的概念和计算方法。 五、掌握必要抽样数目的意义和计算。 六、了解全及总体总量指标的推算和抽样调查组织方式。
第一节 抽样技术概念
一、抽样技术的涵义
抽样技术是统计学的重要分支,它已经成为当今世界上最重 要的统计方法。它广泛应用于社会、经济、科技和自然等各个领 域,成为现代统计学中发展最快、最活跃的一个分支。
抽样技术的完整概念应包括对样本的调查和对总体数据的估 计两个方面。这里首先介绍抽样调查,然后介绍总体数据估计的 基本理论和方法。
2.区域抽样框,按自然地域划分并排列出总体所有单位。如, 一片土地划分为若干地块并编号、一片森林划分为若干林区并编 号等。
3.时间表抽样框,按时间顺序排列总体单位。如,流水线生 产的产品质量检验,把一天划分为若干时段并按顺序排列。
抽样框的编制是抽样调查的前提条件,要求不重不漏来保证 样本对总体的代表性。
(三)用于采集灵敏度高、时效强、时间要求紧迫的资料。
如市场动态、商品交易额、股市行情、抢险救灾和战时物资 质量检验等。
(四)与其他调查方式结合运用,互相补充与核对。
如,抽样技术与普查相结合可以检查核对普查数据的准确 性;与重点调查相结合,有利于掌握总体数量特征。
(五)进行假设检验,判断真伪。
如,某项新工艺、新配方或农业新品种在生产中的推广是否 具有显著价值,可通过抽样推断进行假设检验,决定是采用还是 放弃。
(三)在推断手段上,以概率估计方法进行总体推断。
抽样估计是以概率论为基础的估计方法,用样本数据估计总 体数据时,其可靠性用一定概率保证程度来说明。例如,用城市 居民样本数据估计某电视节目的收视率、用居民样本数据估计全 市居民家庭收支情况等等。
抽样技术

2010年全国各类企业有1040 万户,按简单随机抽样方式 抽取样本容量为1200的样本
总体指标是 什么?有何 特征?
26
总体特征
企业风险意识: 有(1)、无(0)
企业保险消费状 况:支出金额 企业保险消费满 意程度:评分1- 5
总体指标
具有风险意识企 业的比例:P 企业保险消费总 额,平均金额 企业保险消费满 意的比例P
14
三、抽样框
抽样框
根据抽样单位所编制的名录,是抽样总体 的具体表现。
中国经理人名录大全 中国传真号码大全 精准全国31省市名录数据库
阿里巴巴注册会员 慧聪注册会员 港澳台企业名录
所有行业名录 外资企业名录 外国在华投资企业
开发区企业名录
最新注册企业名录 北京企业名录 上海企业名录
生产型企业名录
15
目标总体也称全及总体: 是由符合研究目的的所有具有相同性质或 特征的个体所组成的集合。 目标总体是抽样推断的目标,即我们想通 过抽样来认识它的数量特征。
3
例:研究杭州市个体商业的经营状况, 目标总体——杭州市所有从事商业活动的个体经营单位, 个体 ——每个个体经营单位。 例:研究浙江工商大学教师的科研能力情况, 目标总体——全校所有从事教学研究工作的教师, 个 体 ——每一位教师。
思考:研究浙江工商大学新生的生源情况,目标总体是 什么,个体是什么?若研究浙江工商大学各部门收支情 况,目标总体是什么,个体是什么?
4
研究域(子总体):
对总体中某特定的组或类进行调查研究,这样的组或类 就称为研究域或子总体。
在调查中,必须对目标总体的范围做出具体规定
统计口径
例如:研究浙江工商大学教师的科研能力情况, 目标总体是该校所有从事教学研究工作的教师。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录第一章预备知识第二章基本概念第三章简单随机抽样第四章分层随机抽样第五章不等概率抽样第六章多阶段抽样第七章整群抽样第八章系统抽样第九章非概率抽样第一章预备知识作为抽样技术的基础知识或预备知识,本章简要地介绍调查原理、排列组合、概率统计等方面的有关知识。
一、调查概论调查的重要性:有利于制定政策、投资决策、科学研究、机构管理以及司法实践等;与此同时,许多学科的进步和发展也同样离不开调查。
(一)(一)调查本质上是一种测量活动测量活动具有6个要素:测量主体、测量客体、测量对象、测量法则、测量工具、测量结果(数字/符号)。
测量得到的数据大体分为三种类型:分类型数据、顺序型数据以及数值型数据。
测量的方法分为:直接测量和间接测量。
(二)(二)真值、测量值与误差误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中。
根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。
误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中。
根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。
根据误差的性质分类:系统误差、随机误差和粗大误差。
根据误差的计量尺度分类:绝对误差和相对误差。
绝对误差δ、(调查)估计值x以及真实值μ之间的关系:δ=x-μ。
相对误差r、绝对误差δ以及真实值μ之间的关系:r=δ/μ。
实际常用的真值分类:理论真值、约定真值以及相对真值。
实际常用的测量值分类:单次测量值、算术平均值、加权平均值、中位数和众数。
(三)(三)信度、效度与精度信度表示测量结果中的随机误差大小的程度。
信度的表示方法:测量值的方差(或标准差)或者样本平均数的方差(或标准差)。
衡量信度的三种方法:再测信度、复本信度和折半信度。
衡量信度的三种方法;再测信度、复本信度和折半信度。
效度表示测量结果中的系统误差大小的程度,是测量结果的“有效性” 的反映。
效度分类:内容效度、准则效度和结构效度。
效度含义:(1)测量的特征即为研究的目标特征;(2)该特征被准确地测量。
效度的表示方法:B(x)=|x-μ|或者B(E x)=|E x-μ|。
精度是信度与效度的综合,但它还与信度与效度之外的因素有关。
精度的表示方法:均方误差MSE(x)=V(x)+()2B Ex u-效度的表示方法:μ-=xxB)(或者μ-=xExEB)(。
精度表示信度与效度的综合,但它还与信度与效度之外的因素有关。
精度的表示方法:均方误差2()()() MSE x V x B Ex=+信度、效度与精度之间的关系:对于测量或调查来说,信度高的效度未必高,反过来效度高的信度未必高,但精度高的信度和效度肯定高。
二、排列组合(一)(一)两条基本原理加法原理和乘法原理。
(二) (二) 排列排列的分类:选排列与全排列、允许重复的排列。
选排列与全排列之间的关系:全排列是选排列的一种特殊情形(r n =)。
选排列与全排列中的元素是互不相同的。
允许重复的排列中的元素可能重复出现多次。
(三) (三) 组合组合与排列的差异:组合只与元素有关,而与元素的顺序无关;排列不仅与元素有关,而且与元素的顺序有关。
组合的性质:(1)n n r n r ⎛⎫⎛⎫= ⎪ ⎪-⎝⎭⎝⎭;(2)111n n n r r r --⎛⎫⎛⎫⎛⎫=+ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭,r n < 三、概率统计中的一些基本问题(一) (一) 大数定律大数定律的重要作用:奠定了用样本来估计总体的理论基础。
几种大数定律:契比雪夫大数定律、贝努里大数定律以及辛钦大数定律。
契比雪夫大数定律证明了当n 无限增加时,n 个随机变量的算术平均将会几乎变成一个常数。
贝努里大数定律证明了随着试验次数n 无限增大,事件A 发生的频率可以无限接近它发生的概率。
贝努里大数定律是辛钦大数定律的特殊情况。
辛钦大数定律证明了在n 无限增大时,样本均值会无限接近总体的数学期望。
(二) (二) 中心极限定理中心极限定理的重要作用:奠定了用样本估计量对总体参数进行区间估计的理论基础。
中心极限定理的思想:不论总体服从何种分布,只要方差有限,在观察值足够多时,许多估计量的抽样分布,就趋向正态分布。
根据限制条件的不同可以分成:列维-林德伯格中心极限定理和李雅普诺夫定理。
列维-林德伯格中心极限定理要求随机变量12,,,,n X X X 独立且同分布;李雅普诺夫定理仅要求随机变量12,,,,n X X X 相互独立,但无需服从同一分布。
(三) (三) 参数估计原理参数估计分为:点估计和区间估计。
点估计思想:构造一个适当的统计量1(,,)n X X θ,用它的观察值12ˆ(,,,)n x x x θ来估计未知参数θ。
构造点估计量的方法:矩估计法和极大似然估计法。
衡量估计量优劣的标准:无偏性、有效性和一致性。
区间估计的思想:对于未知参数,除了求出它的点估计外,同时还估计出一个范围,并给出 此区间包含参数真值的可信程度。
第二章 基本概念基本内容在学习各种抽样方法之前,先了解一下抽样调查中所涉及到的基本概念。
一、抽样调查与非抽样调查调查分类:(1) (1) 根据“调查是否针对总体的所有单元”进行分类:全面调查和非全面调查。
(2) (2) 根据“单元是否按照一定的概率入样”进行分类:概率抽样调查和非概率抽样调查。
非全面调查相对于全面调查的优点:(1)时间短速度快;(2)费用少成本低;(3)调查结果比较准确;(4)应用范围广泛。
概率抽样的分类:(1)(1)根据“单元的入样概率是否相等”进行分类:等概率抽样和不等概率抽样。
(2)根据“具体的抽样方式”进行分类:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等等。
概率抽样的优点:(1)(1)能够保证样本的代表性,避免人为因素的干扰;(2)(2)用概率抽样取得的样本去估计总体特征时,可以对由抽样产生的抽样误差进行估计。
非概率抽样的分类:(1)按照“具体的抽样方式”进行分类:判断抽样、便利抽样、自愿样本、滚雪球抽样、配额抽样等。
(2)判断抽样包括典型调查和重点调查这两种取样方式。
非概率抽样的缺点:(1)(1)难以评价样本的代表性。
(2)(2)无法估计抽样误差。
(3)(3)偏倚往往较大。
二、总体与样本(一)(一)总体总体分为:目标总体和实际总体。
目标总体是研究目标所针对的总体;实际总体是实际调查时所针对的有限的、具体的总体。
总体与个体:总体是个体的集合,个体是构成对应总体的单元。
一切构成总体的个体或子总体泛称为总体单元,其中个体称为基本单元。
基本单元是总体里最小的、不可再分的单元。
(二)(二)抽样框与抽样单元包含所有抽样单元的总体称为抽样框,构成抽样框的单元称为抽样单元。
抽样框的形式:名单、手册、地图、数据包等等。
抽样框的要求:(1)抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列。
(2)抽样框中包含的抽样单元务必要“不重不漏”,否则将出现抽样框误差。
抽样单元分级:初级单元→次级单元→三级单元→四级单元……→基本抽样单元。
(三)(三)抽样与样本样本是抽样的结果——从总体全部单元中选出的部分单元,其全体称为样本总体,简称样本。
样本由样本点(抽样单元)构成。
根据样本抽取方法的不同,可以将抽样分为全样本抽取和逐个抽取。
全样本抽取和逐个无放回抽取是等价的。
三、总体特征与估计量(一)(一)总体特征总体特征与总体的关系:总体是调查的客体,而总体特征是总体某个特征或属性的数量表现通常的总体特征有4种:(1)总体总值Y;(2)总体均值Y;(3)总体比例P;(4)总体比率R。
总体总值、总体均值、总体比例三者是统一的,它们都可以用总体均值Y来表示。
(二)(二)估计量和估计方法估计量是从样本的n个单元计算出的对总体特征的估计。
估计量是随机变量。
估计方法:最常见的估计方法是简单线性估计,除此之外,还可以借助于辅助变量。
辅助变量必须满足的两个条件:(1)与要估计的变量高度相关;(2)其总体信息已知。
(三)(三)抽样分布抽样分布:对一个固定的总体,在确定的样本设计和样本量的条件下,估计量的所有可能取值及其出现概率的序列就是该估计量的抽样分布。
抽取的样本越多,所得到的频率分布图就越接近于估计量的真实分布——抽样分布。
抽样分布的渐进正态性:当从一个比较大的总体N中抽取一个中等容量(30以上)的样本时,无论总体是何种分布,其样本均值的抽样分布都近似于正态分布。
样本量愈大,其愈接近正态。
四、误差与精度抽样调查中的误差有两类:抽样误差和非抽样误差。
抽样误差可以进行数量上的估计,是本节研究重点。
控制非抽样误差的方法:严格调查程序、规范调查步骤、加强人员的培训和管理、合理地设 计问题和答卷、改进测量方法和工具。
(一) (一) 均方误差和偏倚均方误差是估计量误差平方的期望ˆ()MSE θ=2ˆ()E θθ-。
偏倚是估计量的期望与参数真值之间的差异:ˆˆ()()B E θθθ=-。
均方误差、方差及偏倚之间的关系:ˆ()MSE θ=2ˆˆ()()V B θθ+。
(二) (二) 置信区间与误差限置信区间:设/2u α为标准正态分布的双侧α分位数,则置信水平为1α-的近似置信区间可以写成:()()/2/2ˆˆˆˆ,u S u S ααθθθθ⎡⎤-⋅+⋅⎣⎦,其中()ˆS θ为θˆ的标准差,需要利用样本数据进行估计。
误差限可以分为:绝对误差限d 和相对误差限r 。
绝对误差限和相对误差限之间的转换关系:dr θ=。
(三) (三) 费用与效率调查的费用是一个与样本量有关的函数,最简单的是线性费用函数。
增大样本量可以提高估 计量的精度,但与此同时调查的费用也加大了。
效率是指以最小的费用达到要求的精度或者在给定费用的情况下达到最大的精度。
五、几种基本的抽样方法简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样分别适用于不同的场合以及不 同的精度要求。
在本书后面会有详细介绍。
六、抽样调查的具体实施步骤实施步骤:(1)调查目标确定;(2)抽样框选择;(3)抽样设计;(4)问卷设计;(5)数据收集;(6)数据编码和录入;(7)审核与插补;(8)参数估计;(9)数据分析和 调查结果的表述;(10)数据发布;(11)文档。
第三章 简单随机抽样基本内容随机抽样分为四种情形:放回有序、放回无序、不放回有序、不放回无序。
简单随机抽样分为:不放回简单随机抽样(SRSWOR )和放回简单随机抽样(SRSWR )。
一、简单随机抽样理论简单随机抽样有三个表述不同但却等价的定义(定义3.1至定义3.3)。
简单随机抽样的抽取原则:(1)按随机原则取样;(2)每个抽样单元被抽中的概率都是已知的或事先确定的;(3)每个抽样单元被抽中的概率都是相等的。