抽样估计·

常用抽样方法

1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或"差"的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是"同质"的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为"有代表性的样本"。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选"中型城镇"进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先"分层"(事先确定每层的样本量)再"判断"(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点:

(抽样检验)抽样调查基础

第九章 抽样调查基础 一、本章重点 1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。 2.抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。 3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。正态分布的密度函数有两个重要的参数(σ;x )。它有对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。推出了样本分布的标准差为:1 --=N n N n x σ μ。 4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的

是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。 抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。 在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σ μ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N n n x -=1σ μ。在通常情况下总体的方差是未知的,一般要用样本的方差来代替。 把抽样调查中允许的误差范围称作抽样的极限误差x ?或p ?。μt =?,用抽样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的置信度。抽样的极限误差越大,抽样估计的置信度也越大。抽样估计又可区分为点估计和区间估计。按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。 二、难点释疑 1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估 计

抽样和参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的壹个过程。 估计(estimation)是统计推断的重要内容之壹。统计推断的另壹个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布和总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样和抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进行调查,且根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Itemunit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量 样本容量(Samplesize):样本中所含个体的数量 壹般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 壹、抽样方法及抽样分布 1、抽样方法

(1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机 会(概率)被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样和不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进行抽样 ③、整群抽样:将壹组被调查者(群)作为壹个抽样单位 ④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择壹群特定数目、满足特定条件的被调查者 2、抽样分布 壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每壹个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布和中心极限定理 1、样本均值的抽样分布(壹个例子)

样本量的确定

样本量的确定 北京广播学院新闻传播学院 调查统计研究所 二零零一年五月 沈浩 本讲主要内容 如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配样本容量的确定 样本量=费用+精度 (函数) 确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限 制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准 总的样本容量事先确定 估计值要求达到的精度预先给定 影响调查样本容量的因素 调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小

样本设计和所使用的估计量 无回答率 客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少 除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因 素。 11>(给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关 数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。标准误差 误差界限 变异系数 抽样方差的几种计量方法 抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进 行说明。 非抽样误差 非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑

抽样检查方法的分类与基本术语

抽样方法 全数检验是对一批产品中的每一件产品逐一进行检验,挑出不合格品后,认为其余全差不多上合格品。这种质量检验方法尽管适用于生产批量专门少的大型机电设备产品,但大多数生产批量较大的产品,如电子元器件产品就专门不适用。产品产量大,检验项目多或检验较复杂时,进行全数检验势必要花费大量的人力和物力,同时,仍难免出现错检和漏检现象。而当质量捡验具有破坏性时,例如电视机的寿命试验、材料产品的强度试验等,全数检验更是不可能的。 抽样检验是从一批交验的产品(总体)中,随机抽取适量的产品样本进行质量检验,然后把检验结果与判定标准进行比较,从而确定该产品是否合格或需再进行抽检后裁决的一种质量检验方法。 过去,一般采纳百分比抽样检验方法。我国也一直沿用原苏联40年代采纳的百分比抽样检验方法。这种检验方法认为样本与总体一直是成比例的,因此,把抽查样本数与检查批总体数保持一个固定的比值如5%,0.5%等。但是,实际上却存在着大批严、小批宽的不合理性,也确实是讲,即使质量相同的产品,因检查批数量多少不同却受到不同的处理,而且随着检查批总体数

量的增多,即使按一定的百分比抽样,样本数也是相当大的,不能体现抽样检验在经济性方面的优点。因此,这种抽样检验方法已被逐步淘汰。 人们通过对百分比抽样检验方法的研究,获知百分比抽样检验方法不合理的全然缘故是没有按数理统计科学方法去设计抽样方案。因此,逐步研究和设计了一系列建立在概率论和数理统计科学基础上的各种统计抽样检验或统计抽样检查方案,并制订成标准抽样检查方案。1949年,美国科学家道奇和罗米格首先发表了《一次抽样与二次抽样检查表》;1950年美国军用标准MIL -STD—105D是世界上有代表性的计数抽样检查方法标准;日本先后制定了JIS Z9002,JIS Z9015等一系列抽样检查方法标准;英国、加拿大等国也相继制订了抽检方法标准;ISO和IEC又分不制订了抽样检查方法国际标准,如ISO2859、IEC410等。实践证明,上述抽样检查方法标准应用于产品质量检验时,尽管也存在着误判的可能,即通常所讲的存在着生产方风险和使用方风险,但能够通过选用合适的抽样检查方案,把这种误判的风险操纵在人们要求的范围之内,符合社会生产使用的客观实际需要,因此,专门快地在世界各国得到广泛推行,取代了原先的不合理的百分比抽样检验方法。

统计学 抽样估计习题

第六章抽样估计题 一、单项选择题 1、抽样推断的基本内容是: A.参数估计 B.假设检验 C.参数估计和假设检验两方面 D.数据的收集 2、抽样平均误差的实质是 A. 总体标准差 B. 抽样总体的标准差 C. 抽样总体方差 D. 样本平均数(成数〉的标准差 3、不重复抽样平均误差: A. 总是大于重复抽样平均误差 B. 总是小于重复抽样平均误差 C. 总是等于重复抽样平均误差 D. 上情况都可能发生 4、在其它条件不变的情况下,抽样单位数增加一半,抽样平差 A. 缩小为原来的81.6% B. 缩小为原来的50% C. 缩小为原来的25% D.扩大为原来的四倍 5、样本的形成是: A.随机的 B.随意的 C. 非随机的 D.确定的 6、抽样误差之所以产生是由于: A. 破坏了随机抽样的原则。 B. 抽样总体的结构不足以代表总体的结构。 C. 破坏了抽样的系统。 D.调查人员的素质。 7、抽样误差指的是: A. 代表性随机误差 B. 非抽样误差 C. 代表性误差 D. 随机性误差 8、抽样误差大小 A. 可以事先计算,但不能控制 B. 不可事先计算,但能控制 C. 能够控制和消灭 D.能够控制,但不能消灭 9、随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。在概率为0.9545时,计算工龄不到一年的工人比重的极限抽样误差。 A.0.6% B. 6% C. 0.9% D. 3% 10、根据抽样调查25个工厂(抽取2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.954时,计算流动资金平均周转时间的极限抽样误差。 A.0.8 B.3.96 C.4 D.226 11、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少? A.53.3 B.1.65 C.720 D.1320 12、根据某市公共电话网100次通话情形抽样调查,知道每次通话平均持续时间为4分钟,均方差为2分钟。在概率为0.9545时,计算每次通话平均持续时间的极限抽样误差。 A.0.2 B.0.4 C.0.28 D.0.1428 13、为研究劳动生产率,某工厂对19%工人进行调查,抽样324人。这些工人加工某零件平均时间消耗35分钟,均方差为7.2分钟,试以0.9545置信度估计平均时间消耗的极限抽样误差。 A.0.8 B.0.36 C.0.076 D.0.72 14、为研究工人生产定额完成情况,对某工厂抽样调查36%的计件工人。抽样的144人中,有80%的工人超额完成生产定额。试计算概率为0.9973时超额完成生产定额工人比重的极限抽样误差。 A.10% B.8% C.12% D.3.2% 15、为估计某地区10000名适龄儿童的入学率,用不重复抽样从该:地区抽取400名儿童,有320

统计学第九章抽样与抽样估计

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进 行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本, 这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差 相比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

第二节 几种基本的概率抽样方法

第二节几种基本的概率抽样方法 【本节知识点】 各种概率抽样方法的理解 【本节内容精讲】 【知识点一】简单随机抽样 (一)含义 1、有放回简单随机抽样 从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。 【注】单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。 2、不放回简单随机抽样 从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被抽入样本的单元中等概率的抽取下一个单元,直到抽取n个单元为止。 【注】每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。 (二)优缺点 1.优点:简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同,样本估计量形式也比较简单。 2.缺点:没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十分分散,增加了调查过程中的费用和时间。 (三)适用条件 1、抽样框中没有更多可以利用的辅助信息 2、调查对象分布的范围不广阔 3、个体之间的差异不是很大 【例题10:单选题】下列关于简单随机抽样的表述错误的是()。 A总体的每个单位入样概率相同B是最基本的随机抽样方法 C没有利用抽样框更多的辅助信息D适用个体之间差异较大的调查 【答案】D【解析】通过本题掌握简单随机抽样的特点。 【知识点二】分层抽样 (一)含义

先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。 【例题11:单选题】在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于()。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样 【答案】C。解析:考核分层抽样概念的理解。 (二)分层抽样样本量在各层分配的方法 【例题12:单选题】某校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为() A.45,75,15 B.45,45,45 C.30,90,15 D.45,60,30 【答案】D【解析】样本量占总体容量的比=135/2700=5% n(高一)/900=5%,所以,n(高一)=5%×900=45人 n(高二)/1200=5%,所以,n(高二)=5%×1200=60人 n(高三)/600=5%,所以,n(高三)=5%×600=30人 (三)优缺点 优点:

样本量的确定方法

样本量的确定方法(2008-10-14 09:12:34)一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内 样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量 计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的 公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1 / 5 1.简单随机抽样确定样本量主要有两种类型: (1)对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查结果的精度(E), 期望调查结果的置信度(L),以及总体的标准差估计值σ的具体数据,总体单位数N。2222/N) σ/(e/Z+σ计算公式为:n=222/e特殊情况下,如果是很大总体,计算公式变为:n= Zσ95%调查结果在例如希望平均收入的误差在正负人民币30元之间,95%的置信范围以内,其。根据估计总体的标准差为150元,总体单位数为1000。的统计量为的置信度要求 Z1.96:n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88 样本量 (2)于百分比类型的变量(E),,一般根据下列步骤计算样本量。已知调查结果的精度值百分比对于已知数据为百分比。,的精度即样本变异程度,总体数为N以及置信度(L),比例估计(P)22+ P(1-P)/N) :n=P(1-P)/(e/Z则计算公式为22公式为:n= ZP(1-P)/e同样,特殊情况下如果不考虑总体, 。取其样本变异程度最大时的值为我们不知道,P的取值,0.5一般情况下的置信95%,其的置信范围以内之间例如:希望平均收入的误差在正负0.05,调查结果在95%。样本量0.5,1.96度要求Z的统计量为,估计P为总体单位数为

常用的抽样方法总结

常用的抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点: 容易掩盖不可忽略的偏差。 滚雪球抽样(Snowball sampling)

常用的抽样方法总结

常用的抽样方法总结 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

常用的抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling)

指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。

(标准抽样检验)抽样与参数估计

(标准抽样检验)抽样与 参数估计

抽样与参数估计 推断统计:利用样本统计量对总体某些性质或数量特征进行推断。 从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。 估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesistesting)。 因此本节内容就是由样本数据对总体参数进行估计,即: 学习目标:了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系 了解点估计的概念和估计量的优良标准 掌握总体均值、总体比例和总体方差的区间估计 第一节抽样与抽样分布 回顾相关概念:总体、个体和样本 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。 总体(Population):调查研究的事物或现象的全体参数 个体(Itemunit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体统计量 样本容量(Samplesize):样本中所含个体的数量 一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 一、抽样方法及抽样分布

1、抽样方法 (1)、概率抽样:根据已知的概率选取样本 ①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率) 被抽中。 注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重 复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。 ②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 ③、整群抽样:将一组被调查者(群)作为一个抽样单位 ④、等距抽样:在样本框中每隔一定距离抽选一个被调查者 (2)非概率抽样:不是完全按随机原则选取样本 ①、非随机抽样:由调查人员自由选取被调查者 ②、判断抽样:通过某些条件过滤来选择被调查者 (3)、配额抽样:选择一群特定数目、满足特定条件的被调查者 2、抽样分布 一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。 某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。 二、样本均值的抽样分布与中心极限定理 1、样本均值的抽样分布(一个例子)

第-5-章-抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

统计学习题 第五章_抽样与抽样估计答案

第五章抽样与抽样估计复习题 一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为0.8分钟,则概率为0.9545时,通话平均持续时间的抽样极限误差为((2)) (1)0.8 (2)0.16 (3)0.84 (4)3.16 6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4))

抽样原理及方法

抽样原理及方法 一、抽样的基本原则 随机化是抽样研究的基本原则。所谓随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。 二、抽样的几种重要方法 抽样有两种方法;非概率抽样和概率抽样。使用哪种方法主要取决于我们是否打算对总体进行推断。非概率抽样用主观的(非随机的)方法从总体中抽取单元,它是一种快速、简易且省钱的抽样方法。但要能从样本对总体进行推算,必须假定样本对总体具有代表性,而在非概率抽样情形做这样的假设将有很大风险。 概率抽样则是基于随机的原则从总体中抽取单元。与非概率抽样相比,概率抽样较为复杂,费时,费用也较高,然而,由于单元是从总体中随机抽取出来的。而且能计算每一个单元的入样概率,因此能得到可靠的估计值及其抽样误差的估计值,并对总体进行推断。下面介绍的是概率抽样的几种重要方法。 1、简单随机抽样 它是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应有独立的、等概率被抽取的可能。抽取的样本满足两个基本条件:代表性和独立性,常用的具体抽取方式有抽签法和随机数字法。 有简单随机抽样得到的样本为简单随机样本。尽管在总体构成信息不同的情况下需要酌情采取不同的抽样方法,如分层抽样方法、集团抽样等,但随即抽样是各种抽样方法内含的基本要求,有四种不同的简单随机抽样方式:不重复抽样(还原抽样、放回抽样);不重复抽样(非还原抽样、无放回抽样);有序抽样(既考虑到何元素有考虑到各种元素出现的顺序);无序抽样(只考虑到哪些元素不考虑各元素出现的顺序)。 2、等距抽样 它也叫做机械抽样或系统抽样。在实施时,将已遍好号码的个体排成顺序,在计算出抽样距离,然后按抽样距离抽取样本。第一个样本采用的是简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模) 一般来说,这种抽样方法比简单随机抽样简便易行,而且它比较均匀地抽到总体中各个部分的个体,样本的代表性比简单随机抽样好。另外,等距抽样同简单随机抽样一样也容易忽略已有信息。 3、分层抽样(类型抽样) 现将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽出一个子样本,最后将这些子样本合起来构成总体样本。分层有两种方法:a.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。例如修订智力测验中国版,先把中国的区域分成东北、华北等大行政区,每个大区再按照其人口比例随机抽取一定数量的被试(不分省市)。 b.先以分层变量将总体划分成若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。例如在某大学进行大学生态度调查,可以先按专业分层,再按年级分层,然后根据抽中的专业和年级全体学生的名册进行等距抽样。分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,在抽取不同的子总体中的样本分别代表该子总体,所有的样本进而合在一起代表总体。 分层标准: a.以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 b.以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作

常用的抽样方法总结

常用得抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体得被抽取不就是依据其本身得机会,而就是完全决定于调研者得意愿。 其特点为不具有从样本推断总体得功能,但能反映某类群体得特征,就是一种快速、简易且节省得数据收集方法。当研究者对总体具有较好得了解时可以采用此方法,或就是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”得样本,从而避免影响对总体得代表度。 常用得非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者得方便选取得样本,以无目标、随意得方式进行。例如:街头拦截访问(瞧到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都就是“同质”得,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面得样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断得任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目得地抽取她认为“有代表性得样本”。例如:社会学家研究某国家得一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学得);在探索性研究中,如抽取深度访问得样本时,可以使用这种方法。 优点: 适用于总体得构成单位极不相同而样本数很小,同时设计调查者对总体得有关特征具有相当得了解(明白研究得具体指向)得情况下,适合特殊类型得研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员得倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quotasampling) 指先将总体元素按某些控制得指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段得加限制得判断抽样。在第一阶段需要确定总体中得特性分布(控制特征),通常,样本中具备这些控制特征得元素得比例与总体中有这些特征得元素得比例就是相同得,通过第一步得配额, 保证了在这些特征上样本得组成与总体得组成就是一致得。在第二阶段,按照配额来控制样本得抽取工作,要求所选出得元素要适合所控制得特性。例如:定点街访中得配额抽样。 优点: 适用于设计调查者对总体得有关特征具有一定得了解而样本数较多得情况下,实际上,配额抽样属于先“分层”(事先确定每层得样本量)再“判断”(在每层中以判断抽样得方法选取抽样个体);费用不高,易于实施,能满足总体比例得要求。 缺点: 容易掩盖不可忽略得偏差。 滚雪球抽样(Snowballsampling) 指先随机选择一些被访者并对其实施访问,再请她们提供另外一些属于所研究目标总体得调查对象,根 据所形成得线索选择此后得调查对象。

相关文档
最新文档