抽样调查中样本容量的确定方法_邵志强

抽样调查中样本容量的确定方法_邵志强
抽样调查中样本容量的确定方法_邵志强

市场调查中样本容量的确定

16 CHINA STATISTICS 市场调查中样本容量的确定 文/陈克明 宁震霖 在市场调研工作中,采用随机抽样进行资料采集时,需要预先确定样本量的大小。我们知道,在系统误差确定的条件下,抽样调查的准确性取决于抽样误差,而抽样误差的大小又与样本容量有直接的关系,即样本容量越大,抽样误差就越小。当然,这并不能说在抽样调查中样本容量越大就越好,因为样本容量越大,调查的费用就越高。因此,决定样本容量大小的主要因素是特定的调研项目对抽样误差的要求和项目预算经费这两个方面。在实际工作中,样本容量的确定实际上就是在抽样误差与经费预算之间求得最佳的平衡,即在可以接受的抽样误差的条件下使用最少的经费,当然,有时候则可能是在一定的经费额度条件下争取最小的抽样调查误差,而这个误差当然必须是可以接受的。所以,在市场调研中,随机抽样调查样本容量的确定,通常都是先根据调查对抽样误差的要求来考虑。 根据抽样误差要求确定的样本容量 根据随机抽样的基本原理,样本容量可以通过抽样误差、极限误差及置信度等因素的分析来加以确定。设在简单随机抽样(重复抽样)的条件下,置信度(t )与抽样误差(μ)及极限误差(Δ)的关系为t =Δ/μ,均值指标的抽样误差(μ)是由总体标准差(δ)和样本容量(n )决定的,即 显然,整理可得: 这就是说,只要我们能够确定总体标准差(δ)、置信度(t)和极限误差(Δ),样本容量即可确定。 第一,总体标准差的确定。总体标准差虽然是客观存在的,但我们是无法直接得到准确的数据的,所以在抽样调查中只能使用近似值,通常有几种简便的处理办法。 1.试验性抽样调查。在调研总体规模较大的情况下,可采用抽样调查方法估计δ。 即根据抽样调查所取得的样本标准差S的结果求得δ。根据概率论和数理统计的有关知识可知: 而 (其中X i 是样本值,X - 是样本 均值,n 是样本容量,δ是δ的最大似然估计),所以有 。 在样本容量n 满足大样本(一般不少于30个)的情况下, ,即 。也就是说,可以专门做一次n>30的抽样调查,用该样本资料可以计算得到样本标准差S,用样本标准差代替总体标准差。 2.利用历史资料或二手资料。一般地,大多数企业过去都曾经做过相关的市场调查,或相关部门(企业内部或企业外部)存有相关的二手统计资料,可以利用这些资料来估计总体标准差δ。 3.估算。根据概率论和数理统计的有关知识可知,在标准正态分布条件下,距离中心 的范围内分布了相当于总体的99.73%的变量,我们可将99.73%近似于总体的全部变量,即近似于100%。据此,只要能找出总体中最大值X max 和最小值X mi x ,然后根据近似公式 ,求得总体标准差δ。 4.运用管理人员的经验判断。在抽样调查实践中,如果要求不是非常严格,可以根据管理人员的有理有据的经验判断来估计总体标准差δ。 第二,极限误差或最大允许误差的确定。它是抽样调查实施者愿意接受或可容忍的最大误差,极限误差是一个临界值, 即误差超过这个临界值在很大的可能性上会改变事物的性质,如我们确定月收入在1000-1500元的为中等收入,其平均收入 水平为1250元,如果极限误差超出±250,则可能发生本来实际上属于中等收入水平的被划归入高收入阶层或低收入阶层,从而导致得出完全不同的分析结论,导致错误。 极限误差的确定需要具体问题具体分析。在抽样调查实践中,极限误差的确定可以根据经验和定性分析,先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步加以缩小,如果太小就逐步扩大,放大该初始值,直到该值达到可能导致分析失误的临界状态,这个临界值就可以作为极限误差。

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

如何确定抽样统计的最小样本量

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格) 在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 ?a方支持率为%; ?b方支持率为%; ?c方支持率为%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况); 最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采 样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为 1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=,置信度为90%时,=,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样为y 相对抽样误差h = E / y C= σ / y 以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 置信度相对抽样误差(假设:C=

抽样调查习题

抽样调查练习 适合对口升学 一.单选题 1. 随机抽样的基本要求是严格遵守( )。 A.准确性原则 B.随机原则 C.代表性原则 D.可靠性原则 2. 抽样调查的主要目的是( )。 A.广泛运用数学的方法 B.计算和控制抽样误差 C.修正普查的资料 D.用样本统计量推算总体参数 3. 抽样总体单位亦可称为( )。 A.样本 B.单位样本数 C.样本单位 D.总体单位 4. 抽样误差产生于( )。 A.登记性误差 B.系统性误差 C.登记性误差与系统性误差 D.随机性的代表性误差 5. 在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的情况是( )。 A.样本单位数占总体单位数的比重很小时 B.样本本单位数占总体单位数的比重很大时 C. 样本单位数目很少时 D. 样本单位数目很多时 6. 在同样条件下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差大小关系是( )。 A.两者相等 B.前者小于后者 C.两者有时相等,有时不等 D.后者小于前者 7. 在抽样推断中,样本的容量( )。 A.越小越好 B.越大越好 C.取决于统一的抽样比例 D.取决于对抽样推断可靠性的要求 8. 用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )。 倍倍倍倍 9. 在重复简单随机抽样下,抽样平均误差要减少1/3,则样本单位数就要扩大到( )。

倍倍倍倍 10. 某企业今年5月试制新产品,试生产60件,其中合格品与不合格品各占一半,则该新 产品合格率的成数方差为( )。 %%%% 11. 点估计( )。 A.不考虑抽样误差即可靠程度 B.考虑抽样误差及可靠程度 C.适用于推断的准确度要求高的情况 D.无需考虑无偏性、有效性、一致性 12. 反映样本统计量与总体参数之间抽样误差可能范围的指标是( )。 A.概率 B.允许误差的大小 C.概率保证程度 D.抽样平均误差的大小 13. 在区间估计中,有三个基本要素,它们是( )。 A.概率度、抽样平均误差、抽样数目 B.概率度、统计量值、误差范围 C.统计量值、抽样平均误差、概率度 D.误差范围、抽样平均误差、总体单位数 二.多选题 1. 抽样技术是一种( )。 A.搜集统计资料的方法 B.对现象总体进行科学的估计和推断方法 C.随机性的非全面调查方法 D.全面、准确的调查方法 2. 抽样调查的特点有( )。 A.只调查样本单位 B.抽样误差可以计算和控制 C.遵循随机原则 D.用样本统计量估计总体参数 3. 适用于抽样推断的有( )。 A.连续大量生产的某种小件产品的质量检验 B.某城市居民生活费支出情况 C.具有破坏性与消耗性的产品质量检查

样本量的确定

样本量的确定 北京广播学院新闻传播学院 调查统计研究所 二零零一年五月 沈浩 本讲主要内容 如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配样本容量的确定 样本量=费用+精度 (函数) 确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限 制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准 总的样本容量事先确定 估计值要求达到的精度预先给定 影响调查样本容量的因素 调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小

样本设计和所使用的估计量 无回答率 客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少 除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因 素。 11>(给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关 数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。标准误差 误差界限 变异系数 抽样方差的几种计量方法 抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进 行说明。 非抽样误差 非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑

抽样调查的样本容量的确定方法

抽样调查的样本容量的确定方法 摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。 关键词:样本容量;抽样调查;抽样误差;极限误差 抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。 1.确定样本容量的必要性 1.1样本容量大小影响抽样估计的精确度 抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。 1.2样本容量大小影响抽样调查的成本和效益 样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。 因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。 2.影响必要样本容量的主要因素 影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。从理论上说,影响样本容量的因素有以下几个方面: 2.1单位标志变异程度 或成数方差P(1-P)的大小来表示。在其他单位标志变异程度一般用方差2

实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量 作者:张耀文 小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。 小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥: 小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。 小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢? 小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。 小玲:原来是这样啊,那我赶紧再去读一读这两个文件。 小玲读完后,又来找小咖。 小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。 小咖:很好。你先总结一下大意。 小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。 小咖:很好,你get 到了所有的point 。以本研究为例,计算样本量时,需要

第7章 抽样调查及答案

第七章 抽样调查 一、本章重点 1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。 2.抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。 3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。正态分布的密度函数有两个重要的参数(σ;x )。它有对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。推出了样本分布的标准差为: 1--=N n N n x σμ。 4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。 抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。 在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即 N n n x -=1σμ。在通常情况下总体的方差是未知的,一 般要用样本的方差来代替。 把抽样调查中允许的误差范围称作抽样的极限误差x ?或p ?。μt =?,用抽 样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的臵信度。抽样的极限误差越大,抽样估计的臵信度也越大。抽样估计又可区分为点估计和区间估计。按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。 二、难点释疑 1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M 表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多少个单位作样本,是样本容量(n )的另一种表现形式。 2.大数定律、正态分布理论、中心极限定理都是假定从N 中抽取一个样本容量为n 的子样,把所有的样本都抽到(有M 种抽法)之后进行验证的,在实际工作中不可能办到。只能用样本的相应指标去推测总体的相应指标。这些理论只是为了验证抽样推断的科学性。

如何确定样本量

如何确定样本量 来回答:对于13万的人,做调查,得取多少样本,这个得看你要求的精确度,统计学上有这样的一套公式, https://www.360docs.net/doc/0b18908295.html,/peixun/pei21.HTM 而对于市场调查; 在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。有人说,北京这么大,上千万人口,我们怎么也得做一万人的访问才能代表北京市吧。根据统计学原理,完全不必。只要在500-1000左右就够了。当然前提是,我们要按照科学的方法去抽样。 根据市场调查的经验,市场潜力等涉及量比较严格的调查所需样本量较大,而产品测试,产品定价,广告效果等人们间彼此差异不是特别大或对量的要求不严格的调查所需样本量较小些。 样本量的大小涉及到调研中所要包括的人数或单元数。确定样本量的大小是比较复杂的问题,既要有定性的考虑也要有定量的考虑。 从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。 具体确定样本量还有相应的统计学公式,根据样本量计算公式,我们知道,样本量的大小不取决于总体的多少,而取决于(1) 研究对象的变动程度;(2) 所要求或允许的误差大小;(3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。因此,如果不同城市分别进行推断时,"大城市多抽,小城市少抽"这种说法原则上是不对的。在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 总之,在确定抽样方法和样本量的时候,既要考虑调查目的,调查性质,精度要求(抽样误差)等,又要考虑实际操作的可实施性,非抽样误差的控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质,进行综合权衡,达到一个最优的样本量的选择。 实际研究中的一些经验 根据一些学者的研究,以及远东零点在市场研究中的经验,市场调查中确定样本量通常的做法是: 1、通过对方差的估计,采用公式计算所需样本量,主要做法有: 2、用两步抽样,在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n; 3、如果有以前类似调查的数据,可以使用以前调查的方差作为总体方差的估计。 4、根据经验,确定样本量,主要方法有: 5、如果以前有人做过类似的研究,初学者可以参照前人的样本。 6、如果是大型城市、省市一级的地区性研究,样本数在500-1000之间可能比较适合;而对于中小城市,样本量在200-300之间可能比较适合;如果是多省市或者全国性的研究,则样本量可能在1000-3000之间比较适合。 7、作为一个常识(主要是为了显著性检验),要进行分组研究的每组样本量应该不少于50个。 8、通过试验设计所作的研究,可以采用较小的样本量。如产品试用(留置)调查,在经费有限的情况下,可以将每组的样本量降低至30个左右,最好每组在50以上。此外,我们在多次的实际研究

抽样调查心得

抽样技术学习心得 姓名:赵胜男 学号:6 学院:理学院 班级:信息102班 教师:刘红梅

大三下学期我们学习了抽样调查这门课程,抽样调查是统计学专业的专业基础课,虽然我们不是统计学专业的学生,我认为了解与掌握有关抽样调查的知识和技能也是非常重要的。学了这门课程,我受益匪浅,我了解了抽样调查相关的概念与发展历史,同时抽样调查存在实际意义,在政府部门、各社会团体、企业单位等地方得到了非常广泛的应用,是了解情况和收集信息的最主要的方式。下面我浅谈下对于抽样调查这门课程的感悟,以及学习到的知识: 一.抽样调查概念 抽样调查是根据随机的原则从总体中抽取部分实际数据进行调查,并运用概率估计方法,根据样本数据推算总体相应的数量指标的一种统计分析方法。 二.抽样调查特点 抽样调查从研究对象的总体中抽取一部分个体作为样本进行调查,据此推断有关总体的数字特征。有较好的经济性,实效性,同时适应面广,准确性高。抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。 与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称登记误差或调查误差),一种是代表性误差(也称抽样误差)。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。 抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。 (3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。

样本量的确定方法.

如对你有帮助,请购买下载打赏,谢谢!样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

样本量的确定方法.

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

抽样调查方案设计

武汉商学院天堂雨伞市场需求抽样 调查方案设计 一.抽样调查的目的 抽样调查的目的在于根据样本调查的结果来推断总体的数量特征。从而明确整个市场的需求,确定企业的发展新方向和新目标。在此次的调查中我们旨在解决市场的最新需求。准确系统的把天堂雨伞这个发展成熟的市场进行深入的调查,分析出自身与竞争对手的实力的差距或者优势明确市场需求特征以求更好的满足其需求。找出自己的市场竞争点的所在,做出新的市场分析。力求做到把握市场的最新动向,了解自己与竞争对手的实力对比做到有的放矢。在调查的过程中做到数据有效性,得到的数据要具有明显得针对性。没有对市场的正确认识和分析,就不可能在日益激烈的市场竞争中战胜对手,壮大自己,发展自己。正确及时而客观的市场调查,可帮助天堂雨伞正确评估自身市场态势、市场地位、市场竞争力,帮助天堂雨伞迅速及时地作出经营决策,化解经营中各种矛盾冲突,保持天堂雨伞良好态势和健康的发展。市场调查成为天堂雨伞发展中不可或缺的重要工具。争取根据样本推断总体中时从中发现一些对于调整市场营销策 略及课程结构调整有价值的数据,从而知道自己的优势和劣势,发 现不足,扬长避短,找准未来的发展方向。 二.抽样市场调查的优点和缺点 抽样市场调查又称概率抽样调查或随机抽样调查,是指调查者为

了特定的调研目的,按照随机原则从调查总体中抽取一部分单位作为样本而进行的一种非全面调查。 其主要特点为:首先样本是按随机原则抽取的,其次是用样本数据推断总体的数量特征。再次为抽样误差不可避免,但可以计算和控制。 抽样市场调查的优点:首先是调查方式的科学性,它有充分的数据依据,能够将调查样本的代表性误差控制在允许的范围内,调查费用的经济性调查规模比全面调查小,资料收集,汇总处理工作量小可以节省人力,物力,财力,从而降低市场调查费用,信息获取的时效 性和调研结果的准确性,其样本按随机原则抽取的,从而排除了主观因素的干扰,能够保证样本推断总体的客观性。 三.确定总体范围和总体单位 总体是所要调查研究的现象的全体,它是由具有同质性和差异性的许多个别事物的集合体。样本是按随机原则从总体中抽出来的一部分单位的综合体,样本中包含的单位个数成为样本量 总体范围的确定应该从时间和空间两方面考虑,即被调查者的入学时间和所在的区域分布。本次调研的总体范围是武汉商学院的在校学生,通过时间及空间的界定,对于时间我们界定在在校的大学生主要是大二和大三学生。本次调研总体还应划分系部,我们主要的调查对象是武汉商学院的全体在校学生。总共预计500名被调查者,即有500名总体单位。然后从中抽取50个样本进行调查。 四.确定抽样推断的主要项目

在市场研究中样本量的确定

在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在市场研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式(1): 其中: n:代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为(2): 其中: n :所需样本量 Z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68 p:目标总体的比例期望值 d:置信区间的半宽

关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为: 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公式(1)变形,我们有:

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

抽样调查基础

第九章抽样调查基础 一、本章重点 1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。 2.抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。正态分布的密度函数有两个重要的参数(σ;x )。它有对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。推出了样本分布的标准差为:1--=N n N n x σμ。 4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。 抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。 在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σ μ=,不

重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N n n x -=1σμ。在通常情况下总体的方差是未知的,一般要用样本的方差来代替。 把抽样调查中允许的误差范围称作抽样的极限误差x ?或p ?。μt =?,用抽样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的置信度。抽样的极限误差越大,抽样估计的置信度也越大。抽样估计又可区分为点估计和区间估计。按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。 二、难点释疑 1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M 表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城

最新样本量的确定知识讲解

样本量的确定 1. 二值分布(估计比例时的样本容量) 这种情况下,表明可能的采样结果只有两种情况,即是与非的问题。比如调查某一批产品的合格率。样本量的确定主要受以下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N ;通过置信水平即可查表确定z 。 通常情况下置信水平选择95%。抽样偏差为±5%,不过也不完全一定,抽样偏差的确定还是要考虑实际情况,比如最小的调查估计值p=5%,此时抽样偏差就应该小于5%。 这时,就可以确定样本量: 22 2(1)(1)z p p n z p p e N -=-+ P 值的确定:用以前类似样本得到的结果来近似,如果完全不知道就设p=0.5,因为此时方差最大,可求得一个比较保守的样本容量。 样本容量和在p=0.5时运用简单随机抽样估计p 值得到的抽样偏差e

如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 (1)z p p n e -= 事实上当总体容量很小时,不会采用抽样调查,而是普查了。 2. 正态分布(估计均值时的样本容量) 在这种情况下,表明采样的结果是具有多样性的,并不局限在0、1上。比如对某一城市老年人的患病年龄进行统计。这个时候,样本量同样受如下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N 。 样本量为: 22 222 z S n z S e N = + S 表明的是总体标准差,这个可以用以前类似样本得到的S 或是实验调查样本的S 来近似。 同样,如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 2 z S n e = 理论基础: 根据数理统计知识,样本均值对总体均值可构造如下统计量: x X u σ-,他满足标准正态分 布,查表即可得到某一显著性水平下这个统计量的值,这里面的x σ表示总体均值估计量的标准误差。 在无放回简单随机抽样情况下,总体均值估计量的标准误差表达式: x σ=

相关文档
最新文档