抽样调查中样本量N的确定方法

抽样调查中样本量N的确定方法
抽样调查中样本量N的确定方法

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

如何确定抽样统计的最小样本量

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格) 在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 ?a方支持率为%; ?b方支持率为%; ?c方支持率为%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况); 最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采 样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为 1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=,置信度为90%时,=,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样为y 相对抽样误差h = E / y C= σ / y 以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 置信度相对抽样误差(假设:C=

抽样调查习题

抽样调查练习 适合对口升学 一.单选题 1. 随机抽样的基本要求是严格遵守( )。 A.准确性原则 B.随机原则 C.代表性原则 D.可靠性原则 2. 抽样调查的主要目的是( )。 A.广泛运用数学的方法 B.计算和控制抽样误差 C.修正普查的资料 D.用样本统计量推算总体参数 3. 抽样总体单位亦可称为( )。 A.样本 B.单位样本数 C.样本单位 D.总体单位 4. 抽样误差产生于( )。 A.登记性误差 B.系统性误差 C.登记性误差与系统性误差 D.随机性的代表性误差 5. 在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的情况是( )。 A.样本单位数占总体单位数的比重很小时 B.样本本单位数占总体单位数的比重很大时 C. 样本单位数目很少时 D. 样本单位数目很多时 6. 在同样条件下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差大小关系是( )。 A.两者相等 B.前者小于后者 C.两者有时相等,有时不等 D.后者小于前者 7. 在抽样推断中,样本的容量( )。 A.越小越好 B.越大越好 C.取决于统一的抽样比例 D.取决于对抽样推断可靠性的要求 8. 用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )。 倍倍倍倍 9. 在重复简单随机抽样下,抽样平均误差要减少1/3,则样本单位数就要扩大到( )。

倍倍倍倍 10. 某企业今年5月试制新产品,试生产60件,其中合格品与不合格品各占一半,则该新 产品合格率的成数方差为( )。 %%%% 11. 点估计( )。 A.不考虑抽样误差即可靠程度 B.考虑抽样误差及可靠程度 C.适用于推断的准确度要求高的情况 D.无需考虑无偏性、有效性、一致性 12. 反映样本统计量与总体参数之间抽样误差可能范围的指标是( )。 A.概率 B.允许误差的大小 C.概率保证程度 D.抽样平均误差的大小 13. 在区间估计中,有三个基本要素,它们是( )。 A.概率度、抽样平均误差、抽样数目 B.概率度、统计量值、误差范围 C.统计量值、抽样平均误差、概率度 D.误差范围、抽样平均误差、总体单位数 二.多选题 1. 抽样技术是一种( )。 A.搜集统计资料的方法 B.对现象总体进行科学的估计和推断方法 C.随机性的非全面调查方法 D.全面、准确的调查方法 2. 抽样调查的特点有( )。 A.只调查样本单位 B.抽样误差可以计算和控制 C.遵循随机原则 D.用样本统计量估计总体参数 3. 适用于抽样推断的有( )。 A.连续大量生产的某种小件产品的质量检验 B.某城市居民生活费支出情况 C.具有破坏性与消耗性的产品质量检查

样本量的确定

样本量的确定 北京广播学院新闻传播学院 调查统计研究所 二零零一年五月 沈浩 本讲主要内容 如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配样本容量的确定 样本量=费用+精度 (函数) 确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限 制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准 总的样本容量事先确定 估计值要求达到的精度预先给定 影响调查样本容量的因素 调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小

样本设计和所使用的估计量 无回答率 客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少 除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因 素。 11>(给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关 数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。标准误差 误差界限 变异系数 抽样方差的几种计量方法 抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进 行说明。 非抽样误差 非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑

抽样调查的样本容量的确定方法

抽样调查的样本容量的确定方法 摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。 关键词:样本容量;抽样调查;抽样误差;极限误差 抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。 1.确定样本容量的必要性 1.1样本容量大小影响抽样估计的精确度 抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。 1.2样本容量大小影响抽样调查的成本和效益 样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。 因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。 2.影响必要样本容量的主要因素 影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。从理论上说,影响样本容量的因素有以下几个方面: 2.1单位标志变异程度 或成数方差P(1-P)的大小来表示。在其他单位标志变异程度一般用方差2

实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量 作者:张耀文 小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。 小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥: 小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。 小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢? 小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。 小玲:原来是这样啊,那我赶紧再去读一读这两个文件。 小玲读完后,又来找小咖。 小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。 小咖:很好。你先总结一下大意。 小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。 小咖:很好,你get 到了所有的point 。以本研究为例,计算样本量时,需要

如何确定样本量

如何确定样本量 来回答:对于13万的人,做调查,得取多少样本,这个得看你要求的精确度,统计学上有这样的一套公式, https://www.360docs.net/doc/5916383266.html,/peixun/pei21.HTM 而对于市场调查; 在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。有人说,北京这么大,上千万人口,我们怎么也得做一万人的访问才能代表北京市吧。根据统计学原理,完全不必。只要在500-1000左右就够了。当然前提是,我们要按照科学的方法去抽样。 根据市场调查的经验,市场潜力等涉及量比较严格的调查所需样本量较大,而产品测试,产品定价,广告效果等人们间彼此差异不是特别大或对量的要求不严格的调查所需样本量较小些。 样本量的大小涉及到调研中所要包括的人数或单元数。确定样本量的大小是比较复杂的问题,既要有定性的考虑也要有定量的考虑。 从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。 具体确定样本量还有相应的统计学公式,根据样本量计算公式,我们知道,样本量的大小不取决于总体的多少,而取决于(1) 研究对象的变动程度;(2) 所要求或允许的误差大小;(3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。因此,如果不同城市分别进行推断时,"大城市多抽,小城市少抽"这种说法原则上是不对的。在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 总之,在确定抽样方法和样本量的时候,既要考虑调查目的,调查性质,精度要求(抽样误差)等,又要考虑实际操作的可实施性,非抽样误差的控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质,进行综合权衡,达到一个最优的样本量的选择。 实际研究中的一些经验 根据一些学者的研究,以及远东零点在市场研究中的经验,市场调查中确定样本量通常的做法是: 1、通过对方差的估计,采用公式计算所需样本量,主要做法有: 2、用两步抽样,在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n; 3、如果有以前类似调查的数据,可以使用以前调查的方差作为总体方差的估计。 4、根据经验,确定样本量,主要方法有: 5、如果以前有人做过类似的研究,初学者可以参照前人的样本。 6、如果是大型城市、省市一级的地区性研究,样本数在500-1000之间可能比较适合;而对于中小城市,样本量在200-300之间可能比较适合;如果是多省市或者全国性的研究,则样本量可能在1000-3000之间比较适合。 7、作为一个常识(主要是为了显著性检验),要进行分组研究的每组样本量应该不少于50个。 8、通过试验设计所作的研究,可以采用较小的样本量。如产品试用(留置)调查,在经费有限的情况下,可以将每组的样本量降低至30个左右,最好每组在50以上。此外,我们在多次的实际研究

抽样调查心得

抽样技术学习心得 姓名:赵胜男 学号:6 学院:理学院 班级:信息102班 教师:刘红梅

大三下学期我们学习了抽样调查这门课程,抽样调查是统计学专业的专业基础课,虽然我们不是统计学专业的学生,我认为了解与掌握有关抽样调查的知识和技能也是非常重要的。学了这门课程,我受益匪浅,我了解了抽样调查相关的概念与发展历史,同时抽样调查存在实际意义,在政府部门、各社会团体、企业单位等地方得到了非常广泛的应用,是了解情况和收集信息的最主要的方式。下面我浅谈下对于抽样调查这门课程的感悟,以及学习到的知识: 一.抽样调查概念 抽样调查是根据随机的原则从总体中抽取部分实际数据进行调查,并运用概率估计方法,根据样本数据推算总体相应的数量指标的一种统计分析方法。 二.抽样调查特点 抽样调查从研究对象的总体中抽取一部分个体作为样本进行调查,据此推断有关总体的数字特征。有较好的经济性,实效性,同时适应面广,准确性高。抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。 与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称登记误差或调查误差),一种是代表性误差(也称抽样误差)。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。 抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。 (3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。

样本量的确定方法.

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

样本量的确定方法.

如对你有帮助,请购买下载打赏,谢谢!样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

抽样调查方案设计

武汉商学院天堂雨伞市场需求抽样 调查方案设计 一.抽样调查的目的 抽样调查的目的在于根据样本调查的结果来推断总体的数量特征。从而明确整个市场的需求,确定企业的发展新方向和新目标。在此次的调查中我们旨在解决市场的最新需求。准确系统的把天堂雨伞这个发展成熟的市场进行深入的调查,分析出自身与竞争对手的实力的差距或者优势明确市场需求特征以求更好的满足其需求。找出自己的市场竞争点的所在,做出新的市场分析。力求做到把握市场的最新动向,了解自己与竞争对手的实力对比做到有的放矢。在调查的过程中做到数据有效性,得到的数据要具有明显得针对性。没有对市场的正确认识和分析,就不可能在日益激烈的市场竞争中战胜对手,壮大自己,发展自己。正确及时而客观的市场调查,可帮助天堂雨伞正确评估自身市场态势、市场地位、市场竞争力,帮助天堂雨伞迅速及时地作出经营决策,化解经营中各种矛盾冲突,保持天堂雨伞良好态势和健康的发展。市场调查成为天堂雨伞发展中不可或缺的重要工具。争取根据样本推断总体中时从中发现一些对于调整市场营销策 略及课程结构调整有价值的数据,从而知道自己的优势和劣势,发 现不足,扬长避短,找准未来的发展方向。 二.抽样市场调查的优点和缺点 抽样市场调查又称概率抽样调查或随机抽样调查,是指调查者为

了特定的调研目的,按照随机原则从调查总体中抽取一部分单位作为样本而进行的一种非全面调查。 其主要特点为:首先样本是按随机原则抽取的,其次是用样本数据推断总体的数量特征。再次为抽样误差不可避免,但可以计算和控制。 抽样市场调查的优点:首先是调查方式的科学性,它有充分的数据依据,能够将调查样本的代表性误差控制在允许的范围内,调查费用的经济性调查规模比全面调查小,资料收集,汇总处理工作量小可以节省人力,物力,财力,从而降低市场调查费用,信息获取的时效 性和调研结果的准确性,其样本按随机原则抽取的,从而排除了主观因素的干扰,能够保证样本推断总体的客观性。 三.确定总体范围和总体单位 总体是所要调查研究的现象的全体,它是由具有同质性和差异性的许多个别事物的集合体。样本是按随机原则从总体中抽出来的一部分单位的综合体,样本中包含的单位个数成为样本量 总体范围的确定应该从时间和空间两方面考虑,即被调查者的入学时间和所在的区域分布。本次调研的总体范围是武汉商学院的在校学生,通过时间及空间的界定,对于时间我们界定在在校的大学生主要是大二和大三学生。本次调研总体还应划分系部,我们主要的调查对象是武汉商学院的全体在校学生。总共预计500名被调查者,即有500名总体单位。然后从中抽取50个样本进行调查。 四.确定抽样推断的主要项目

最新样本量的确定知识讲解

样本量的确定 1. 二值分布(估计比例时的样本容量) 这种情况下,表明可能的采样结果只有两种情况,即是与非的问题。比如调查某一批产品的合格率。样本量的确定主要受以下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N ;通过置信水平即可查表确定z 。 通常情况下置信水平选择95%。抽样偏差为±5%,不过也不完全一定,抽样偏差的确定还是要考虑实际情况,比如最小的调查估计值p=5%,此时抽样偏差就应该小于5%。 这时,就可以确定样本量: 22 2(1)(1)z p p n z p p e N -=-+ P 值的确定:用以前类似样本得到的结果来近似,如果完全不知道就设p=0.5,因为此时方差最大,可求得一个比较保守的样本容量。 样本容量和在p=0.5时运用简单随机抽样估计p 值得到的抽样偏差e

如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 (1)z p p n e -= 事实上当总体容量很小时,不会采用抽样调查,而是普查了。 2. 正态分布(估计均值时的样本容量) 在这种情况下,表明采样的结果是具有多样性的,并不局限在0、1上。比如对某一城市老年人的患病年龄进行统计。这个时候,样本量同样受如下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N 。 样本量为: 22 222 z S n z S e N = + S 表明的是总体标准差,这个可以用以前类似样本得到的S 或是实验调查样本的S 来近似。 同样,如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 2 z S n e = 理论基础: 根据数理统计知识,样本均值对总体均值可构造如下统计量: x X u σ-,他满足标准正态分 布,查表即可得到某一显著性水平下这个统计量的值,这里面的x σ表示总体均值估计量的标准误差。 在无放回简单随机抽样情况下,总体均值估计量的标准误差表达式: x σ=

在市场研究中样本量的确定

在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在市场研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式(1): 其中: n:代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为(2): 其中: n :所需样本量 Z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68 p:目标总体的比例期望值 d:置信区间的半宽

关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为: 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公式(1)变形,我们有:

抽样调查基础

第九章抽样调查基础 一、本章重点 1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。 2.抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。正态分布的密度函数有两个重要的参数(σ;x )。它有对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。推出了样本分布的标准差为:1--=N n N n x σμ。 4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。 抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。 在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σ μ=,不

重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N n n x -=1σμ。在通常情况下总体的方差是未知的,一般要用样本的方差来代替。 把抽样调查中允许的误差范围称作抽样的极限误差x ?或p ?。μt =?,用抽样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的置信度。抽样的极限误差越大,抽样估计的置信度也越大。抽样估计又可区分为点估计和区间估计。按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。 二、难点释疑 1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M 表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城

抽样调查样本量的确定_侯志强

新视角 108 经济理论研究 抽样调查样本量的确定 侯志强1,2  吴启富 3 (1.北方工业大学,北京100041;2.中国人民大学统计学院,北京100872;3.首都经济贸易大学统计学院,北京100026)摘要:样本量确定是抽样调查中的一个重要内容。确定样本量需要综合考虑费用与精度。抽样方式也是影响样本量的一个重要因素。简单随机抽样估计总体比例确定样本量需要同时考虑两个精度要求,即估计量方差上限与估计量离散系数上限。分层随机抽样的样本量还受各层样本量分配方式的影响。复杂抽样的样本量需要借助抽样设计效应才能计算。样本量经过调整后才能满足实际调查的需要。关键词:抽样调查;样本量;费用;精度;设计效应 一、引言 抽样调查是按照随机原则从总体中抽取部分个体进行观察并据此对总体参数作出一定可靠程度推断的科学。抽取个体的数量称为样本量。在一定抽样方式下,样本容量越大,估计精度就越高,所需费用也就越大。因此,样本量受费用与精度的双重制约。简单随机抽样样本量的确定是其它抽样方式样本量确定的基础。在简单随机抽样中,经常需要估计几个总体比例,有些总体比例较大,有些则较小,但许多人总是根据估计量方差上限这个唯一的精度要求确定所谓的“保守”样本量,殊不知当所要估计的总体比例很小时,这个“保守”的样本量根本谈不上“保守”。本文试图解决这个问题,并探讨其它抽样方式下样本量的确定问题。 二、简单随机抽样样本量的确定 在简单随机抽样下,若给定费用要求,则可通过费用函数确定样本量。通常的费用函数为 C T =c 0+c 1n (1)其中,C T 表示总费用,c 0表示固定费用,c 1表示调查一个样本单元的平均费用,n 表示样本量。 那么,样本量为 n =C T -c 0c 1 (2) 通过式(2)可以确定样本量的上限,即总费用所允许的最大样本量,记为n U 。 简单随机抽样的样本量还可通过精度确定,通常规定估计量方差的上限。 例如,已知总体方差为 2 ,需估计总体均值X — ,其简单 估计量为样本均值x — ,则在重复抽样条件下,估计量方差为 D (x —)= 2 n (3) 若要求估计量x — 的方差不许超过常数V ,则有 2n ≤V (4)从而样本量满足 n ≥ 2V (5) 通过式(5)可以确定样本量的下限,即精度所允许的最小样本量,记为n L 。 当n L ≤n U 时,样本量可取n L 与n U 之间的任何值; 当n L >n U 时,必需认真权衡费用与精度,若费用更重要,则取n U ;否则,取n L 。若需要估计总体比例P ,则其简单估计量为样本比例p ,在重复抽样条件下,估计量方差为 D (p )=P (1-P ) n (6) 若要求估计量P 的方差不许超过常数V ,则有P (1-P ) n ≤V (7)从而样本量满足 n ≥P (1-P )V (8) 容易知道,P (1-P )在P =0.5时取到最大值0.25,从而可得一个“保守”的样本量 n a =0.25V (9)许多人正是根据式(9)来确定所谓的“保守”样本量,但对于较小的总体比例P ,这个“保守”样本量从估计量离散系数的角度看根本谈不上“保守”。详述如下: 已知估计量p 的离散系数为C V (p )= D (p )P =1-P n P (10)从式(10)可以看出,当n 取“保守”的样本量n a 时,随着总体比例P 从1到0变化,估计量的离散系数C V (p )逐渐增加。不难想象,当P 小到一定程度时,C V (p )将大到不能容忍的程度。 一个自然的修正方法是:除根据估计量的方差上限确定样本量外,再根据估计量的离散系数上限确定样本量,然后取两者中较大者。 设最小的总体比例P =P L ,限定估计量p 的离散系数不许超过常数C 。则根据式(10),可得另一个“保守”的样本量 n b =1-P C 2 P L (11)这样,取这两个“保守”样本量的较大者,即n =m a x (n a ,n b ) (12)

下列抽样调查中,样本

竭诚为您提供优质文档/双击可除下列抽样调查中,样本 篇一:6-2第六章抽样(习题解答) 第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技

术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。

3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,排除了人的主观因素的选择。 4、分层随机抽样 分层随机抽样又称为分类随机抽样,是把调查总体按其属性不同分为若干层次(或类型)然后在各层(或类型)中随机抽取样本的技术。 5、分群随机抽样 分群随机抽样(clustersampling),又称整群抽样,是把调查总体区分为若干个群体,然后用单纯随机抽样法,从中抽取某些群体进行全面调查的技术。 6、系统抽样 系统抽样(systematicrandomsampling),又称等距离随机抽样或机械随机抽样。它是在总体中先按一定标志顺序排列,并根据总体单位数和样本单位数计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位的技术。 7、非随机抽样 非随机抽样(non-probabilitysampling),亦称为非概率抽样或非可能率抽样等,是对总体中每一个个体不具有被

相关文档
最新文档