市场调查中样本容量的确定
市场调查报告的样本容量计算方法

市场调查报告的样本容量计算方法市场调查是企业重要的决策依据,准确的样本容量计算是确保调查结果的可靠性和准确性的重要环节。
本文将从参考值的确定、合理抽样设计和样本容量计算方法三个方面,详细解析市场调查报告的样本容量计算方法。
一、参考值的确定参考值是指调查目标在整个调查样本中的分布情况。
正确选择参考值对于样本容量计算非常重要。
一般情况下,参考值可以通过历史数据、先前的调查结果或专家意见等方式获得。
二、合理抽样设计合理的抽样设计是样本容量计算的关键。
常用的抽样方法有概率抽样和非概率抽样。
其中,概率抽样是一种随机抽样方法,可以提高样本的代表性,减小抽样误差。
而非概率抽样则不能保证样本的代表性,容易引入抽样偏差。
在抽样设计中,需要考虑以下几个方面:抽样方法的选择、样本分层和配额、样本选取的时间和地点、问卷设计、调查员的培训等。
通过合理的抽样设计,可以避免选择偏差,提高样本调查的准确性和可靠性。
三、样本容量计算方法样本容量的计算是基于统计学原理和需求的不同而来的。
常用的样本容量计算方法有以下六种:1. 简单随机抽样简单随机抽样是最常用的样本容量计算方法。
通过样本的均值和方差,结合显著性水平和置信度来计算样本容量。
根据中心极限定理,样本容量越大,样本均值的抽样误差越小。
2. 系统抽样系统抽样是指按照一定的规则从总体中选择样本的方法。
样本容量的计算需要考虑总体规模、抽样比例和置信度等因素。
3. 比例抽样比例抽样是按照总体各分层的比例抽取样本。
样本容量的计算需要考虑总体比例、分层比例、置信度和显著性水平等因素。
4. 误差限制抽样误差限制抽样是根据调查目标的要求,限制抽样误差的大小来确定样本容量。
样本容量的计算需要考虑目标误差、置信度和样本均值等因素。
5. 方差最小抽样方差最小抽样是根据调查目标的方差大小来确定样本容量。
样本容量的计算需要考虑总体方差、置信度和样本均值等因素。
6. 回归分析抽样回归分析抽样是通过回归分析的方法,根据总体的特征来确定样本容量。
样本量的确定

当研究的特征具有最大的变异程度时,调 查需要的样本容量也最大。
对于只取两个值的特征,则当这两个值在 总体中以50—50的比例出现时,特征的变 异程度最大。
SSI
第23页
如果所研究特征的真实变异程度大于确定 样本容量时我们估计的变异程度,那么, 调查估计值的精度就会低于期望的精度。
注意,公式(1)使用了有限总体校正因子n/N,对总体规模进行校 正。如果忽略这个因子,初始样本容量n1就可以按下列公式计算:
SSI
第30页
设计效果因子
一般来说,当样本容量的计算公式假定为简单随机抽样SRS, 但使用的是更复杂的选样方式时,达到既定精度所需的样本容量应
该乘以设计效果因子。
设计效果=对于同样规模的样本容量,给定样本设计下 估计量的抽样方差对简单随机抽样估计量的 抽样方差的比率。
对于简单随机抽样设计,设计效果 = 1
SSI
第20页
我们来看假设有一个首次开展的调查,试图估 计对某企业提供的服务持满意态度的顾客比例。对 “顾客满意”这一指标,设置两个可能的值:满意 或者不满意。
SSI
第21页
SSI
表2 列出了持满意和不满意态度的顾客可能占的比例的组合
1
100% 满意
2
90% 满意
3
80% 满意
4
70% 满意
5
60% 满意
6
50% 满意
7
40% 满意
8
30% 满意
9
20% 满意
10
10% 满意
11
0% 满意
0% 满意 10% 满意 20% 满意 30% 满意 40% 满意 50% 满意 60% 满意 70% 满意 80% 满意 90% 满意 10% 满意
抽样调查试题及答案

抽样调查试题及答案一、单选题1. 抽样调查中,样本容量的确定主要取决于以下哪个因素?A. 总体的规模B. 总体的变异性C. 研究者的兴趣D. 研究的预算答案:B2. 在抽样调查中,如果样本容量太小,可能导致以下哪种结果?A. 抽样误差增大B. 抽样误差减小C. 抽样误差不变D. 抽样误差无法确定答案:A3. 以下哪种抽样方法属于概率抽样?A. 便利抽样B. 判断抽样C. 系统抽样D. 配额抽样答案:C二、多选题1. 抽样调查的优点包括以下哪些?A. 节省时间和资源B. 可以快速得到结果C. 能够全面反映总体情况D. 可以减少非抽样误差答案:ABD2. 以下哪些因素会影响抽样调查的准确性?A. 抽样方法B. 样本容量C. 抽样误差D. 非抽样误差答案:ABCD三、判断题1. 抽样调查的结果可以完全代表总体。
()答案:错误2. 抽样调查中,样本的代表性越强,抽样误差越小。
()答案:正确3. 抽样调查中,样本容量越大,抽样误差就越小。
()答案:错误四、简答题1. 请简述抽样调查与普查的区别。
答案:抽样调查是从总体中随机抽取一部分样本进行研究,以推断总体的特征,而普查是对总体中的每一个个体都进行调查。
抽样调查的优点是节省时间和资源,但可能存在抽样误差;普查能够全面反映总体情况,但成本较高。
2. 请说明在进行抽样调查时,如何保证样本的代表性?答案:保证样本代表性的方法包括:确保抽样框的全面性,避免样本选择偏差;采用随机抽样方法,如简单随机抽样、分层抽样、系统抽样等;确保样本容量足够大,以减少抽样误差;对样本进行分层或分层抽样,以确保不同子群体的代表性。
五、计算题1. 如果一个总体有10000个个体,研究者希望抽样误差不超过5%,置信水平为95%,试计算所需的最小样本容量。
答案:根据抽样误差公式,n = (Z^2 * p * (1-p)) / E^2,其中n为样本容量,Z为置信水平对应的Z值,p为总体比例,E为允许的误差范围。
样本容量的确定

都在此范围内 而通过简单随机样本对总体做的估计为实际总体平均值 2 倍标准误差范围 内的概率为 95 在实际总体平均值 3 倍标准误 差范围内的概率为 99.7 5.5.3 点估计和区间估计
当利用抽样要对总体平均值进行估计时 有两种估计方法 点估计和区间估计 点估计 是指把样本平均值作为总体平均数的估计值 观察图 5.3 的平均数抽样分布可知某一特定的 抽样结果 其平均数很可能相对更接近总体平均数 但是 样本平均数分布中的任一个值都 可能是这一特定样本的平均值 有一小部分的样本平均值与实际总体平均值有相当的差距 这种差距就叫抽样误差
在任何确定样本容量的问题中 都必须认真考虑所要分析并要据此做统计推断的总体样 本的各个子群的数目的预期容量 例如 从整体上看样本容量为 400 很符合要求 但若要分 别分析男性和女性被调查者 并且要求男性与女性的样本各占一半 那么每个子群的容量仅
1
广州方舟市场研究有限公司
统计学基础知识
为 200 这个数字是否符合要求 能使分析人员对两组的特征做出预期的统计推断呢 再如 要按年龄和性别分析调研结果 问题就变得更复杂了 假设要按以下方式将总体样本划分为 四组
5
广州方舟市场研究有限公司
统计学基础知识
5.5.2 根据单个样本做出推断 在实际操作中 人们往往不愿从总体中抽出所有可能的随机样本 画出像表 5.3 和图 5.4
那样的频率分布表和直方图来 人们希望进行简单的随机抽样 并据此对总体进行统计推断 问题出现了 通过任一简单的随机样本对总体均数进行的估计 其估计值在总体平均值 1 个标准误差内的概率究竟为多大 根据表 5.2 可知概率为 68 因为所有样本平均数有 68
第十三章 确定样本容量

采用有限乘数来计算样本容量的公式如 下:
N −n 样 容 =样 容 公 × 本 量 本 量 式 N −1
(二)、用平均数确定样本容量 )、用平均数确定样本容量
其公式如下:
s2 z2 n= 2 联 的标准误差来表明);s为由估计的标准差表明的 可变性;e为样本估计值相对于总体的精确度或可 接受误差。
三、确定样本大小时实际应考虑的问题
(一)如何估计总体的差异性 一
)、置信区间法 (五)、置信区间法
运用差异性置信区间、 置信区间法:运用差异性置信区间、样本分布 以及平均数标准误差或百分率标准误差等概念来 创建一个有效的样本。 创建一个有效的样本。 1、差异性的概念 、 差异性是指受访者对某一特定问题的答案在相异 差异性是指受访者对某一特定问题的答案在相异 或相似性)方面的总括。 性(或相似性)方面的总括。 如果多数回答都接近同一个数字, 如果多数回答都接近同一个数字,而且大多数的 回答都集中在某一小范围内,则差异性小;反之, 回答都集中在某一小范围内,则差异性小;反之, 则差异性大。 则差异性大。
平均数标准误差的计算公式如下: 平均数标准误差的计算公式如下: 的计算公式如下
S Sx = n 式 : x为 均 标 误 ; 为 本 准 ; 中 S 平 数 准 差 S 样 标 差 n为 本 量 样 容 。
百分率标准误差计算公式如下: 百分率标准误差计算公式如下: 计算公式如下
p×q Sp = n 式 : p为 分 标 差 p为 本 的 分 ; 中 s 百 率 准 ; 样 中 百 率 q为 100 − p) n为 本 量 ( ; 样 容 。
第五章 抽样:样本容量的确定(市场调研-北京大学,胡健颖)

9
第五章 抽样:样本容量的确定
3) 均值或比例的标准误差(standard error) ,或抽 样平均误差,公式为: 均值 比例
x
n
P
P(1 P) n
2014-2-6
北京大学光华管理学院 胡健颖
10
第五章 抽样:样本容量的确定
4) 通常总体标准差 σ 是未知的,在这种情况下,可以通过 下面的公式从样本中估计总体的标准差: 均值 比例
思考题: ① 迪斯尼世界的调查表明,有 60%的老顾客喜欢玩滑行铁道。 若要求误差不超过 2%, 置信度为 90% (Z 值查参考书 552 页) , 求所需的样本容量。 ② 客户要求置信度为 99%,允许抽样误差为 2%,按此计算出 需要样本容量为 500,调查费用是 20,000 美元,但他只有 17,000 美元的预算,问有没有其他方案可供选择? ③ 在具有什么条件下,进行调查前就可以将样本容量确定下 来?
在确定估计比例所需的样本容量时有一个优势:如果缺乏估计 P 的依据,可以对 P 值做最糟糕的假设。给定 Z 值和 E 值,P 值 为多大时要求的样本容量最大呢?当 P=0.05 时, “P(1-P)”有极大 值 0.25 存在。
2014-2-6
北京大学光华管理学院 胡健颖
30
第五章 抽样:样本容量的确定
2014-2-6
北京大学光华管理学院 胡健颖
25
第五章 抽样:样本容量的确定
表 5-1 1000 个样本平均数的概率分析:最近 30 天内吃快餐的平均次数 次数分组 2.6-3.5 3.6-4.5 4.6-5.5 5.6-6.5 6.6-7.5 7.6-8.5 8.6-9.5 9.6-10.5 10.6-11.5
统计学样本容量的确定

统计学
STATISTICS
样本容量确定的准则
在对精度有要求时,寻求能够 保证精度要求的费用最省的样本 量;
由于费用通常是关于样本量的 正向线性函数,故使费用最省的 样本量也就是使精度得到保证的 最小样本量;
在费用有预算限制的时候,寻 求费用预算范围内使精度达到最 高的样本量。
5 -2
统计学
STATISTICS
• 根据比例区间估计公式可得样本容量n为:
• •
n(z2
重复抽样
)2(1)
d2
•
•
不重复抽n样(NN 1)(dz22()2 z2()1 2 (1))
d的取值一般小于0.1
其中: dz 2
p(1 p) n
• π未知,以样本比例p替代
• π或p都未知时,可取0.5,这是一种谨慎估计
5 -8
STATISTICS
(例题分析)
解: 已知=2000,d=400, 1-=95%, z/2=1.96
置信度为95%的置信区间为:
n(zd2 2)22
(1.96)220020
4002
96.0497
即应抽取97人作为样本。
5 -6
统计学
STATISTICS
估计总体比例时样本容量的确定
5 -7
统计学 估计总体比例时样本容量的确定
统计学 估计总体比例时样本容量的确定
STATISTICS
(例题分析)
【例】根据以往 的生产统计,某 种产品的合格率 约 为 90% , 现 要 求允许误差为5% , 在 求 95% 的 置 信区间时,应抽 取多少个产品作 为样本?
5 -9
解 : 已 知 p=90% , 1-=95% ,
样本容量的确定

四、样本容量的确定
2. 估计总体比例时样本容量的确定
(1)重复抽样条件下样本容量的确定。 进行总体比例的区间估计时,总体比例p的置信区间为
(5-53) (2)不重复抽样条件下样本容量的确定。 当有限总体不重复抽样时,同理可得允许误差为
(5-57)
四、样本容量的确定
【例5-25】 某茶叶生产厂对某批10000包茶叶的每ቤተ መጻሕፍቲ ባይዱ包平均重量和合格率进行检验,根据以往资料,每包平均重 量的标准差为10g,茶叶合格率为92%,在概率保证程度 为95.45%、每包茶叶平均重量的抽样极限误差不过2g、 合格率的抽样极限误码差不超过5%的条件下,求应抽取多 少包茶叶进行检验。
四、样本容量的确定
或
式中,n′为重复抽样的样本容量。 抽检合格率,由p=92%,Z=2,Δp=5%,得
或
所以,在不重复抽样条件下,抽检平均每包重量时需要抽取99包茶叶,抽 检合格率时需要抽取117包茶叶。
四、样本容量的确定
3. 估计两个总体均值之差时样本容量的确定
(在估计两个总体均值之差时,样 本容量的计算与上述类似,在给定的允 许误差和置信水平条件下,估计两个总 体均值之差所需要的样本容量为
(5-59)
四、样本容量的确定
4. 估计两个总体比率之差时样本容量的确定
在给定的允许误差和置信水平为1-α的 条件下,估计两个总体比率之差时所需的样本 容量为
(5-60)
四、样本容量的确定
【例5-27】 某厂家要估计消费者对一种新产品认知的广告效果,该厂在广 告前和广告后各抽取一个消费者随机样本进行调查,若以10%的允许误差和95% 的置信水平估计广告前和广告后知道该产品消费者的比率之差,则应从两个样本 中分别抽取多少名消费者进行调查?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16 CHINA STATISTICS
市场调查中样本容量的确定
文/陈克明 宁震霖
在市场调研工作中,采用随机抽样进行资料采集时,需要预先确定样本量的大小。
我们知道,在系统误差确定的条件下,抽样调查的准确性取决于抽样误差,而抽样误差的大小又与样本容量有直接的关系,即样本容量越大,抽样误差就越小。
当然,这并不能说在抽样调查中样本容量越大就越好,因为样本容量越大,调查的费用就越高。
因此,决定样本容量大小的主要因素是特定的调研项目对抽样误差的要求和项目预算经费这两个方面。
在实际工作中,样本容量的确定实际上就是在抽样误差与经费预算之间求得最佳的平衡,即在可以接受的抽样误差的条件下使用最少的经费,当然,有时候则可能是在一定的经费额度条件下争取最小的抽样调查误差,而这个误差当然必须是可以接受的。
所以,在市场调研中,随机抽样调查样本容量的确定,通常都是先根据调查对抽样误差的要求来考虑。
根据抽样误差要求确定的样本容量
根据随机抽样的基本原理,样本容量可以通过抽样误差、极限误差及置信度等因素的分析来加以确定。
设在简单随机抽样(重复抽样)的条件下,置信度(t )与抽样误差(μ)及极限误差(Δ)的关系为t =Δ/μ,均值指标的抽样误差(μ)是由总体标准差(δ)和样本容量(n )决定的,即
显然,整理可得:
这就是说,只要我们能够确定总体标准差(δ)、置信度(t)和极限误差(Δ),样本容量即可确定。
第一,总体标准差的确定。
总体标准差虽然是客观存在的,但我们是无法直接得到准确的数据的,所以在抽样调查中只能使用近似值,通常有几种简便的处理办法。
1.试验性抽样调查。
在调研总体规模较大的情况下,可采用抽样调查方法估计δ。
即根据抽样调查所取得的样本标准差S的结果求得δ。
根据概率论和数理统计的有关知识可知:
而 (其中X i 是样本值,X -
是样本
均值,n 是样本容量,δ是δ的最大似然估计),所以有 。
在样本容量n 满足大样本(一般不少于30个)的情况下, ,即 。
也就是说,可以专门做一次n>30的抽样调查,用该样本资料可以计算得到样本标准差S,用样本标准差代替总体标准差。
2.利用历史资料或二手资料。
一般地,大多数企业过去都曾经做过相关的市场调查,或相关部门(企业内部或企业外部)存有相关的二手统计资料,可以利用这些资料来估计总体标准差δ。
3.估算。
根据概率论和数理统计的有关知识可知,在标准正态分布条件下,距离中心 的范围内分布了相当于总体的99.73%的变量,我们可将99.73%近似于总体的全部变量,即近似于100%。
据此,只要能找出总体中最大值X max 和最小值X mi x ,然后根据近似公式 ,求得总体标准差δ。
4.运用管理人员的经验判断。
在抽样调查实践中,如果要求不是非常严格,可以根据管理人员的有理有据的经验判断来估计总体标准差δ。
第二,极限误差或最大允许误差的确定。
它是抽样调查实施者愿意接受或可容忍的最大误差,极限误差是一个临界值,
即误差超过这个临界值在很大的可能性上会改变事物的性质,如我们确定月收入在1000-1500元的为中等收入,其平均收入
水平为1250元,如果极限误差超出±250,则可能发生本来实际上属于中等收入水平的被划归入高收入阶层或低收入阶层,从而导致得出完全不同的分析结论,导致错误。
极限误差的确定需要具体问题具体分析。
在抽样调查实践中,极限误差的确定可以根据经验和定性分析,先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步加以缩小,如果太小就逐步扩大,放大该初始值,直到该值达到可能导致分析失误的临界状态,这个临界值就可以作为极限误差。
17
CHINA STATISTICS
第三,置信度t 值的确定。
它是以抽样误差表示的可接受的置信度,即总体均值包括在制定置信区间内的可靠性。
在市场调研实践中,一般可以先取t=2,即置信度水平为95.45%,这是一个把握程度比较高的估计,也就是对可接受的抽样误差的把握性很高。
多分析指标抽样调查的样本容量
以上介绍的根据抽样误差要求确定样本容量的方法,实际上只考虑了一个分析指标的资料收集的需要,但在实际市场调研工作中,一次调查所需要收集的资料是比较多的,很少只有一个分析指标的。
由于一次调查中涉及的资料较多,指标的形式多样,误差要求各不相同,就必然会出现对样本容量的要求不同。
从指标的形式上看,有的是均值指标,有的是成数指标;从指标的量纲单位上看,有实物量单位,有货币量单位或无量纲单位;从指标值的量级上看,有小量级的,如有小于1大于0的小数点级的,也有上千上万的大量级的;由于这些指标形式的差异,加上对抽样误差的要求不同,计算出来的样本容量的数值也必然是各不相同的,甚至完全可以毫不夸张地说,调查中有多少个调查指标就会有多少个相应的样本容量需要值。
显然,一次抽样调查只能有一个样本容量,因而必须从众多的样本容量需要值中选择确定一个。
在市场调研实践中,可以有两种处理方式:
第一,根据取大原则处理,即将抽样调查的样本容量确定为所有样本容量需要值中的最大值。
这种处理方式的基本理论依据是样本容量越大,抽样误差就越小,因而取最大值可以满足所有指标对抽样误差的要求。
但这样做有可能导致调查费用支出较大,因而这种处理方式适合于调查经费较为充足宽裕的项目。
第二,根据重要性原则处理,即将所有的调查指标按照其在本次调研中的重要作用进行排序(可以借助于AHP层次分析法软件),取排列前三位或前五位中的最大值。
这样做的好处是保证重要资料的精确度要求,如果非重要资料的样本容量要求高,没有必要为非重要资料增加费用支出,可以做到既从整体上保证资料的精确度需要,又节约了一定的经费。
这是一个灵活和妥协的处理方法。
调查成功率对样本容量确定的影响
以上讨论的样本容量实际上调查完成后必须得到的有效数据数,也就是说,如果调查完成后所得到的数据少于这个数量要求,用这些数据进行分析就无法满足对抽样误差的要求,也就是实际误差肯定大于调研者的期望误差。
在一般的抽样调查方法理论中,通常把样本容量看作就是实际调查单位数,这实际上以调查的成功率是百分之百为假设前提的,而在实际的市场调研工作中这是不可能的。
至少有三种情况使调查完成后得到的资料数据数少于预先确定的调查单位数,第一,找不到预先确定的调查对象而无法完成调查;第二,找到预先确定的调查对象,但因某种原因出现拒访现象(包括隐性拒访如敷衍对待、虚假回答等);第三,某些调查项目出现无回答现象。
而有些形式的调查这方面的问题则更加突出,如留置问卷、邮递问卷调查的回收率一般都是比较低的,缺答项常常比较多,数据
质量和有效性较低。
值得指出的是,随机抽样调查必须按照预先确定的样本名单进行资料的采集,当出现有效数据少于必要期望数时,一般不能进行补调查,因为这意味着进行了两次抽样,而这两次抽样的概率通常是不一样的,因而这显然违背随机原则,是不合适的。
所以,随机抽样调查方法在市场调研中的应用,样本容量实际上有两个具体的表现形式,即有效数据数和调查单位数。
鉴于市场调查的成功率不可能百分之百,为了保证足够的有效数据数,必须根据调查的成功率确定相应的调查单位数,即
调查单位数=有效数据数/调查成功率
不同的调查项目因为调研环境、调研方式方法、调查对象、调查内容、组织形式等方面的差异,其调查的成功率是不一样的,在确定样本容量时一般只能根据经验进行大致的估计。
样本容量的最终确定
上述对样本容量确定所做的分析,实际上只是遵循随机抽样调查方法的技术性要求,而市场调研是企业的一项商业性活动,不但需要经费支持,而且需要从经济效益上对经费使用进行精打细算,尽可能地节约开支,所以还必须根据企业用于市场调研的经费状况对样本容量进行必要的调整。
首先必须进行经费需求的测算,一个调研项目的经费包括不变费用和可变费用两部分,不变费用是指与样本容量无关的费用,如项目的前期费用、方案设计费、管理费等;可变费用是指与样本容量有关的费用,如问卷复印费、调查劳务费、交通费、资料处理费、礼品费等。
如果各项费用的测算都能做到十分精确的话,一个市场调研项目的费用总额就取决于样本容量的大小。
要使调研费用最低,在上述样本容量的确定过程中,必须使有效数据数达到最小,当然这种最少是指能满足调研精确度要求的最小有效数据数。
这是可以做到的,在上述第一部分的分析中,有效数据数是由总体标准差、极限误差和置信度这三个因素决定的,由于总体标准差是反映总体分布的测度指标,是客观存在的,我们不能随意加以改动;而极限误差和置信度则可以适当进行调整。
很显然,扩大极限误差和降低置信度要求,都可以达到减少有效数据数的目的。
一方面,如果经过分析后认定极限误差尚未达到最大临界值,可以考虑将其扩大,这意味着在一定程度上放宽对调查精确度的要求,但在没有超过最大临界值的情况下,这是允许和可以接受的;另一方面,适当降低置信度要求也是可能的,如将t 由2降低为1.65甚至于更低些,其置信水平为90%或略低于90%,这个把握程度也是相当可靠的,是完全可行的。
当然,这样处理风险是比较大的,所以,在经费允许的条件下,并不一定要把极限误差和置信度调整到极限状态,而应该留有一定的余地;另一方面,必须通过加强对调查过程的管理控制和提高调查技术水平来保证和提高调查成功率,因为高调查成功率意味着在不减少有效数据数的条件下可以减少调查单位数量,从而节约了调查费用。
(作者单位:福建省泉州市华侨大学商学院)。