市场研究中样本量的确定

合集下载

市场调研中的样本选择与样本量确定方法

市场调研中的样本选择与样本量确定方法

市场调研中的样本选择与样本量确定方法在市场调研过程中,样本选择和样本量确定是非常重要的步骤。

合理的样本选择和样本量确定方法可以确保调研数据具有代表性和可信度。

本文将介绍市场调研中常用的样本选择和样本量确定方法,并对其优缺点进行详细分析。

一、样本选择方法1. 简单随机抽样简单随机抽样是指从总体中按照相同的概率独立地随机选择样本的方法。

这种方法能够确保每个样本的选择机会相等,具有代表性。

但是,在实际应用中,可能会存在抽取样本不完全随机的情况,导致样本选择的偏倚。

2. 系统抽样系统抽样是按照一定的规律从总体中选择样本的方法,例如每隔固定的间隔选择一个样本。

这种方法相对简便,但可能会引入一定的抽样偏倚。

3. 分层抽样分层抽样方法是将总体划分为若干个互不重叠的子总体,然后从每个子总体中进行抽样。

这种方法可以保证每个子总体的代表性,适用于样本选择上具有多个明显特征的总体。

4. 整群抽样整群抽样是指将总体分成若干个互不重叠的群体,然后从中随机选择若干个群体作为样本。

这种方法适用于总体具有自然形成的群体,例如某个地区的消费者群体。

二、样本量确定方法1. 经验法经验法是根据研究者的经验和专业知识来确定样本量。

这种方法操作简单,但容易受主观因素的影响,不够科学准确。

2. 公式法公式法是根据统计学原理和抽样误差要求来确定样本量。

常用的公式包括通过总体标准差来计算样本量的公式和通过总体比例来计算样本量的公式。

这种方法相对科学准确,但需要掌握一定的统计学知识。

3. 置信度和置信水平法置信度和置信水平法是根据置信度和置信水平来确定样本量。

研究者可以根据不同的置信度和置信水平来确定合适的样本量。

这种方法能够更好地控制研究结果的可靠性。

4. 功效分析法功效分析法是通过设定研究效应值和研究检验的显著性水平,来确定样本量。

这种方法可以帮助研究者评估样本量对研究结论的影响,并给出具体的样本量要求。

在确定样本量时,还需要考虑研究的目的、资源限制和可行性。

样本量的确定

样本量的确定
要对这样的变量提供精确的估计值,需要 较大的样本容量。
当研究的特征具有最大的变异程度时,调 查需要的样本容量也最大。
对于只取两个值的特征,则当这两个值在 总体中以50—50的比例出现时,特征的变 异程度最大。
SSI
第23页
如果所研究特征的真实变异程度大于确定 样本容量时我们估计的变异程度,那么, 调查估计值的精度就会低于期望的精度。
注意,公式(1)使用了有限总体校正因子n/N,对总体规模进行校 正。如果忽略这个因子,初始样本容量n1就可以按下列公式计算:
SSI
第30页
设计效果因子
一般来说,当样本容量的计算公式假定为简单随机抽样SRS, 但使用的是更复杂的选样方式时,达到既定精度所需的样本容量应
该乘以设计效果因子。
设计效果=对于同样规模的样本容量,给定样本设计下 估计量的抽样方差对简单随机抽样估计量的 抽样方差的比率。
对于简单随机抽样设计,设计效果 = 1
SSI
第20页
我们来看假设有一个首次开展的调查,试图估 计对某企业提供的服务持满意态度的顾客比例。对 “顾客满意”这一指标,设置两个可能的值:满意 或者不满意。
SSI
第21页
SSI
表2 列出了持满意和不满意态度的顾客可能占的比例的组合
1
100% 满意
2
90% 满意
3
80% 满意
4
70% 满意
5
60% 满意
6
50% 满意
7
40% 满意
8
30% 满意
9
20% 满意
10
10% 满意
11
0% 满意
0% 满意 10% 满意 20% 满意 30% 满意 40% 满意 50% 满意 60% 满意 70% 满意 80% 满意 90% 满意 10% 满意

样本含量的估计

样本含量的估计

样本含量的估计在统计学中,样本含量是指用于研究的数据集合的大小。

估计合适的样本含量对于研究的准确性和实用性来说至关重要。

样本含量的估计是一项复杂的任务,需要考虑多个因素,包括研究目的、数据类型、样本分布以及研究假设等。

本文将讨论样本含量的估计方法以及在研究中的应用。

一、估计样本大小的方法确定适当的样本大小可以确保对研究问题的回答具有良好的准确性和统计意义。

下面是一些常用的方法:1. 经验公式法这是一种简单的估计方法,通常用于初步设计和计划阶段。

公式的一般形式如下:n = (Z^2 * σ^2) / e^2其中,n是样本大小,Z是置信水平(通常取1.96),σ是总体标准差,e是误差的允许程度。

这个公式假设样本是从正态分布中随机抽取的,而且总体标准差是已知的。

当总体标准差未知时,可以使用样本标准差作为替代品。

2. 功效分析法功效分析是指确定所需的样本大小,以便在某个置信水平下检测到特定的效应大小或显著水平。

这种方法可以确保研究具有充分的统计功效,从而提高了研究的可靠性。

为进行功效分析,需要首先假定研究设计、所需的显著水平和效应大小,然后使用统计软件进行计算。

3. 模拟方法这种方法是一种计算复杂的方法,通常用于验证功效分析的结果。

这种方法涉及到用计算机程序生成各种可能的数据分布以及样本数量,以确定最佳的样本数量。

通过模拟不同的样本数量,可以确定最佳的样本大小,从而提高实验或研究的有效性和准确性。

二、何时估计样本量估计样本量的最佳时间是在研究设计和计划阶段。

在这个阶段,研究人员需要考虑多个因素,包括研究目的、研究假设、类型和数量的数据,以及可得到的资源和时间。

在确定研究设计,数据采集和分析计划以及时间表之前,应该优先考虑估计样本量的方法和结果。

估计样本量也可以在研究过程中进行。

如果样本量太小,那么结果可能不可靠;如果样本量太大,那么资源和时间将被浪费。

因此,需要及时评估样本大小,并进行必要的调整以确保研究的准确性和实用性。

样本容量的确定

样本容量的确定
抽样结果的点估计在很少的情况下完全准确 因此人们更偏于区间估计 区间估计就是 对变量值如总体平均值的区间或范围进行估计 除了要说明区间大小外 习惯上还要说明实 际总体平均值在区间范围以内的概率 这一概率通常被称为置信系数或者置信度 区间则被 称为置信区间
都在此范围内 而通过简单随机样本对总体做的估计为实际总体平均值 2 倍标准误差范围 内的概率为 95 在实际总体平均值 3 倍标准误 差范围内的概率为 99.7 5.5.3 点估计和区间估计
当利用抽样要对总体平均值进行估计时 有两种估计方法 点估计和区间估计 点估计 是指把样本平均值作为总体平均数的估计值 观察图 5.3 的平均数抽样分布可知某一特定的 抽样结果 其平均数很可能相对更接近总体平均数 但是 样本平均数分布中的任一个值都 可能是这一特定样本的平均值 有一小部分的样本平均值与实际总体平均值有相当的差距 这种差距就叫抽样误差
在任何确定样本容量的问题中 都必须认真考虑所要分析并要据此做统计推断的总体样 本的各个子群的数目的预期容量 例如 从整体上看样本容量为 400 很符合要求 但若要分 别分析男性和女性被调查者 并且要求男性与女性的样本各占一半 那么每个子群的容量仅
1
广州方舟市场研究有限公司
统计学基础知识
为 200 这个数字是否符合要求 能使分析人员对两组的特征做出预期的统计推断呢 再如 要按年龄和性别分析调研结果 问题就变得更复杂了 假设要按以下方式将总体样本划分为 四组
5
广州方舟市场研究有限公司
统计学基础知识
5.5.2 根据单个样本做出推断 在实际操作中 人们往往不愿从总体中抽出所有可能的随机样本 画出像表 5.3 和图 5.4
那样的频率分布表和直方图来 人们希望进行简单的随机抽样 并据此对总体进行统计推断 问题出现了 通过任一简单的随机样本对总体均数进行的估计 其估计值在总体平均值 1 个标准误差内的概率究竟为多大 根据表 5.2 可知概率为 68 因为所有样本平均数有 68

第五章 抽样:样本容量的确定(市场调研-北京大学,胡健颖)

第五章  抽样:样本容量的确定(市场调研-北京大学,胡健颖)

9
第五章 抽样:样本容量的确定
3) 均值或比例的标准误差(standard error) ,或抽 样平均误差,公式为: 均值 比例
x

n
P
P(1 P) n
2014-2-6
北京大学光华管理学院 胡健颖
10
第五章 抽样:样本容量的确定
4) 通常总体标准差 σ 是未知的,在这种情况下,可以通过 下面的公式从样本中估计总体的标准差: 均值 比例
思考题: ① 迪斯尼世界的调查表明,有 60%的老顾客喜欢玩滑行铁道。 若要求误差不超过 2%, 置信度为 90% (Z 值查参考书 552 页) , 求所需的样本容量。 ② 客户要求置信度为 99%,允许抽样误差为 2%,按此计算出 需要样本容量为 500,调查费用是 20,000 美元,但他只有 17,000 美元的预算,问有没有其他方案可供选择? ③ 在具有什么条件下,进行调查前就可以将样本容量确定下 来?
在确定估计比例所需的样本容量时有一个优势:如果缺乏估计 P 的依据,可以对 P 值做最糟糕的假设。给定 Z 值和 E 值,P 值 为多大时要求的样本容量最大呢?当 P=0.05 时, “P(1-P)”有极大 值 0.25 存在。
2014-2-6
北京大学光华管理学院 胡健颖
30
第五章 抽样:样本容量的确定
2014-2-6
北京大学光华管理学院 胡健颖
25
第五章 抽样:样本容量的确定
表 5-1 1000 个样本平均数的概率分析:最近 30 天内吃快餐的平均次数 次数分组 2.6-3.5 3.6-4.5 4.6-5.5 5.6-6.5 6.6-7.5 7.6-8.5 8.6-9.5 9.6-10.5 10.6-11.5

设计市场调查方案的原则

设计市场调查方案的原则

设计市场调查方案的原则
1.明确研究目标:在设计市场调查方案之前,必须明确研究的目标和目的。

只有清楚地了解你要解决的问题和你想获得的信息,才能设计出合适的调查方案。

2.选择合适的调查方法:市场调查的方法有很多种,包括问卷调查、访谈、焦点小组讨论等等。

在选择调查方法时,需要考虑研究的对象、研究的内容、调查的时间和成本等因素。

3.制定科学严谨的调查问题:调查问题是整个市场调查方案的核心,必须设计科学、严谨、可操作的问题。

调查问题应该与研究目标紧密相关,能够准确地反映受访者的真实想法和感受。

4.确定调查样本和样本量:调查样本和样本量的确定直接影响市场调查结果的可靠性和有效性。

在确定样本时,需要考虑样本的多样性、代表性和随机性等因素。

5.合理排布调查时间和地点:调查的时间和地点应该合理安排,避免影响受访者的情绪和精神状况。

同时,也要考虑到调查的成本和效率。

6.保证调查数据的可靠性和有效性:市场调查数据的可靠性和有效性是保证研究质量的关键。

在调查之前,应该进行充分的准备工作,保证调查数据的准确性、完整性和真实性。

7.对调查数据进行统计分析:在获得调查数据后,需要对数据进行统计分析,提取有效信息和结论。

这需要专业的数据分析工具和技能,以便得出科学、准确的结论和建议。

用于估计总体比例的样本量

用于估计总体比例的样本量

用于估计总体比例的样本量一、引言样本量的确定是统计学中非常重要的一部分,尤其是在进行总体比例估计时。

准确确定合适的样本量可以保证估计结果的可靠性和准确性。

本文将介绍在进行总体比例估计时如何确定合适的样本量,并给出一些实际应用的例子。

二、样本量的确定步骤1. 确定总体比例的预估值在进行样本量的确定之前,我们需要对总体比例进行一个预估。

这可以通过历史数据、先前的研究或者专家经验来得出。

预估值的准确性对样本量的确定有重要影响。

2. 确定置信水平和置信区间在进行总体比例估计时,我们通常需要确定一个置信水平和置信区间。

常见的置信水平有95%、99%等。

置信区间表示我们对总体比例的估计结果的可信程度。

通常情况下,置信水平越高,置信区间越宽。

3. 确定误差容忍度误差容忍度是指我们对于总体比例估计结果的误差的容忍程度。

通常情况下,误差容忍度越小,样本量越大。

4. 使用样本量计算公式计算样本量根据置信水平、置信区间和误差容忍度,我们可以使用样本量计算公式来计算所需的样本量。

样本量计算公式基于二项分布的理论,可以保证在给定的置信水平和置信区间下,使得样本估计结果的误差不超过我们设定的误差容忍度。

三、实际应用举例下面我们通过两个具体的例子来说明如何确定用于估计总体比例的样本量。

例子1:市场调研某公司准备上市一款新产品,需要对目标消费群体的购买意愿进行调研。

根据先前的市场调查,预估该目标消费群体的购买意愿比例为0.6。

为了保证调研结果的可靠性,在95%的置信水平下,希望估计结果的误差不超过0.05。

根据样本量计算公式,我们可以得到所需的样本量为384。

例子2:医学研究某医学研究机构希望研究某种疾病的发病率。

根据历史数据和专家经验,预估该疾病的发病率为0.2。

为了保证研究结果的可靠性,在99%的置信水平下,希望估计结果的误差不超过0.02。

根据样本量计算公式,我们可以得到所需的样本量为1072。

四、样本量确定的注意事项1. 样本量的确定是建立在一定的假设和条件下的,需要根据实际情况进行调整和修正。

在市场研究中样本量的确定

在市场研究中样本量的确定

在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。

对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。

本文将根据自己的经验,探讨在市场研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。

确定样本量的基本公式在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式(1):其中:n:代表所需要样本量Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。

S:总体的标准差;d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。

对于比例型变量,确定样本量的公式为(2):其中:n :所需样本量Z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68p:目标总体的比例期望值d:置信区间的半宽关于调查精度通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。

如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。

而相对误差则是绝对误差与样本平均值的比值。

例如我们可能要求调查收入与真实情况的误差不超过1%。

假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。

公式的应用方法对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。

然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。

因此,公式应用的关键是如何确定总体的标准差S。

如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量:例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为:即需要调查的样本量为864个。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。

对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。

本文将根据自己的经验,探讨在市场研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。

确定样本量的基本公式
在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式:
Z2 S2
n = ------------ (1)
d2
其中:
n代表所需要样本量
Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。

S:总体的标准差;
d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。

对于比例型变量,确定样本量的公式为:
Z2 ( p ( 1-p))
n = ----------------- (2)
d2
其中:
n :所需样本量
z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68
p:目标总体的比例期望值
d:置信区间的半宽
关于调查精度
通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。

如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。

而相对误差则是绝对误差与样本平均值的比值。

例如我们可能要求调查收入与真实情况的误差不超过1%。

假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。

公式的应用方法
对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。

然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。

因此,公式应用的关键是如何确定总体的标准差S。

如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量:
例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为
n=1.962*15002/1002=8,643,600/10,000=864
即需要调查的样本量为864个。

最大样本量
以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。

首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。

总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。

好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念:
变异系数V=标准差S/平均值X<= 1
因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。

当然,这对于我们确定样本量还不能起太大的作用。

然而如果我们采用相对误差表述的精度,对公式(1)变形,我们有:
Z2(S2/X2) Z2V2 Z2
n = --------------------= -------------<= ----------
d2/X2 P2 P2
其中P表示相对误差
根据上述公式,我们可以计算在相对误差一定的情况下,所需的最大样本量。

以下是在置信程度95%的水平下,在不同相对误差下的最高样本量:
相对误差1% 2% 3% 4% 5% 10% 20%
样本量38416 9604 4268 2401 1537 384 104
通常,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%以下,因此,实际所需要的样本量可以进一步缩小。

对于比例型变量,在事先缺乏对比例的估计时,我们可以采用最保守的估计法,即p=0.5,以下是比例p在不同绝对误差程度下,所需的最大样本量(95%置信水平):
p的绝对误差0.01 0.02 0.03 0.04 0.05 0.10
所需最大样本量9604 2401 1067 600 384 96
实际调查样本量的确定原则
虽然我们根据公式可以从理论上确定样本量的上限,但是由于实际工作的经费和时间限制,使用最大样本量的可能性很小;而且,实际研究的情况通常要复杂得多,因为一个研究往往都要考虑多个目标的,即要求对多个指标的误差进行控制,而不是简单地考虑一个指标。

因此我们在实际的市场研究中,我们要综合考虑,采用多种方式来确定样本量。

1、调查的主要目标
一个现实的市场调查往往有多个目标,对于一些目标单一的调查,调查的样本量往往可以很少:100个,甚至50个就足够了。

而对于具有多个目标的研究,必须考虑这些目标中变异程度最大,要求精度最高的目标。

2、分类比较的程度
分类是市场研究中一个最基本的方法,研究者往往是通过分类来发现细分市场,确定产品的市场定位等。

假定对同一变量(研究目标),在一定精度与置信程度下,只要100个样本量就足够了,如果我们仅仅希望了解不同性别的消费者市场,则确定样本量时只需要考虑两类消费者的样本量,这样调查的总样本量可能需要200个以上,如果希望了解不同年龄层的消费者,则可能要将消费者分为多类,如分为:20岁以下,20-35,35-50,50岁以上等四类,这样的样本量需要400个以上。

也就是说,确定样本量时必须考虑到每一类别的样本量。

3、调查区域的大小
根据常识,调查区域越大,所需要的样本量可能越大,因为大区域内的样本变异程度我们通常较难掌握。

此外,在实际研究中,我们还往往需要对大区域进行进一步分类,以寻求更加准确的市场细分。

因此,对于同一调查目标,在上海进行调查所需要的样本量通常是要大于苏州的。

实际研究中的一些经验
根据一些学者的研究,以及个人在市场研究中的经验,市场调查中确定样本量通常的做法是:
1、通过对方差的估计,采用公式计算所需样本量,主要做法有:
Ø 用两步抽样,在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n;
Ø 如果有以前类似调查的数据,可以使用以前调查的方差作为总体方差的估计。

2、根据经验,确定样本量,主要方法有:
Ø 如果以前有人做过类似的研究,初学者可以参照前人的样本。

Ø 如果是大型城市、省市一级的地区性研究,样本数在500-1000之间可能比较适合;而对于中小城市,样本量在200-300之间可能比较适合;如果是多省市或者全国性的研究,则样本量可能在1000-3000之间比较适合。

Ø 作为一个常识(主要是为了显著性检验),要进行分组研究的每组样本量应该不少于30个。

Ø 通过试验设计所作的研究,可以采用较小的样本量。

如产品试用(留置)调查,在经费有限的情况下,可以将每组的样本量降低至15个左右,最好每组在30以上。

此外,我们在多次的实际研究中发现,每组超过50个可能是一种资源浪费。

文中的三个公式:
计算公式比较复杂,统计教材中可以很容易找到确定调查样本量的公式:
n =Z^2*S^2/d^2
其中:
n代表所需要样本量
Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96。

S:总体的标准差;
d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。

但是总体标准差往往难以确定,所以按经验,这个总体数量,抽取600份左右。

当然,如果分层分类控制得好,也可以少一些样本。

相关文档
最新文档