市场研究中的数据分析方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、一元线性回归模型 模型是:
yi 0 1 xi i
y 式中:为被解释变量(因变量);为解释 x 变量(自变量),是随机误差项,i为观测值 0 下标,n为样本容量,0 与 1 是待估参数,称 1 为回归常数wenku.baidu.com为回归系数。
2、多元回归模型
多元线性回归模型中自变量的个数在2个以上, 模型的一般形式为:
表中最大概率组一栏是判别分析得出的组别。13、15号代理商属于“非购买组” 14号代理商属于“购买组”。
第三节 聚类分析
一、聚类分析的基本思想
• 聚类分析(又称数字分类学)是新近发展起来的一种研 究分类问题的多元统计分析方法。 • 样品聚类是对事件进行聚类,或是说对观测量进行聚 类,是对反映被观测对象的特征的变量值进行分类。 • 变量聚类则是当反映事物特点的变量很多时,根据所
(二)基本模型
(三)统计术语
1、先验概率
2、后验概率 3、判别系数 4、结构系数 5、分组的矩心 6、判别力指数 7、残余判别力
三、分析的基本步骤
判别分析一般都是通过现成的统计软件进
行分析。一般而言,利用统计软件的判别分析 具体包括以下步骤:
确定研究 的问题 获取判别分 析的数据 进行判别 分析 评价和解释 分析结果
式样 包装 耐久性
表中,式样 、包装和耐用性的标准化系数分别为 0.91、0.083、0.254。因而,式样是最重要的判别变量, 其次是“耐用性”,最后是包装。
Casewise Statistics Highest Group Squared Mahalanobis Distance to Centroid .454 .651 1.935 .208 .009 .001 .736 .249 .094 2.281 .319 3.064 .748 .208 .065 1.584 1.006 4.910 4.142 85.934 .748 1.660 .428 7.320 6.457 1.994 9.208 Second Highest Group Squared Mahalanobis Distance to Centroid 17.877 7.548 24.452 9.595 13.313 12.358 7.269 9.336 10.550 4.177 16.962 28.136 7.230 9.595 10.885 18.189 7.398 31.800 10.724 93.194 11.655 7.362 8.698 13.042 21.790 17.428 45.539 Discriminant Scores
a C o e ff i c i e n t s
Unstandardized Coefficients Model B Std. Error 1 (Constant) -343.784 414.076 P -195.895 11.041 M 7.472E-02 .010 P欧文 174.403 31.712 P麦当劳 81.057 22.166 a. Dependent Variable: Q
yi 0 1 x1i 2 x2i ... k xki i
i=1,2…n
为被解释变量(因变量), x1 , x2 ,...,xk 为解释变量(自变量), 是随机误 差项,i为观测值下标,n为样本容量,0 , 1 , 2 ,..., k 为k+1个待估参数, 0 为回归常数, 1 , 2 ,..., k 称为回归系数。
=1730.2872
第二节 判别分析
一、判别分析法的基本思想
判别分析包括以下两步: 1、分析和解释各类指标之间存在的差异,并 建立判别函数。 2、以第一步的分析结果为依据,将对那些未 知分类属性的案例进行判别分类。
二、判别分析基本模型与统计术语
(一)假设条件
1、每一个类别都取自一个多元正态总体的样本 2、所有正态总体的协方差矩阵或相关矩阵都相等
其中,
y
在应用线性回归模型时,必须满足以下假设:
• (1)解释变量 x1 , x2 ,...,xk 是确定性变量,而且解 释变量之间不相关。 • (2)随机误差项具有0均值和同方差。 • (3)随机误差项在不同样本点之间是独立的,不 存在序列相关。 • (4)随机误差限于解释变量之间不相关。 • (5)随机误差项服从0均值和同方差的正态分布。
研究的问题选择部分变量对事物的某一方面进行研究
首先Checkers Pizza公司根据资料估计 下面的线性需求方程的参数:
Q=a+bP+cM+dP欧文+eP麦当劳
式中: •
• • • • Q—比萨饼的销量; P—比萨饼的价格 M—小镇居民的人均收入 P欧文—欧文公司产品的价格 P麦当劳—麦当劳产品的价格
下面是SPSS11.0的输出结果:
M o d el S u m m ar y Adjusted R Std. Error of Model R R Square Square the Estimate a 1 .985 .970 .964 34.70896 a. Predictors: (Constant), P麦当劳, P欧文, M, P
四、实例分析
• 某公司生产一新产品,该公司在新产品末大量上市以 前,进行了一次市场调查。公司将新产品寄给十五个 代理商,并附意见调查表,要求对该产品给予评估并
说明是否愿意购买。评估的因素有:式样、包装及耐
久性。评分用10分制,高分表示特性良好,低分则较 差。其中有三位代理商没有表明自己的购买意愿。
P(D>d | G=g) Predicted Case Number Actual Group Group p df P(G=g | D=d) Group P(G=g | D=d) Function 1 Original 1 1 1 .500 1 1.000 2 .000 2.155 2 1 1 .420 1 .969 2 .031 .674 3 1 1 .164 1 1.000 2 .000 2.872 4 1 1 .648 1 .991 2 .009 1.024 5 1 1 .925 1 .999 2 .001 1.575 6 1 1 .969 1 .998 2 .002 1.442 7 1 1 .391 1 .963 2 .037 .623 8 2 2 .618 1 .989 1 .011 -1.575 9 2 2 .760 1 .995 1 .005 -1.767 10 2 2 .131 1 .721 1 .279 -.563 11 2 2 .572 1 1.000 1 .000 -2.638 12 2 2 .080 1 1.000 1 .000 -3.823 13 ungrouped 2 .387 1 .962 1 .038 -1.208 14 ungrouped 1 .648 1 .991 2 .009 1.024 15 ungrouped 2 .799 1 .996 1 .004 -1.818 Cross-validateda 1 1 1 .663 3 1.000 2 .000 2 1 1 .800 3 .961 2 .039 3 1 1 .178 3 1.000 2 .000 4 1 1 .247 3 .964 2 .036 5 1 2** .000 3 .974 1 .026 6 1 1 .862 3 .996 2 .004 7 1 1 .646 3 .945 2 .055 8 2 2 .934 3 .984 1 .016 9 2 2 .062 3 .946 1 .054 10 2 1** .091 3 1.000 2 .000 11 2 2 .574 3 1.000 1 .000 12 2 2 .027 3 1.000 1 .000 For the original data, squared Mahalanobis distance is based on canonical functions. For the cross-validated data, squared Mahalanobis distance is based on observations. **. Misclassified case a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case.
市场研究的数据分析方法
第一节 线性回归分析
一、线性回归方程的基本模型
• 线性回归方程从样本资料出发,一般利用最小二乘法, 根据回归直线与样本数据点在垂直方向上的偏离程度 最低的原则,进行回归方程的参数的求解。 • 线性回归分析是考察变量之间的数量关系变化规律, 它通过一定的数学表达式---回归方程,来描述这种关 系,以确定一个或几个变量的变化对另一个变量的影 响程度,为预测提供数学依据。
A N O VA b Model 1 Sum of Squares df Mean Square Regression 736912.31 4 184228.078 Residual 22889.523 19 1204.712 Total 759801.83 23 a. Predictors: (Constant), P麦当劳, P欧文, M, P b. Dependent Variable: Q F 152.923 Sig. .000a

那么这些代理商是属于“非购买组”还是“购买组”?
以下是SPSS11.0的部分输出结果:
S t a n da r d i z e d C a n o n i c al D i s c r im i n a n t F u n c ti o n C o e ff i c i e n t s Function 1 .910 .083 .254
3、对回归方程进行各种统计检验。 4、利用回归方程进行预测。
五、实例分析
• 例:Checkers Pizza公司是休斯敦附近Westbury镇上仅有 的从事比萨饼送货业务的两家公司之一,其直接竞争对 手是欧文公司,提供相同的产品与服务。另外麦当劳也 是它的一个重要竞争者。在过去的24个月中,该公司的 销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文 公司产品的价格(P欧文)以及麦当劳产品的价格(P麦 当劳)。假定下个月公司产品价格为9.05,人均收入为 26614元,欧文公司产品的价格10.2元,麦当劳产品的价 格为1.15元,请预测该公司下个月的销售量。
Standardized Coefficients Beta -1.037 .405 .232 .166
t -.830 -17.743 7.359 5.500 3.657
Sig. .417 .000 .000 .000 .002
• 从上面的输出结果可以看出,模型可以解释 97%的比萨饼销售量的变化;模型整体非常显 著,F统计的相伴概率值P=0.000;四个参数b、 c、d、e非常显著,T统计的相伴概率值P都远 小于0.01。 • 所以,回归方程为: Q= -343.748 - 195.895P+0.0742M+174.403 P欧文 +81.057 P麦当劳 • 该公司下一个月比萨饼的销量为; Q= - 343.748 - 195.895*9.05+0.0742*26614+174.403 *10.2 +81.057 *1.15
二、线性回归方程的统计检验
1、回归方程拟合优度检验
2、回归方程的显著性检验
3、回归系数显着性检验
三、回归分析假设条件的检验
1、残差分析 2、多重共线性 3、误差项的序列相关
四、线性回归分析的基本步骤
1、确定回归中的自变量和因变量。
2、从收集到样本资料出发确定自变量和因变量
之间的数学关系,即建立回归方程。
相关文档
最新文档