均值向量和协方差估计、均值分析和协差阵检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将“总资产贡献率”和“流动资产周转率”取对数(log10)后,再进行正态分布的检验。
表3.4 部分变量取对数后服从正态分布的检验结果
从3.4可以看出,“总资产贡献率的对数”这个变量的P值为0.07,“流动资产周转率的对数”这个变量的P值为0.05,均小于显著性水平,说明其对数形式服从正态分布。
(2)多元正态分布的均值向量的假设检验。
4.对一份给出的数据进行编码和变量定义
5.按要求录入数据
6.练习基本的数据修改编辑方法
7.检验多元总体的均值向量和协方差阵
8.保存数据文件
9.关闭SPSS,关机。
四、实验项目及结果
1、多元正态总体均值向量和协差阵的最大似然估计分别是样本均值向量和样本协差阵。利用SPSS软件可以迅速地计算出多元分布的样本均值向量、样本离差阵和样本协差阵。下面通过一个实例来说明多元正态分布参数估计的SPSS实现过程。这里以海峡西岸经济区的20个城市为研究对象,选取海峡西岸经济区的主要经济指标进行均值向量和协差阵的估计。主要经济指标包括:地区生产总值、固定资产投资额、社会消费品零售总额、货物进出口总额、实际利用外商直接投资,规模以上工业总产值以及公共财政预算收入等7个指标。表2.2数据来源于2013年《中国城市统计年鉴》和2013年《中国区域经济统计年鉴》。
值得注意的是,这里给出的样本协差阵是根据s/n-1形式计算的,是总体协差阵的无偏估计。如果求极大似然估计量,需要用该表格中的Covariance的数值乘以(n-1),然后再除以n,即得到根据s/n形式计算的样本协差阵。
从表中可以得到相关系数矩阵为:
样本离差阵为:
样本协方差阵为:
2、为研究东、中、西部各省市规模以上企业的发展状况,这里拟通过多元正态分布的均值向量和协差阵的检验来比较这三个总体的企业发展状况,。这里的指标主要包括:总资产贡献率(%)、资产负债率(%)、流动资产周转次数(次/年)、工业成本费用利润率及产品销售率等5个规模以上企业主要经济指标来反映区域企业的发展状况。表3.2的数据来源于2013年《中国区域经济统计年鉴》,其中“类别”为1标明是东部地区,“类别”为2标明是中部地区,“类别”为3标明是西部地区。
①表3.5为主题因子表,给出了来自三类的样品个数。
表3.5主体间因子
②表3.6为协差阵方差齐性检验。从表中可以看出,Box’s检验的P值为0.009,说明三个类别的协差阵差异很显著。
表3.6 协差阵的方差齐性检验
③表3.7为多变量检验表,给出了检验统计量及P值。该表实际上是构造“资产负债率”“工业成本费用利润率”“产品销售率”“总资产贡献率的对数”及“流动资产周转率的对数”等5个因变量与“类别”这个固定因素作为自变量的线性模型的显著性检验。该表的第六列是检验统计量的概率P值,可以看到,在“类别”下P值小于显著性水平,则应拒绝原假设,说明三个类别的均值存在显著性差异。即反映出我国东部、中部、西部省份之间的企业发展状况不均衡。
(二)输出结果
(1)表3.3为正态性检验表,给出各变量是否服从正态分布的检验结果。
表3.3各变量服从正态分布的检验结果
从表3.3可以看出,“总资产贡献率”的P值为0.713,“流动资产周转次数”的P值为0.618,即接受原假设,说明这两个变量不服从正态分布。其他三个变量的P值均小于显著性水平,说明服从正态分布。
表 3.8 主体间效应检验表
五、实验总结
通过这一次实验操作使自己平时所学的理论知识能与实践相结合,熟练掌握了spss软件的一些基本操作方法,学习最重要的的在于学以致用,系统的统计实验训练能将理论知识和实践结合起来。在解决实际问题时,一定要结合当时的实际背景。只有定性分析与定量分析相结合,才能得出更加令人信服的结果。通过本次实验用spass统计分析软件来进行均值向量和协方差估计、均值分析和协差阵检验后,感觉统计学中的很多问题不再像以前那么陌生了,同时也感觉统计学不再是想象中那么困难,之前学习统计学最怕的就是对数据进行求解与分析,现在使用这款软件后,让我从之前对统计学的陌生转变为熟悉,从此,在解决统计方面的问题又多了一项解决的工具:spss。
表3.7 多变量检验表
④表3.8为主体间效应的表。表中各列分别是根据Type Ⅲ方法计算的偏差平方和、自由度。均方、F统计量及Sig.值。该表第三行反映的是固定因素“类别”对5个变量的单因素分析的结果。通过该行P(Sig.)值可知:变量“产品销售率”“总资产负债率的对数”和“流动资产周转次数的对数”的P值分别为0.016,0.086和0.017,均小于显著性水平,说明这3个变量在不同的类别(即三个经济带)中差异显著;而变量“资产负债率”和“工业成本费用利润率”的P值分别为0.472及0.138,均大于显著性水平,说明这2个变量在三个类别中差异不显著。
下表是描述统计(Descriptive Statistics)的内容,该表给出了样本均值向量。
由上表可得地区生产总值的样本均值向量估计为1683096Biblioteka Baidu.10万元;固定资产投资额的样本均值向量为10152282.35万元;社会消费品零售的样本均值向量为6857594.05万元;货物进出口总额的样本均值向量估计为1059096.20万美元;实际利用外商直接投资的样本均值向量估计为46204.65万美元;规模以上工业总产值的样本均值向量为24937870.25万元;公共财政预算收入135.3055亿元。
二、实验内容
1.操作SPSS的基本方法(打开、保存、编辑数据文件)
2.问卷编码
3.录入数据并练习数据相关操作
4.对均值向量和协方差阵进行检验,并给出分析结论。
三、实验步骤
1.开机
2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS
3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗
将表3.2数据输入到SPSS的数据编辑窗口中得到如下图。
(一)操作步骤
(1)变量服从正态分布的检验。
1点击分析→描述统计→探索,进入探索对话框。将上述表中的5个变量选入因变量列表框。
2点击主对话框绘制选项。选中带检验的正态图选项,对各变量进行正态性检验。
③设置完成后,点击继续返回主对话框。点击确定按钮,运行程序,即可得到各变量是否服从正态分布的检验结果。
将表2.2数据输入到SPSS的数据编辑窗口中得到如下图
(一)计算样本均值向量的步骤
(1)点击分析→ 描述统计→ 描述,进入描述性主对话框,将待估计的7个变量选入变量列表框中。
(2)点击主对话框选项。选择Mean选项,即可计算样本均值向量。
(3)点击继续返回主对话框。点击确定按钮,执行操作。
(二)输出结果解释
二、协方差的估计
(一)样本协方差阵的步骤
(1)点击分析→相关→双变量,进入双变量相关主对话框。将7个变量选入右边的变量列表框中。
(2)点击主对话框选项。选择叉积偏差和协方差选项,即可计算样本离差阵和样本协差阵。
(3)点击继续,返回主对话框。点击确定按钮,执行操作。
(二)输出结果解释
如下表是相关分析表。表中Pearson Correlation给出皮尔逊相关系数矩阵,Sum of Square and Cross-products给出样本离差阵,Covariance给出样本协差阵。
(2)多元正态分布的均值向量的检验。
这里借助过因素方差分析来实现多元正态分布的假设检验。操作步骤如下:点击分析→一般线性模型→多变量,进入多变量主对话框。
1“资产负债率”“工业成本费用利润率”“产品销售率”“总资产贡献率的对数”及“流动资产周转率的对数”(由于后面两个变量不服从正态分布,而其对数服从正态分布,故此处选择其对数形式)这5个变量选入因变量列边框中。
2“类别”选入因子列表框中。
3设置完成后,点击确定按钮即可。
(3)多元正态分布的协差阵的检验。
在多变量主对话框中,点击选项,进入多变量选项子对话框。
①.“类别”选入显示均值列表框中。
②.在输出栏中,选中方差齐性检验,进行多个协差阵相等的检验。
③.设置完成后,点击继续返回主对话框。点击确定按钮运行程序。
武夷学院实验报告
课程名称:多元统计分析项目名称:均值向量和协方差估计、均值分析和协差阵检验
姓名: 专业:信息与计算科学班级:1班学号: 同组成员:无
一、实验目的
通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。同时能够掌握对均值向量和协方差阵进行检验。
实验报告成绩(百分制)__________实验指导教师签字:__________
取对数之后,进行正态性检验。点击转换-计算变量,在数字表达式中选入总资产贡献率和流动资产周转率的,在函数组中选择全部,函数和特殊变量中选择lg10,目标变量写入总资产贡献率和流动资产周转率的对数。即可得到如下图。
从表中可以看出:“总资产贡献率的对数”的这个变量的P值为0.07,“流动资产周转率的对数”这个变量的P值为0.05,均小于显著性水平,说明其对数形式服从正态分布。
相关文档
最新文档