应用统计学实验三

实验三：相关分析与回归分析

【实验目的】

1.了解两变量相关关系的基本含义，理解相关系数在线性分析中的作用。

2.通过比较几种不同的相关分析方法的结果对变量之间的相关关系下比较可靠的结

论。

3.能够运用回归分析的基本思想和基本方法，理解最小二乘法的计算步骤。分析多个

变量对一个变量的影响。

【实验内容】

⒈对15位被调查的学生4门成绩，用相关分析方法分析各科成绩是否存在线性关系。

2.使用某地29名13岁男童的身高、体重、肺活量的实测数据。数据中X1表示身高（CM）、X2表示体重（KG）、Y表示肺活量（L）。实验内容是在体重被控制时（即体重固定时），计算身高与肺活量的偏相关系数，并做相关性的统计检验。

3.使用某地区1973年-1990年水稻产量（Y）和水稻播种面积（X1）、化肥使用量（X2）、生猪存栏数（X3）以及水稻扬花期降雨量（X4）的数据，数据中，ID为序号，YEAR表示年份。实验内容是用线性回归分析为该地区水稻产量寻找一个恰当的回归模型，分析产量与对它具有显著影响的因素之间的关系。

4.使用某企业1990-1998年的年产值统计资料，数据共有9个样本观测值，代表了9年的统计资料，另外数据有3个变量：products(企业产值)，t（时间序号），year(年份)。请建立一个非线性回归方程并进行模型的估计。

【实验数据】

⒈kaoshichengji.sav

2. Nantong.sav

3.shuidaochanliang.sav

4.chanzhi.sav

【实验步骤】

练习1

⒈在SPSS中打开数据。

⒉选择“分析-相关-双变量相关”在弹出的对话框中将四门课程选入变量。

⒊相关系数中选择三种方法计算。

⒋选择“双侧检验”和“标记显著性相关”

⒌单击“选项”按钮，弹出“双变量相关性：选项”对话框，选择所有统计量，缺失值“按对排除个案”。然后继续。

6.回到“双变量相关”对话框，单击“确定”，进入计算分析。

练习2

⒈打开“nantong.sav”文件；

⒉选择“分析-相关-偏相关…”命令，弹出“偏相关”对话框，将身高和肺活量选入“变量”框，将体重选入“控制”框。

⒊选择“双侧检验”，并显示实际显著性水平；

⒋选择“选项”，弹出“偏相关性：选项”对话框.

⒌统计量中选择“均值与标准差”、“零阶相关系数”，缺失值用“按列表排除个案”，然后进行计算分析。

6.写出你的分析结论。

练习3

1.选择“分析-回归-线性”，进入“线性回归”对话框，因变量选择Y，再将X1、X2、X3、

x4选择作为自变量。在方法中，指定自变量“进入”分析方式，通过不同的方法可以对变量建立不同的回归模型。

2.单击“统计量”进入“线性回归：统计量”对话框，选中“估计”、“模拟拟合度”、“描

述性”，残差用“durbin_watson”.然后“继续”

3.单击“绘制”，打开“线性回归：图”对话框。选择dependnt：因变量，zresid标准化

残差来进行绘图。

4.然后“继续”，选择“保存”，选择预测值“未标准化”和“标准化”，残差“标准化”，

预测区间“均值”、“单值”、置信区间95%,包含协方差矩阵。

5.然后“继续”，选择“选项”，步进方法标准用“使用F的概率”，并在等式中包含常量，

缺失值“按列表排除个案”。

6.回到“线性回归”，单击“确定”，进入计算分析。

练习4

1.打开数据表。

2.选择“分析-回归-非线性回归分析”。将products作为因变量，在模型表达式中建立模

型，例如a*b**(c**year)[注该模型为龚伯兹曲线模型，当然，大家也可以用自己设计的模型代入]。

3.单击“参数”，弹出“非线性回归：参数”对话框，这里我们设定a的初始值为10.5，b

的初始值为0.3，c的初始值为0.7。

4.单击“继续”，回到“非线性回归对话框，单击“损失”，按系统默认值“残差平方和”

设定损失函数，这是最小化损失统计量。

5.然后“继续”回到“非线性回归”对话框，单击“约束”，选择“未约束”

6.“继续”回到“非线性回归”对话框，单击“保存”，保存“预测值”（新变量名为pred_和“残值”新变量名为resid。若想保存“一阶导数”，也可选上“导数”。

7. “继续”回到“非线性回归”对话框，单击“选项”，使用默认的无约束模型算法，

levenbert-Marquardt.

8. “继续”回到“非线性回归”对话框，单击“确定”，完成计算，然后分析。【实验结果】

请大家将各练习实验结果截图，并针对截图写一段话作为分析报告。

应用统计学试题及答案解析

6．对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= －1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7．某乡播种早稻5000亩，其中20％使用改良品种，亩产为600 公斤，其余亩产为500 公斤，则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件乙车间: x =90件, σ=6.3件哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

统计学实验报告

统计学数学实验报告单因素方差分析姓名专业学号

单因素方差分析摘要统计学是关于数据的科学，它所提供的是一套有关数据收集、处理、分析、解释数据并从数据中得出结论的方法，统计研究的是来自各个领域的数据。单因素方差分析也是统计学分析的一种。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。关键字单因素、方差、数据统计方差分析（analysis of variance，ANOVA）就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。当方差分析中之涉及一个分类型自变量时称为单因素方差分析(one-way analysis of variance). 单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。例如要检验汽车市场销售汽车时汽车颜色对销售数据的影响，这里只涉及汽车颜色一个因素，因而属于单因素方差分析。为了更好的理解单因素方差分析，下面举个例子来具体说明单因素方差所要解决的问题。从3个总体中各抽取容量不同的样本数据，结果如下表1所示。检验3个总体的均值之间是否有显著差异（α=0.01）P29210.1 样本1 样本2 样本3 158 153 169 148 142 158 161 156 180 154 149 169 如果要进行单因素方差分析时，就需要得到一些相关的数据结构，从而对那些数据结构进行分析，如下表2所示：分析步骤 1.提出假设与通常的统计推断问题一样，方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1，然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题（每题1分，共10分） 1．重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2．根据分组数据计算均值时，利用各组数据的组中值做为代表值，使用这一代表值的假定条件是（）。 A．各组的权数必须相等 B．各组的组中值必须相等 C．各组数据在各组中均匀分布 D．各组的组中值都能取整数值 3．已知甲、乙两班学生统计学考试成绩：甲班平均分为70分，标准差为分；乙班平均分为75分，标准差为分。由此可知两个班考试成绩的离散程度（） A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4．某乡播种早稻5000亩，其中20%使用改良品种，亩产为600公斤，其余亩产为500公斤，则该乡全部早稻平均亩产为（）公斤公斤公斤公斤 5．时间序列若无季节变动，则其各月（季）季节指数应为（） A.100% % % % 6．用最小平方法给时间数列配合直线趋势方程y=a+bt，当b＜0时，说明现象的发展趋势是（） A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7．某地区今年和去年相比商品零售价格提高12%，则用同样多的货币今年比去年少购买（）的商品。 8．置信概率表达了区间估计的（） A.精确性 B.可靠性 C.显着性 D.规范性 9．H 0:μ=μ ，选用Z统计量进行检验，接受原假设H 的标准是（） A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下，你认为哪个回归方程可能是正确的（） A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题（每题2分，共10分） 1．抽样调查的特点有（）。 A．抽选调查单位时必须遵循随机原则 B．抽选出的单位有典型意义 C．抽选出的是重点单位 D．使用部分单位的指标数值去推断和估计总体的指标数值 E．通常会产生偶然的代表性误差，但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%，实际降低了4%，则下列说法正确的是（） A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3．数据离散程度的测度值中，不受极端数值影响的是（） A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

《应用统计学》实验报告

《应用统计学》实验报告实验一用Excell抽样一、实验题目某车间现有同型号的车床120部，检察员从中随机抽取由12部车床构成一个样本。请拟定抽样方式，确定样本单位。二、实验步骤第一步：给车床编号从1到120依次给每部车床编号。第二步：选定抽样方式采用简单随机抽样。第三步：使用Excell抽样具体步骤如下： 1、打开Excell； 2、依次将车床编号输入到单元格区域$A$1:$L$12的不同单元格中； 3、单击“工具”菜单； 4、选择“数据分析”选项，然后从“数据分析”对话框中选择“抽样”； 5、单击“确定”，弹出抽样对话框； 6、在“输入区域”框中输入产品编号所在的单元格区域； 7、在“抽样方法”项下选择“随机”，在“样本数”框中输入12； 8、在“输出选项”下选择“输出区域”，在“输出区域”框中输入$A$14; 9、单击“确定”，得到抽样结果。三、实验结果用Excell从该120部车床中随机抽出的一个样本中各单位的编号依次为：79 71 13 41

72 81 21 54 73 88 16 84 实验二用Excell画直方图一、实验题目某工厂的劳资部门为了研究该厂工人工人的收入情况，首先收集了30名工人的工作资料，下面为工资数值。 530535490420480475 420495485620525530 550470515530535555 455595530505600505 550435425530525610 二、实验步骤第一步：在工具菜单中单击数据分析选项，从其对话框的分析工具列表中选择直方图，打开直方图对话框；第二步：在输入区域输入$A$2:$F$6，在接收区域输入$D$9:$D$15；第三步：选择输出选项，可选择输入区域、新工作表组或新工作薄；第四步：选择图表输出，可以得到直方图；选择累计百分率，系统将在直方图上添加累积频率折线；选择柏拉图，可得到按降序排列的直方图；

应用统计学试题和答案分析

六、计算题：（要求写出计算公式、过程，结果保留两位小数，共4题，每题10分） 1、某快餐店对顾客的平均花费进行抽样调查，随机抽取了49名顾客构成一个简单随机样本，调查结果为：样本平均花费为元，标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间；（φ（2）=）49=n 是大样本，由中心极限定理知，样本均值的极限分布为正态分布，故可用正态分布对总体均值进行区间估计。已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据，得该快餐店顾客的总体平均花费数额%的置信区间为（，） 3 要求：①、利用最小二乘法求出估计的回归方程；②、计算判定系数R 。附：10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题解 ① 计算估计的回归方程： ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为：y ) =+x ② 计算判定系数： 4 计算下列指数：①拉氏加权产量指数；②帕氏单位成本总指数。 4题解： ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题（每小题1分，共10题） 1、我国人口普查的调查对象是，调查单位是。 2、___ 频数密度 =频数÷组距，它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用饼图条图图来显示。 4、某百货公司连续几天的销售额如下：257、276、297、252、238、310、240、236、265，则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元，2005年3季度完成的GDP=36亿元，则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%，职工人数增加了2%，则该企业工资总额增长了 % 。 7、对回归系数的显着性检验，通常采用的是 t 检验。 8、设置信水平=1-α，检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲＞σ乙，x 甲＞x 乙，由此可推断 ( )