应用统计学实验三

应用统计学实验三
应用统计学实验三

实验三:相关分析与回归分析

【实验目的】

1.了解两变量相关关系的基本含义,理解相关系数在线性分析中的作用。

2.通过比较几种不同的相关分析方法的结果对变量之间的相关关系下比较可靠的结

论。

3.能够运用回归分析的基本思想和基本方法,理解最小二乘法的计算步骤。分析多个

变量对一个变量的影响。

【实验内容】

⒈对15位被调查的学生4门成绩,用相关分析方法分析各科成绩是否存在线性关系。

2.使用某地29名13岁男童的身高、体重、肺活量的实测数据。数据中X1表示身高(CM)、X2表示体重(KG)、Y表示肺活量(L)。实验内容是在体重被控制时(即体重固定时),计算身高与肺活量的偏相关系数,并做相关性的统计检验。

3.使用某地区1973年-1990年水稻产量(Y)和水稻播种面积(X1)、化肥使用量(X2)、生猪存栏数(X3)以及水稻扬花期降雨量(X4)的数据,数据中,ID为序号,YEAR表示年份。实验内容是用线性回归分析为该地区水稻产量寻找一个恰当的回归模型,分析产量与对它具有显著影响的因素之间的关系。

4.使用某企业1990-1998年的年产值统计资料,数据共有9个样本观测值,代表了9年的统计资料,另外数据有3个变量:products(企业产值),t(时间序号),year(年份)。请建立一个非线性回归方程并进行模型的估计。

【实验数据】

⒈kaoshichengji.sav

2. Nantong.sav

3.shuidaochanliang.sav

4.chanzhi.sav

【实验步骤】

练习1

⒈在SPSS中打开数据。

⒉选择“分析-相关-双变量相关”在弹出的对话框中将四门课程选入变量。

⒊相关系数中选择三种方法计算。

⒋选择“双侧检验”和“标记显著性相关”

⒌单击“选项”按钮,弹出“双变量相关性:选项”对话框,选择所有统计量,缺失值“按对排除个案”。然后继续。

6.回到“双变量相关”对话框,单击“确定”,进入计算分析。

练习2

⒈打开“nantong.sav”文件;

⒉选择“分析-相关-偏相关…”命令,弹出“偏相关”对话框,将身高和肺活量选入“变量”框,将体重选入“控制”框。

⒊选择“双侧检验”,并显示实际显著性水平;

⒋选择“选项”,弹出“偏相关性:选项”对话框.

⒌统计量中选择“均值与标准差”、“零阶相关系数”,缺失值用“按列表排除个案”,然后进行计算分析。

6.写出你的分析结论。

练习3

1.选择“分析-回归-线性”,进入“线性回归”对话框,因变量选择Y,再将X1、X2、X3、

x4选择作为自变量。在方法中,指定自变量“进入”分析方式,通过不同的方法可以对变量建立不同的回归模型。

2.单击“统计量”进入“线性回归:统计量”对话框,选中“估计”、“模拟拟合度”、“描

述性”,残差用“durbin_watson”.然后“继续”

3.单击“绘制”,打开“线性回归:图”对话框。选择dependnt:因变量,zresid标准化

残差来进行绘图。

4.然后“继续”,选择“保存”,选择预测值“未标准化”和“标准化”,残差“标准化”,

预测区间“均值”、“单值”、置信区间95%,包含协方差矩阵。

5.然后“继续”,选择“选项”,步进方法标准用“使用F的概率”,并在等式中包含常量,

缺失值“按列表排除个案”。

6.回到“线性回归”,单击“确定”,进入计算分析。

练习4

1.打开数据表。

2.选择“分析-回归-非线性回归分析”。将products作为因变量,在模型表达式中建立模

型,例如a*b**(c**year)[注该模型为龚伯兹曲线模型,当然,大家也可以用自己设计的模型代入]。

3.单击“参数”,弹出“非线性回归:参数”对话框,这里我们设定a的初始值为10.5,b

的初始值为0.3,c的初始值为0.7。

4.单击“继续”,回到“非线性回归对话框,单击“损失”,按系统默认值“残差平方和”

设定损失函数,这是最小化损失统计量。

5.然后“继续”回到“非线性回归”对话框,单击“约束”,选择“未约束”

6.“继续”回到“非线性回归”对话框,单击“保存”,保存“预测值”(新变量名为pred_和“残值”新变量名为resid。若想保存“一阶导数”,也可选上“导数”。

7. “继续”回到“非线性回归”对话框,单击“选项”,使用默认的无约束模型算法,

levenbert-Marquardt.

8. “继续”回到“非线性回归”对话框,单击“确定”,完成计算,然后分析。【实验结果】

请大家将各练习实验结果截图,并针对截图写一段话作为分析报告。

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

统计学实验报告

统计学数学实验报告 单因素方差分析 姓名 专业 学号

单因素方差分析 摘要统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释数据并从数据中得出结论的方法,统计研究的是来自各个领域的数据。单因素方差分析也是统计学分析的一种。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。关键字单因素、方差、数据统计 方差分析(analysis of variance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。当方差分析中之涉及一个分类型自变量时称为单因素方差分析(one-way analysis of variance). 单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。例如要检验汽车市场销售汽车时汽车颜色对销售数据的影响,这里只涉及汽车颜色一个因素,因而属于单因素方差分析。 为了更好的理解单因素方差分析,下面举个例子来具体说明单因素方差所要解决的问题。从3个总体中各抽取容量不同的样本数据,结果如下表1所示。检验3个总体的均值之间是否有显著差异(α=0.01)P29210.1 样本1 样本2 样本3 158 153 169 148 142 158 161 156 180 154 149 169 如果要进行单因素方差分析时,就需要得到一些相关的数据结构,从而对那些数据结构进行分析,如下表2所示: 分析步骤 1.提出假设 与通常的统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归 方程可能是正确的() A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是 () A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3.数据离散程度的测度值中,不受极端数值影响的是() A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

《应用统计学》实验报告

《应用统计学》实验报告 实验一用Excell抽样 一、实验题目 某车间现有同型号的车床120部,检察员从中随机抽取由12部车床构成一个样本。请拟定抽样方式,确定样本单位。 二、实验步骤 第一步:给车床编号 从1到120依次给每部车床编号。 第二步:选定抽样方式 采用简单随机抽样。 第三步:使用Excell抽样 具体步骤如下: 1、打开Excell; 2、依次将车床编号输入到单元格区域$A$1:$L$12的不同单元格中; 3、单击“工具”菜单; 4、选择“数据分析”选项,然后从“数据分析”对话框中选择“抽样”; 5、单击“确定”,弹出抽样对话框; 6、在“输入区域”框中输入产品编号所在的单元格区域; 7、在“抽样方法”项下选择“随机”,在“样本数”框中输入12; 8、在“输出选项”下选择“输出区域”,在“输出区域”框中输入$A$14; 9、单击“确定”,得到抽样结果。 三、实验结果 用Excell从该120部车床中随机抽出的一个样本中各单位的编号依次为:79 71 13 41

72 81 21 54 73 88 16 84 实验二用Excell画直方图 一、实验题目 某工厂的劳资部门为了研究该厂工人工人的收入情况,首先收集了30名工人的工作资料,下面为工资数值。 530535490420480475 420495485620525530 550470515530535555 455595530505600505 550435425530525610 二、实验步骤 第一步:在工具菜单中单击数据分析选项,从其对话框的分析工具列表中选择直方图,打开直方图对话框; 第二步:在输入区域输入$A$2:$F$6,在接收区域输入$D$9:$D$15; 第三步:选择输出选项,可选择输入区域、新工作表组或新工作薄; 第四步:选择图表输出,可以得到直方图;选择累计百分率,系统将在直方图上添加累积频率折线;选择柏拉图,可得到按降序排列的直方图;

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

多元统计学SPSS实验报告一

华东理工大学2016–2017学年第二学期 《多元统计学》实验报告 实验名 称实验1数据整理与描述统计分析

教师批阅:实验成绩: 教师签名: 日期: 实验报告正文: 实验数据整理 (一)对“employee”进行数据整理 1.观察量排序 ( based on current salary) 2.变量值排序(based on current salary : rsalary) 3.计算新的变量(incremental salary=current salary - beginning salary)

4.拆分数据文件(based on gender) 结论:There are 215 female employees and 259 male employees. 5.分类汇总 (break variable: gender ; function: mean ) 结论:The average current salary of female is . The average current salary of male is . (二)分别给出三种工作类别的薪水的描述统计量 实验描述统计分析 1)样本均值矩阵 结论:总共分析六组变量,每组含有十个样本。 每股收益(X1)的均值为;净资产收益率(X2)的均值为;总资产报酬率(X3)的均值为;销售净

利率(X4)的均值为;主营业务增长率(X5)的均值为;净利润增长率(X6)的均值为. 2)协方差阵 结论:矩阵共六行六列,显示了每股收益(X1)、净资产收益率(X2)、总资产报酬率(X3)、销售净利率(X4)、主营业务增长率(X5)和净利润增长率(X6)的协方差。 3)相关系数 结论:矩阵共六行六列,显示了每股收益 (X1)、净资产收益率(X2)、总资产报酬 率(X3)、销售净利率(X4)、主营业务增 长率(X5)和净利润增长率(X6)之间的 相关系数。 每格中三行分别显示了相关系数、显著性 检验与样本个数。 4)矩阵散点图

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

应用统计学试题及答案 试卷5

《应用统计学》课程考试试卷五 班级:姓名:学号: 一、填空题(0.5*20=10分) 1.“统计”一词有三层含义,分别是、__________和___________。 2.按调查组织方式的不同,统计调查可分为___________和__________。普查属于后者,一般用于调查属于一定________上的社会现象的总量。 3. 多因素指数分析的各因素排列的一般顺序是______因素在前,_____因素在后,且要求_____________________有意义。 4.某企业产值连年增长,分别为10%、12%和5%,则这三年共增长_______%。 5. 总指数按其计算方法不同分为___________________和____________指数。 6.如果时间序列的环比增长速度大体相同,在测定其长期趋势时可以拟合_________方程。7.当样本容量n增大时,如果样本估计量越来越接近总体参数的真值时,就称这个统计量为__________估计量。而样本统计量的期望值等于要估计的总体参数的真值,称为__________估计量。 8.在运用小概率原理进行总体参数的假设检验,可能会犯_____________和_________两类错误。 9.同度量因素在总指数编制中起到__________作用和________作用。 10.人均粮食产量是_____________指标。 二、单选题(1*10=10分) 1. 有10个企业全部职工每个人的工资资料,如要调查这10个企业职工的工资水平情况,则统计总体是() A.10个企业 B. 10个企业职工的全部工资 C.10个企业全部职工 D. 10个企业每个职工的工资 2.计算回归方程参数时,利用最小平方法即要求() A. ()0 X X -= ∑ B. 2 ()0 X X -= ∑

统计学实验心得体会分享

统计学实验心得体会分享 在两天的统计学实验学习中,加深了对统计数据知识的理解和掌握,同时也对Excel操作软件的应用,统计学实验心得体会。下面是我这次实验的一些心得和体会。 统计学(statistics)一门收集,整理,显示和分析统计数据的科学,目的是探索数据内在的数量规律性。从定义中不难看出,统计学是一门针对数据而展开探求的科学。在实验中,对数据的筛选和处理就成为了比较重要的内容和要求了。同时对数据的分析也离不开相关软件的支持。因此,Eexcel软件的安装与运行则变成了首要任务。 实验过程中,对Excel软件的安装因要求具体而变的相对简单。虽然大多数计算机都已内存此软件,但在实验中通过具体的操作亦可以提高自己的计算机操作水平。接下来的重头戏就是对统计数据的输入与分析了。按Excel对输入数据的要求将数据正确输入的过程并不轻松,既要细心又要用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。因此,输入正确的数据也就成为了整个统计实验的基矗。 数据的输入固然重要,但如果没有分析的数据则是一点意义都没有。因此,统计数据的描述与分析也就成了关键的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分

析,抽样分析,方差分析,回归问题以及时间序列分析等则更具体和深刻的向我们揭示了统计数据的内在规律性。在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。 通过实验过程的进行,对统计学的有关知识点的复习也与之同步。在将课本知识与实验过程相结合的过程中,实验步骤的操作也变的得心应手。也给了我们一个启发,在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验可以让我们的实验过程不在那么枯燥无谓。同时在实验的同步中亦可以反馈自己的知识薄弱环节,实现自己的全面提高。 本次实验是我大学生活中不可或缺的重要经历,其收获和意义可见一斑。首先,我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼;其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。 在实验过程中还有些其它方面也让我学到了很多东西,知道统计工作是一项具有创造性的活动,要出一流成果,就必须要有专业的统计人才和认真严肃的工作态度。在实践的校对工作中,知道一丝不苟的真正内涵。 通过本次实验,不仅仅是掌握操作步骤完成实验任务而

应用统计学实验二

实验二:方差分析 【实验目的】 1.通过实验掌握单样本T检验的方法和思想,要能够应用这种方法对一组观测数据的 均值和总体均值进行统计假设检验。 2.能够解释T检验的输出结果中各个统计量的统计含义和实际意义。 3.熟练使用SPSS中的独立样本T检验过程对两个或多个独立样本的均值是否有差异 进行假设检验,根据方差齐性的levene检验的结果和独立样本T检验的结果做出 综合判断和解释。 【实验内容】 ⒈使用某种新测量方法测量水域水样中的caco3的含量的观测值样本数据。其中11个观测样本表示11次重复测定,每一个观测值表示水样中的caco3含量的观测值。假定该水域的caco3含量真值已知为20.7mg/L,请检验新的测量方法得到的数据均值是否偏高,从而评价该测量方法测量数据的准确性。 2.使用某医学调查机构测得的某克山病区11例急性克山病患者与13名健康成年人的血磷值(X,mg%),group变量表示样本所属的组别,患病者组别为“1”,健康人的值为“2”.本次实验通过方差分析患者与健康人的血磷值是否有显著性差异。 3.根据一组临床试验资料,该试验以84例接受心血手术的病人为研究对象,其中42例患者急性肾衰,为病例组;42例未患急性肾衰,为对照组。试对数据中的变量“los(住院天数)”按有无急性肾衰,以分组变量“ type(病例/对照)”进行分析。 4.从某厂第一季度生产的两批同型号的电子元件中分别抽取了15个和20个样品测量电阻,以判断各批产品的质量是否合格。按质量规定合格元件额定电阻为0.14欧姆。根据这两批元件抽检的样本的电阻测量值,用T检验过程检验,这两批产品是否合乎质量要求。(选做) 【实验数据】 ⒈shuiyang.sav 2. keshanbing.sav 3.kidney.sav 4.数据如下 样品电阻测量值

应用统计学试题及答案1

北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

应用统计学实验报告(spss软件)

我国31个省市自治区第三产业发展状况分析 (数据来源:中宏统计数据库)2010年31个省市第三产业增加值 一、因子分析 1.考察原有变量是否适合进行因子分析 为研究全国各地区第三产业的发展状况,现比较其第三产业增加值的差异性和相似性,收集到2010年全国31个省市自治区各类第三产业包括交通运输、仓储和邮政业,批发和零售业,住宿和餐饮业,金融业,房地产业及其他产业的年增产值数据。由于涉及的变量较多,直接进行地区间的比较分析非常繁琐,因此首先考虑采用因子分析方法减少变量个数,之后再进行比较和综合评价。 表1-1(a)原有变量的相关系数矩阵

由表1-1(a)可以看到,所有的相关系数都很高,各变量呈较强的线性关系,能够从中提取公因子,适合做因子分析。 表1-1(b)巴特利特球度检验和KMO检验 由表1(b)可知,巴特利特球度检验统计量的观测值为295.349,相应的概率p接近0,。如果显著性水平a为0.5,由于概率p小于显著性水平a,应拒绝零假设,认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.860,根据Kaiser给出了KMO度量标准可知原有变量适合进行因子分析。 2.提取因子 首先进行尝试性分析。根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取特征根值大于1的特征根。 表1-2(a)因子分析的初始解(一) 表1-2(a)显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,表明对原有6个变量如果采用主成分分析法提取所有特征根(6个),那么原有变量的所有方差都可被解释,变量的共同度均为1。第二列是在按指定提取条件提取特征根时的共同度。可以看到,所有变量的绝大部分信息(大于84%)可被因子解释,这些变量的共同度均较高,变量的信息丢失较少,只有交通运输这个变量的信息丢失较多(近20%),因此本次因子提取的总体效果不理想。 重新指定特征根的标准,指定提取两个因子,结果如下:

应用统计学试题和答案汇编

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的 置信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~ ) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则 n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共 14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

统计学实验报告1

统计学实验报告1 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

实验报告

二、打开文件“数据 3.XLS”中“城市住房状况评价”工作表,完成以下操作。 1)通过函数,计算出各频率以及向上累计次数和向下累计次数;2)根据两城市频数分布数据,绘制出两城市满意度评价的环形图三、打开文件“数据 3.XLS”中“期末统计成绩”工作表,完成以下操作。 1)要求根据数据绘制出雷达图,比较两个班考试成绩的相似情况。 实验过程: 实验任务一: 1)利用函数frequency制作一张频数分布表 步骤1:打开文件“数据 3. XLS”中“某公司4个月电脑销售情况”工作表 步骤 2.在“频率(%)”的右侧加入一列“分组上限”,因统计分组采用“上限不在内”,故每组数据的上限都比真正的上限值小0.1,例如:“140-150”该组的上限实际值应为“150”,但我们为了计算接下来的频数取“149.9”. 步骤3.选定C20:C29,再选择“插入函数”按钮 3 步骤 4.选择类别“统计”—选择函数“FREQUENCY”

步骤5.在“data_array”对话框中输入“A2:I13”,在“bins_array”对话框中输入“E20:E29 该函数的第一个参数指定用于编制分布数列的原始数据,第二个参数指定每一组的上限. 步骤6.选定C20:C30区域,再按“自动求和” 按钮,即可得到频数的合计

步骤7.在D20中输入“=(C20/$C$30)*1OO” 步骤8:再将该公式复制到D21:D29中,并按“自动求和”按钮计算得出所有频率的合计。

应用统计学试题及答案193765讲课讲稿

应用统计学试题及答案193765

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 一. 单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位

B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二.多选题 (每题2分,共14分) 1.下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E.企业职工人数2000人 2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是 A. 均值 B. 众数 C. 中位数 D. 几何平均数 E. 调和平均数

应用统计学试题及答案2

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为 7.5分;乙班平均分为75分,标准差为7.5分。由此可知两个班考试 成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() A.520公斤 B.530公斤 C.540公斤 D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% B.400% C.120% D.1200% 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 A.10.71% B.21.95% C.12% D.13.64% 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显著性 D.规性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如 下,你认为哪个回归方程可能是正确的?() A.y=125-10x B.y=-50+8x C.y=150-20x D.y=-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算

统计学实验报告

重庆大学 学生实验报告 实验课程名称统计学课程实验 开课实验室 DS1421 学院建管年级 2011级专业班财管02班学生姓名熊俸英学号 开课时间 2012 至 2013 学年第 2 学期 建设管理及房地产学院制

《统计学》实验报告 开课实验室:年月日

陈谦87769277 刘文55845182 周克66628579 程前75507288 徐非64859193 1)选中以上数据后,复制到excel表格中,点击工具栏中”数据”下“自动筛选”,点击统计学成绩栏分数等于“90”; 结果为: 2)继上一小题,点击“经济学成绩”下“前10个”,会出现对话框,把数字“10”改为“3”,点击确定;

结果为: 3)选中数据,前面留出两栏空白,并复制数据表头(选中数据第一排),到空白处第一排,在第二排各科成绩下面输入“>60”,如图:选中数据,点击“数据”—“高级筛选”,点击条件区 域(选中表格前2行),点击确定: 2.B 组题第5题 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为: A.好;B .较好;C.一般;D.较差;E .差。调查结果如下所示; B C A C B E C B A B D A D B C C E D E B A D B A C B E C B A B A C C D A B D D A C D C E B B C D C C A A C A C C D C E D A E C C A C D A A E B A D E C A B C E B A D A B C B E D B C A B C D C B A B A D 要求编制品质数列,列出频率、频数,并选用适当的统计图如:圆形图、条形图等形象地显示资料整理的结果。(要求展现整理过程) 留出两栏空白,条件区域时输入筛选条件 为查询结

《应用统计学》模拟考试题及参考答案(全)

应用统计学模拟考试题答案 (√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。(√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。 (×)3、抽样误差是抽样调查中可以设法消除的误差。 (×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。 (√)5、不存在趋势的时间序列称为平稳时间序列。 (√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。 (√)7、展示时间序列数据的最佳图形是线图。 (√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。 (×)9、多数情况下,t分布是一个右偏分布。 (×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。( A)11、下列变量中属于数值型变量的是

A、汽车轮胎的直径 B、汽车的内燃机类型 C、产品等级 D、学生生源类别 (C)12、以下各种抽样方式中一定属于非随机抽样的方式是: A、简单随机抽样 B、等距抽样 C、重点抽样 D、类型抽样 (C )13、下列图形中不能展示分类数据的图是: A、条形图 B、饼图 C、直方图 D、环状图 (B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常数为120的泊松分布,请问该订票点每10分 钟内接到订票电话数目Y的分布类型是: A、正态分布 B、泊松分布 C、二项分布 D、超几 何分布 (D)15、下列有关统计分组的一些说法中,错误的是: A、统计分组是指按照某些重要标志把总体分成若干部分 的科学分类

B、数值型数据的分组的组数主要取决于数据的全距和组距 的大小 C、统计分组的目的是为了展现总体的内部结构或分布规律 D、统计分组只能按照一个标志单独进行 (C)16、下面有关相关关系的一些说法错误的是: A、相关关系是一种普遍存在的关系 B、简单相关系数是用来定量描述变量之间线性相关程度 的 C、简单相关系数为零时,说明两个变量之间不存在任何 关系 D、简单相关系数绝对值越大,两个变量之间的相关程度越 密切 (B)17、已知一组数据为10,8,7,3,5,6,8,请问这组数据的中位数为 A、8 B、7 C、 D、10

相关文档
最新文档