《统计学》-第7章-习题答案

合集下载

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜1第七章 假设检验与方差分析 习题答案一、名词解释用规范性的语言解释统计学中的名词。

1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。

2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。

3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。

4. 单侧检验:备择假设符号为大于或小于时的假设检验。

5. 显著性水平:原假设为真时,拒绝原假设的概率。

6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。

二、填空题根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。

1. u ,nx σμ0-,标准正态; ),(),(2/2/+∞--∞nz nz σσααY2. 参数检验,非参数检验3. 弃真,存伪4. 方差旗开得胜25. 卡方, F6. 方差分析7. t ,u8. nsx 0μ-,不拒绝9. 单侧,双侧10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r18. 正态,独立,方差齐三、单项选择从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。

1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C四、多项选择从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。

1.AC 2.A 3.B 4.BD 5. AD五、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。

1. 在任何情况下,假设检验中的两类错误都不可能同时降低。

( ×)样本量一定时2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】

第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。

【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。

(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。

(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。

一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。

2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。

(2)有效性:估计量的方差尽可能小。

(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。

【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。

考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。

[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。

《统计学原理》第七章习题 河南电大 贾天骐解析

《统计学原理》第七章习题 河南电大 贾天骐解析

《统计学原理》第七章习题河南电大 贾天骐一.判断题部分题目1: 负相关指的是因素标志与结果标志的数量变动方向是下降的。

( )答案:×题目2: 相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。

( )答案: √题目3: 只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。

( )答案: ×题目4: 若变量的值增加时,变量的值也增加,说明与之间存在正相关关系;若变量的值减少时,变量的值也减少,说明与之间存在负相关关系。

( )答案: ×题目5: 回归系数和相关系数都可以用来判断现象之间相关的密切程度。

( )答案: ×题目6: 根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。

( )答案: √题目7: 回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。

( )答案: ×题目8: 在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。

( )答案: ×题目9: 产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。

( )答案: √题目10: 计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。

( )答案: ×题目11: 完全相关即是函数关系,其相关系数为±1。

( )答案:√题目12: 估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。

( )答案 ×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )。

A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即( )。

A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量( )。

《统计学原理》课后习题答案

《统计学原理》课后习题答案

第一章练习题参考答案一.单项选择题1.B;2.A;3.B;4.C;5.D;6.A;7.C;8.C;9.C;10.A;11.C;12.C。

二.多项选择题1.ABDE;2.ACD;3.BCD;4.ACD;5.ACDE;6.ACE;7.AD;8.ABC;9.ACD;10.AD;11.BCDE;12.ABCDE;13.AC。

三.判断题1.×;2.×;3.×;4.×;5.√;6.×;7.×;8.√;9.×;10.√。

第二章练习题参考答案一.单项选择题1.C;2.C;3.D;4.B;5.D;6.D;7.B;8.D;9.B;10.B;11.A;12.C;13.D。

二.多项选择题1.CE;2.ACE;3.CE;4.BCD;5.ABCE;6.BC;7.BCD;8.ABD;9.ABD;10.ACDE;11.ABCE;12.ABE。

三.判断题1.×;2.√;3.×;4.×;5.×;6.×;7.√;8.×;9.×;10.×。

第三章练习题参考答案一.单项选择题1.B;2.C;3.C;4.C;5.D;6.B;7.B;8.B;9.D;10.B;11.A;12.B;13.D;14.A。

二.多项选择题1.AB;2.AC;3.AB;4.ABC;5.AB;6.ABD;7.ABC;8.ACE;9.BD;10.ABDE。

三.判断题1.√;2.×;3.×;4.×;5.√;6.×;7.√;8.√;9.×;10.×。

四.计算分析题1.解:(1)按职称编制的分配数列2.解:编制单项式变量数列3.解:(1)编制组距式变量数列。

(2直方图(略)第四章练习题参考答案一.单项选择题1.C;2.D;3.B;4.D;5.C;6.A;7.C;8.C;9.B;10.C;11.B;12.D;13.A;14.D;15.16.B;17.B;18.D;19.C;20.C;21.D;22.B;23.C;24.C;25.B。

《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版

《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版

第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。

2.解释描述统计与推断统计。

描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计研究的是如何利用样本数据来推断总体特征的统计方法。

3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。

4.解释分类数据、顺序数据和数值型数据的含义。

分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。

5.举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。

6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。

分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。

7.举例说明离散型变量和连续型变量。

离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。

使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。

2.比较概率抽样和非概率抽样的特点。

举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

第四版统计学课后习题答案

第四版统计学课后习题答案

第四版统计学课后习题答案《统计学》第四版统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查人数是负责任的表现。

这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

大学统计学第七章练习题及标准答案

大学统计学第七章练习题及标准答案

第7章 参数估计练习题7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ样本均值的抽样标准差79.0410405≈===nx σσ ⑵已知5=σ,40=n ,25=x ,410=x σ,%951=-α 96.1025.02==∴Z Z α边际误差55.1410*96.12≈==nZ E σα 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差;(3) 如果样本均值为120元,求总体均值μ的95%的置信区间。

解.已知.根据查表得2/αz =1.96 (1)标准误差:14.24915===nX σσ(2).已知2/αz =1.96所以边际误差=2/αz *=ns 1.96*4915=4.2(3)置信区间:)(2.124,8.11596.149151202=*±=±ns Z x α7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。

96.12=∂Z144.1674110085414*96.12==⋅∂nZ σ856.87818144.16741104560.2=-=-∂nZ x σ144.121301144.16741104560.2=+=+∂nZ x σ置信区间:(87818.856,121301.144)7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。

(1) 构建μ的90%的置信区间。

(2) 构建μ的95%的置信区间。

(3) 构建μ的99%的置信区间。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏差的尺度,找到使得残差平方和最小的回归系数0ˆβ和1ˆβ的取值的估计方法。

根据微积分中求极小值的原理,可知欲使残差平方和Q 达到最小,Q 对0ˆβ和1ˆβ的偏导数必须等于零。

6.答:总离差平方和是因变量的实际观测值和样本均值的离差平方和;回归平方和是因变量的理论回归值与样本均值的离差平方和;残差平方和是实际观测值与理论回归值的离差平方和。

三者之间的关系是:总离差平方和= 回归平方和+ 残差平方和。

7.答:判定系数R2是回归平方和占总离差平方和的比例,它是对估计的回归模型拟合程度的度量。

它可以解释为:在因变量的离差中,可以由自变量所解释的部分。

R2越接近于1,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好;反之,R2越接近于0,回归直线的拟合程度就越差。

8.答:一元回归模型中,估计标准误差是对各观测数据在回归直线周围分散程度的一种度量值,它是对随机误差项tu 的标准差σ的估计。

它反映了用样本回归方程估计因变量Y时平均误差的大小。

9.答:在多元线性回归方程中,F 检验是对回归方程整体显著性的检验,其原假设为所有回归系数全部为零,即只要其中有一个自变量的回归系数不显著为零,其F 检验就能通过,即该方程整体上是显著的。

但是这并不意味着每个自变量与因变量的关系都显著。

而t 检验是对每个回归系数的显著性单独进行检验,它主要用于检验每个自变量对因变量的影响是否显著非零。

10.答:在一元线性回归模型中,不同的模型都仅包含一个自变量,如果使用的样本容量也一样,判定系数便可以直接作为评价拟合程度的尺度。

然而在多元线性回归模型中,不同模型所包含的自变量个数未必相同,如果在模型中额外增加一个自变量,即使这个自变量没有经济意义,在统计上也不显著,2R 仍可能会变大,至少不会下降,因此为了避免增加自变量而高估2R ,需要对多元线性回归方程的判定系数进行修正,其计算公式为:11)1(122---*--=p n n R R a 。

11.答:(1)人均GDP 与人均消费水平的散点图如下:由散点图可以看出二者之间呈线性正相关关系。

(2)根据样本相关系数公式∑∑∑----=22)()())((Y Y X X Y Y X X r tttt计算可得,人均GDP 与人均消费水平之间的线性相关系数。

(3)各地人均国内生产总值和人均消费水平的有关数据如下表:地区 人均国内生产总值X (元) 人均消费水平(元)X 2 Y 2 XY北京 22460 7326 504451600 53670276 164541960 辽宁 11226 4490 126023076 20160100 50404740 上海 34547 11546 1193495209 133310116 398879662 江西 4851 2396 23532201 5740816 11622996 河南 5444 2208 29637136 4875264 12020352 贵州 2662 1608 7086244 2585664 4280496 陕西 4549 2035 20693401 4141225 9257215合计 85739316091904918867 224483461 651007421已知n =7,∑X =85739,∑Y =31609,∑2X =1904918867,∑XY =651007421,因此根据公式7-9计算可得,,。

估计的一元线性回归方程为:X Y309.0693.734ˆ+=。

其中,0.309表示人均国内生产总值每增加1元,人均消费水平平均增加0.309元;734.693表示与人均国内生产总值无关的人均消费水平平均为734.693元。

(4)根据判定系数公式∑∑∑∑---=--==22222)()ˆ(1)()ˆ(Y Y Y Y Y Y Y Y SSTSSRR tt t计算可得,。

其意义为,在人均消费水平的离差中,有99.6%可以由人均消费水平与人均GDP 之间的线性回归方程来解释,该方程的拟合程度较好。

(5)第1步:提出假设H 0:01=β,即两个变量之间的线性关系不显著。

H 1:01≠β,即两个变量之间的线性关系显著。

第2步:计算检验统计量 根据公式MSEMSRn SSE SSR F =-=)2/(1/计算可得,。

第3步:做出决策在α=0.05的显著性水平下,查F 分布表(分子自由度为1、分母自由度为5),得到临界值F α=6.61。

由于F>F α,因此拒绝H 0,即两个变量之间的线性关系是显著的。

(6)根据回归方程计算可得,,即预测该地区人均消费水平平均为2279.693元。

12.答:啤酒广告费用和销售量的有关数据如下表:啤酒品牌广告费X (万元) 销售量Y (万箱)X 2Y 2XYA 120.0 36.3 14400.00 1317.69 4356.00B 68.7 20.7 4719.69 428.49 1422.09C 100.1 15.9 10020.01 252.81 1591.59D 76.6 13.2 5867.56 174.24 1011.12E 8.7 8.1 75.69 65.61 70.47F 1.0 7.1 1.00 50.41 7.10G 21.5 5.6 462.25 31.36 120.40H 1.4 4.4 1.96 19.36 6.16I 5.3 4.4 28.09 19.36 23.32J 120.0 36.3 2.8918.49 7.31合计40512035579.14 2377.82 8615.56已知n =10,∑X =405,∑Y =120,∑2X =35579.14,∑XY =8615.56,因此根据公式7-9计算可得,,。

估计的一元线性回归方程为:X Y196.0062.4ˆ+=。

13.答:(1) 表7-11 不同广告费用的方差分析表 方差来源df SS MS F Significance F回归11602708.60 1602708.60 399.102.17E-09残差 10 40158.07 4015.81总计 11 1642866.67(2),因此汽车销售量的变差中有97.6%是由广告费用的变动引起的。

(3),即销售量与广告费用之间的相关系数为0.988。

(4)估计的回归方程为:ˆ363.689 1.42YX =+ 其中,1.42表示广告费用每增加1个单位,汽车销售量平均增加1.42个单位;363.689表示广告费用为0时汽车销售量平均为363.689个单位。

(5)F 检验,提出原假设和备择假设:H 0:01=β;H 1:01≠β。

由表7-11可知,F 统计量为399.10,其精确的显著性水平p 值为2.17×10-9,远小于显著性水平α=0.05,因此拒绝H 0,认为两个变量之间的线性关系是显著的。

14.计算过程可参考11和12题,具体过程略。

答:(1)以航班正点率为自变量,顾客投诉次数为因变量得到的回归方程为:ˆY430.19 4.70X =-,其中-4.7表示航班正点率每提高1%,投诉次数平均下降4.70次;430.19没有明确的实际意义,也可以解释为当航班正点率为0时,顾客平均投诉次数为430.19次。

(2)t 检验,提出假设: 01:0H β=;11:0H β≠,t 统计量为-4.96,显著性水平α为0.05,自由度为8,查t 分布表,找到相应的临界值2(102) 2.306t α-=,由于2t t α>,则能够拒绝0H ,表明自变量X 对因变量Y 的影响是显著的。

(3)X=80带入样本回归方程,得到顾客平均投诉次数为54次。

15.答:(1)回归方程为ˆY348.9414.41X =+,其中,14.41表示当广告费每增加1万元时,销售量平均会增加14.41辆;与广告费无关的销售量平均为348.94。

(2)SSR= 755456,SSE= 37504,判定系数210.95SSR SSER SST SST==-=,其统计含义:在销售量的离差中,有95%可以由广告费和销售量之间的线性回归方程来解释;或者说在销售量的变动中,有95%是由广告费用因素决定的,说明该方程的拟合程度较好。

(3)在一元线性回归中,相关系数r 的平方就等于判定系数,而相关系数的r 与回归系数1β的正负号是相同的。

所以相关系数0.97r ==。

(4)将广告费用X=1000带入所得回归方程中得汽车销售量Y=14758.94辆。

(568.47=辆,其统计含义,根据广告费用对汽车销售量进行估计时,平均的估计误差为68.47辆。

相关文档
最新文档