回归分析测试题-21页文档资料

测试题

1.下列说法中错误的是()

A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…, n)将散布在一条直线附近B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。

C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数

D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系

2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是()

A.B. C.D.

3.回归直线必过点()

A.(0,0)B. C. D.

4.在画两个变量的散点图时,下面叙述正确的是()

A.预报变量在轴上,解释变量在轴上

B.解释变量在轴上,预报变量在轴上

C.可以选择两个变量中任意一个变量在轴上

D.可以选择两个变量中任意一个变量在轴上

5.两个变量相关性越强,相关系数r()

A.越接近于0 B.越接近于1 C.越接近于-1 D.绝

对值越接近1

6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()

A.0 B.1 C.-1 D.-1或1

7.一位母亲记录了她儿子3到9岁的身高,数据如下表:

年龄(岁)3456789

身高(94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,

则下面的叙述正确的是()

A.她儿子10岁时的身高一定是145.83

B.她儿子10岁时的身高在145.83以上

C.她儿子10岁时的身高在145.83左右

D.她儿子10岁时的身高在145.83以下

8.两个变量有线性相关关系且正相关,则回归直线方程中,

的系数()

A.B.C.D.

能力提升:

9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:

x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;

(2)求每月产品的总成本y与该月产量x之间的回归直线方程。

10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:

产量x(千件)40424855657988100120140生产费用y(千元)150140160170150162185165190185(1)计算x与y的相关系数;

(2)对这两个变量之间是否线性相关进行相关性检验;

(3)设回归直线方程为,求系数,。

综合探究:

11.一只红铃虫的产卵数y和温度x有关。现收集了7对观测数据列于表中,试建立y与x之间的回归方程。

温度x/℃21232527293235

产卵数y/个711212466115325

参考答案:

基础达标:

1.B

尽管两个变量x与y之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。

2.A

由回归直线经过样本点的中心,由题中所给出的数据,将

,代入中适合,故选A。

3.D

回归直线,必然经过样本点的中心,其坐标为,故选D。

4.B

5.D

6.B

7.C

8.A

9.解析:

(1)画出的散点图如图所示:

(2),,,

∴,

所以所求回归直线方程为。

10.解析:

(1)制表:

1401501600225006000 2421401764196005880 3481602304256007680 4551703025289009350

5651504225225009750

67916262412624412798

78818577443422516280

8100165100002722516500

9120190144003610022800

10140185196003422525900

合计777165770903277119132938

,,,,

∴,

即x与y的相关系数r≈0.808。

(2)因为,所以可以认为x与y之间具有很强的线性相关关系。

(3),。

综合探究:

11.解析:

散点图如图所示:

由散点图可以看出:这些点分布在某一条指数函数的图象的周围。

现在,问题变为如何估计待定参数c

1和c

2

,我们可以通过对数变

换把指数关系变为线性关系。

令,则变换后样本点应该分布在直线(,)的周围。

这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了。

由题中所给数据经变换后得到如下的数据表及相应的散点图x21232527293235

z 1.946 2.398 3.045 3.178 4.190 4.745 5.784

由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。

计算得,,,。

设所示的线性回归方程为,

则有,

得到线性回归方程,

因此红铃虫的产卵数对温度的非线性回归方程为。

总结升华:

(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能

直接利用线性回归方程来建立两个变量之间的关系。根据已有的函数知识,可以发现样本点分布

在一条指数函数曲线的周围,其中c

1和c

2

是待定参数。

(2)选择适当的非线性回归方程。然后通过变量代换,将非线性回归方程化为线性回归方程,并由此

来确定非线性回归方程中的未知参数。

(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有

回归分析

撰稿吕宝珠审稿谷丹责编:严春梅

课程标准的要求

(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;

(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;

(3)理解线性回归模型;

(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体

计算公式.

(5)了解解释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方和;了解样本的

数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样

本的各个点的随机误差的效应的平方和)的参数:残差平方和;了解表示解释变量效应的参数:

回归平方和;了解刻画回归效果的相关指数的含义及计算公式。

(有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的).

(6)了解残差分析的方法及意义,会读或会作残差图.

重点和难点分析

内容精讲

1.相关关系:

当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系

相关关系与函数关系的异同点如下:

相同点:均是指两个变量的关系。

不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间

的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.

2.回归分析:

一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。

对于线性回归分析,我们要注意以下几个方面:

(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析

的前提。

(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不

多元线性回归模型练习题及答案

C .(1-R)(k-1) 多元线性回归模型练习 一、单项选择题 1.在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得可决系数为0.8500,则调整后的可决系数为(D) A.0.8603 B.0.8389 C.0.8655 D.0.8327 2.用一组有30个观测值的样本估计模型y t=b0+b1x1t+b2x2t+u t后,在0.05的 显著性水平上对b1的显著性作t检验,则b1显著地不等于零的条件是其统计量t大于等于(C) A.t0.05(30) B.t0.025(28) C.t0.025(27) D.F0.025(1,28) 3.线性回归模型y t=b0+b1x1t+b2x2t+......+b k x kt+u t中,检验 H0:b t=0(i=0,1,2,...k)时,所用的统计量服从(C) A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2) 4.调整的可决系数与多元样本判定系数之间有如下关系(D) A.R2=n-1 n-k-1 R2 B. R2=1-n-1 n-k-1 R2 C.R2=1-n-1 n-k-1 (1+R2) D. R2=1-n-1 n-k-1 (1-R2) 5.对模型Y i=β0+β1X1i+β2X2i+μi进行总体显著性F检验,检验的零假设是( A) A.β1=β2=0 B.β1=0 C.β2=0 D.β0=0或β1=0 6.设k为回归模型中的参数个数,n为样本容量。则对多元线性回归方程进行显著性检验时,所用的F统计量可表示为(B) A.RSS k-1)B. R2k (1-R2)(n-k-1) R2(n-k) 2 ESS/(k-1) D.TSS n-k) 7.多元线性回归分析中(回归模型中的参数个数为k),调整后的可决系数R2与可决系数R2之间的关系(A) R2=1-(1-R2)n-1 n-k-1 A. B.R2≥R2

1回归分析测试题

回归分析测试题 A 卷 一、 选择题: 1.炼钢时钢水的含碳量和冶炼时间有( ) A.确定性关系 B.相关关系 C.函数关系 D.无任何关系 2.对相关性的描述正确的是( ) A .相关性是一种因果关系 B .相关性是一种函数关系 C .相关性是变量和变量之间带有随机性的关系 D .以上都不正确 3.∑=n i i i y x 1等于( ) A.121)(y x x x n +++ B.121)(x y y y n +++ C. ++2211y x y x D.n n y x y x y x +++ 2211 4.设有一个回归方程为x y 5.22-=,则变量x 增加一个单位时( ) A .y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位 5.x 与y 之间的线性回归方程a bx y +=必定过( ) A.(0,0)点 B.(0,x )点 C.(0,y ) D.(y x ,) 6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观测值,计算得 528 1 =∑=i i x , 2288 1 =∑=i i y ,

4788 1 2=∑=i i x ,18498 1 =∑=i i i y x ,则y 和x 的回归方程是( ) A.x y 62.247.11+= B.x y 62.247.11+-= C.62.247.11+=x y D.x y 62.247.11-= 7.线性回归方程a bx y +=有一组独立的观测数据),(11y x ,),(,),,(22n n y x y x ,则系数b 的值为( ) A. ∑∑==---n i i n i i i y y y y x x 1 2 1 )() )(( B. ∑∑==--n i i n i i i x y y x x 1 21 ) )(( C. ∑∑==---n i i n i i i x x y y x x 1 21 )() )(( D. ∑∑==--n i i n i i y y x x 12 12 )()( 8.已知x 、y 之间的一组数据: 则y 和x 的线性回归方程 a bx y +=必过点( ) A .(2,2) B.(1.5, 0) C. (1, 2) D.(1.5, 4) 二、填空题: 9.线性回归方程a bx y +=中,b 的意义是 . 10.有下列关系:(1)人的年龄和他(她)拥有的财富之间的关系;(2)曲线上的点和该点的坐标之间的关系;(3)苹果的产量和气候之间的关系;(4)森林中的同一种树木,其断面直径和高度之间的关系;(5)学生和他(她)的学号之间的关系.其中有相关关系的是 . 11.若施化肥量x 和水稻产量y 的回归直线方程为2505+=x y , 当施化肥量为80kg 时,预计的水稻产量为 . 12.已知线性回归方程{}),19,13,7,5,1(455.1∈+=x x y 则=y . 13.对于线性回归方程25775.4+=x y ,当28=x 时,y 的估计值是 . 三、解答题: 14.为了研究三月下旬的平均气温(x C 0)和四月二十号前棉花害虫化蛹高峰 x 0 1 2 3 y 1 3 5 7

2013国考资料分析试题及答案

资料分析试题 2013年国考行测资料分析每日一练(1) 【例题】根据以下资料,回答1一5题。 2008年,全国共有普通高等学校和成人高等学校2663所。其中,普通高等学校2263所,比上年增加355所,成人高等学校400所,比上年减少13所。普通高校中本科院校1079所,高职(专科)院校1184所。全国共有培养研究生单位796个;其中高等学校479个,科研机构317个。 全国招收研究生44.64万人,比上年增加2.78万人,增长6.64%;其中博士生5.98万人,硕士生38.67万人。在学研究生128. 30万人,比上年增加8.80万人,增长7.36%;其中博士生23.66万人,硕士生104.64万人。毕业研究生34. 48万人,比上年增加3.3万人,增长10.58%;其中博士生4.37万人,硕士生30.11万人。 普通高等教育本专科共招生607.66万人,比上年增加41.74万人;在校生2021.O2万人,比上年增加136. 12万人,增长7.22%;毕业生511.95万人,比上年增加64. 16万人,增长14.33%。成人高等教育本专科共招生202.56万人,在校生548. 29万人,毕业生169. 09万人。全国高等教育自学考试报考988.82万人次,取得毕业证书55.19万人。 普通高等学校学生平均规模为8679人。 普通高等学校教职工205.10万人,比上年增加7.65万人;其中专任教师123. 75万人,比上年增加 6.92万人。生师规模比为1 7.23:1。成人高等学校教职工 8.99万人,比上年减少4.64万人;其中专任教师5.32万人,比上年减少2.7万人。 1.2008年全国本科院校占普通高校和成人高等学校总和的比例为( )。 A.47.7% B.52.3% C.40.5% D.44.5% 2.2007年,全国普通高等学校和成人高等学校的总数为( )所。 A.2675 B.2321 C.2309 D.2250 3.2008年下列数据增幅最大的是( )。

26、回归分析测试题及答案

中级经济师基础知识 第 1题:单选题(本题1分) 某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。 A、y = 3000 + x B、y = 4000 + 4x C、y = 4000 + x D、y = 3000 + 4x 【正确答案】:A 【答案解析】: 本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x 第 2题:单选题(本题1分) 在回归分析中,估计回归系数的最小二乘法的原理是( )。 A、使得因变量观测值与均值之间的离差平方和最小 B、使得因变量估计值与均值之间的离差平方和最小 C、使得观测值与估计值之间的乘积和最小 D、使得因变量观测值与估计值之间的离差平方和最小 【正确答案】:D 【答案解析】: 较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法 第 3题:多选题(本题2分) 关于相关分析和回归分析的说法,正确的的有() A、相关分析可以从一个变量的变化来推测另一个变量的变化 B、相关分析研究变量间相关的方向和相关的程度 C、相关分析中需要明确自变量和因变量 D、回归分析研究变量间相互关系的具体形式 E、相关分析和回归分析在研究方法和研究目的有明显区别 【正确答案】:BDE 【答案解析】: 相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。 (2)、回归分析是研究变量之间相关关系的具体形式

回归分析模拟试题分解

(1)根据给定的模型,考察当x趋向于无穷大时y的变化,确定参数C0的初始值; (2)求给定的模型关于参数C0、C1、C2的导数; (3)若取参数的初始值C0=100,C1=4to7搜索步长0.1,C2=3to5搜索步长0.1,利用高斯-牛顿迭代法进行参数估计,得到结果如下: 请写出完成该运算的SAS程序(数据集sta7)、拟合所得的模型,计算所得的相关指数R2。Data its_4; Input x y@@; Cards; 1 0.5 2 2.5 3 3.5 4 24 5 54.7 6 82.1 7 94.8

8 96.2 9 96.4 ; ________________________________ Proc qplot; Plot y*x=’*’/grtd; Run; ______________________________ Proc nlin; Paras c0=100 c1=3 to 6 by 0.02 c2=3 to 6 by 0.02; Model y=c0-c0/(1+(x/c2)**c1); Run; 多重共线性对回归参数的估计有何影响? 1.对参数的估计值不精确,也不稳定。样本观测值稍有变动,增加或减少解释变量都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。 2.参数估计的标准差较大,使参数的显著性t检验增加了接受原假设的可能,从而舍去对被解释变量有显著影响的解释变量。 主成分回归的思想和分析步骤: 有偏估计的方法:参数的有偏估计方法有岭回归、主成分回归和偏最小二乘。 主成分回归的思想和方法: (1)主成分回归是利用主成分分析的思想,在损失信息很少的前提下把原变量利用正交旋转变化转化为较少个数的主成分(综合指标),计算样品在所选主成分上的得分,将原因变量对原来各分析样品主成分得分进行回归,并将各主成分分别对原自变量进行回归后再代入原因变量对主成分的回归方程就得到主成分回归方程。 (2)分析步骤: 1.求原自变量集的相关系数矩阵及其特征值和相应的标准正交特征向量; 2.按从大到小排列特征值,以累计方差贡献率>=85%选取前面较大的若干个特征值,利用其相应的特征向量构成主成分; 3.计算各样品在所选主成分上的得分; 4.利用原因变量对所选主成分得分进行回归,各主成分分析对原自变量进行回归并将所得的回归结果代入原因变量对所选主成分的回归方法既得结果 该方法的主要用途是消除自变量间的多重共线性,它与回归参数的普通最小二重估计的主

行测资料分析练习试题及答案专题

行测资料分析练习题及答案专题 根据下列文字材料回答1-5题。 最新统计数字显示,截至2000年底,全国党员总数已达6451万名,占全国人口总数的5.2%;女党员1119万名,占党员总数的17.4%;少数民族党员401.1万名,占党员总数的6.2%。 党员队伍结构不断改善,分布状况更趋合理。目前全国35岁以下的党员有1439.1万名,占党员总数的22.3%。党员队伍中具有高中以上学历的3237.4 万名,占党员总数的50.2%。其中,大学本、专科学历1319.3万名,占20.5%;研究生学历41.1万名,占0.6%。 2000年底,党员队伍中有工人、农牧渔民3166万名,占党员总数的49.1%;各类专业技术人员776.3万名;机关干部592.3万名;事业、企业单位管理人员618.2万名。 据介绍,近年来,全国发展党员数量保持均衡,1990年至2000年,全国共发展党员2175.9万名,平均每年发展党员197.8万名;新党员的构成、分布明显改善,去年全国发展的党员中,35岁以下青年占73.95%,生产、工作一线的党员约占50%;同时女党员在党员队伍中所占比例明显增长,1995年全国发展女党员数占新党员总数的20.9%,2000年达到26.7%。入党积极分子队伍不断壮大,到2000年底,全国共有入党申请人1395.4万名,入党积极分子764.6 万名,分别比10年前增加了315.2万名和211.6万名。 1.截至2000年底,我国男性党员人数为: A.5332万 B. 1439万 C、6451万 D.3794万

2.2000年底党员队伍中,具有大学本、专科学历以上的党员约有:A.3237.4万 B.2157.2万 C.1360.4万 D.784.8万 3.2000年底事业企业单位管理人员中的党员人数占全国党员总数的比例约为:A.9.2% B.9.6% C.9.3% D.9.8%4.2000年全国新发展的女党员占新党员总数的比例与1995年相比,高出了几个百分点: A、5.6 B、7.2 C、6.4 D、5.8 5.1990年底全国共有入党申请人和入党积极分子各多少人: A.1080.2万 627.8万 B.897.6万 627.8万 C.1080.2万 553万 D.897.6万 553万 【答案】1、A 2、C 3、B 4、D 5、C 国家公务员考试行测资料分析练习题及答案(24日),根据下列文字和图表回答6—10题。 “九五”期间(1996—2000年),我国全面完成了现代化建设第二步战略部署:1996—2000年,我国国内生产总值(GDP)分别为67884.6亿元,74462.6亿元,78345.1亿元,81910.9亿元和89404亿元;全社会固定资产投资总额分别为22913.5亿元,24941.1亿元,28406.2亿元,29854.7亿元和32619亿元。附:“九五”期间我国经济增长率和商品零售价格增长率图:

应用回归分析,第8章课后习题参考答案

第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

回归分析练习试题和参考答案解析

1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 α=)。 (5)检验回归方程线性关系的显著性(0.05 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1)

可能存在线性关系。 (2)相关系数: 系数a 模型非标准化系数标准系数 t Sig. 相关性 B标准误差试用版零阶偏部分 1(常量).003 人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平 有很强的线性关系。 (3)回归方程:734.6930.309 y x =+ 系数a 模型非标准化系数标准系数t Sig.相关性

回归系数的含义:人均GDP没增加1元,人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 系数(a) 模型非标准化系数标准化系数 t显著性B标准误Beta 1(常量) 人均GDP(元) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1.998a.996.996 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 模型摘要 模型R R 方调整的 R 方估计的标准差

西南财经_计量经济学期末试题

西南财经大学2007 - 2008 学年第一学期 各专业本科 2005 级(三年级一学期)学号评定成绩(分)学生姓名担任教师 《计量经济学》期末闭卷考试题 (下述一 - 四题全作计100分,两小时完卷) 考试日期: 试题全文: 一、单选题答案 二、多选题答案

一、 单项选择题(每小题1分,共30分) 1、以下模型中属于线性回归模型是( ) A. 212()i i i E Y X X ββ=+ B. 1()i i i E Y X β= C. 212()i i i E Y X X ββ=+ D. 12 i i i X Y u ββ=+ + 2、半对数模型01ln Y X ααμ=++中,参数1α的含义是( ) A . X 的绝对量发生一定变动时,引起因变量Y 的相对变化率 B .Y 关于X 的弹性 C .X 的相对变化,引起Y 的期望值绝对量变化 D .Y 关于X 的边际变化 3、在模型12233t t t t Y X X u βββ=+++的回归分析结果报告中,设F 统计量对应p 值为 F p ,给定显著性水平0.05α=,则下列说法正确是表明( ) A 、若F p α<,解释变量2t X 对t Y 的影响是显著的 B 、若F p α≥,解释变量2t X 和3t X 对t Y 的联合影响是显著的 C 、若F p α< ,则解释变量2t X 和3t X 对t Y 的影响均不显著 D 、以上说法均不对 4、对被解释变量Y 个别值作的区间预测,不具有的特点是( ) A. 对Y 的预测区间是随F X 的变化而变化的 B. 对Y 的预测区间上下限与样本容量有关 C. 对Y 的预测区间只决定于随机扰动i u 的方差 D. 对Y 的预测区间不仅受抽样波动影响,而且还受随机扰动项的影响 5、对多元线性回归方程的显著性检验,所用的F 统计量可表示为( )

回归分析练习题及参考答案

地区人均GDP/元人均消费水平/元 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

有很强的线性关系。 (3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 139.540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 模型摘要 模型R R 方调整的R 方估计的标准差 1 .998(a) 0.996 0.996 247.303

回归分析练习题及参考答案

1 下面是7个地区2000年的人均国生产总值(GDP)和人均消费水平的统计数据: 地区人均GDP/元人均消费水平/元 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

(3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 139.540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

数据分析经典测试题含答案解析

数据分析经典测试题含答案解析 一、选择题 1.某校九年级数学模拟测试中,六名学生的数学成绩如下表所示,下列关于这组数据描述正确的是() A.众数是110 B.方差是16 C.平均数是109.5 D.中位数是109 【答案】A 【解析】 【分析】 根据众数、中位数的概念求出众数和中位数,根据平均数和方差的计算公式求出平均数和方差. 【详解】 解:这组数据的众数是110,A正确; 1 6 x=×(110+106+109+111+108+110)=109,C错误; 21 S 6 = [(110﹣109)2+(106﹣109)2+(109﹣109)2+(111﹣109)2+(108﹣109)2+ (110﹣109)2]=8 3 ,B错误; 中位数是109.5,D错误; 故选A. 【点睛】 本题考查的是众数、平均数、方差、中位数,掌握它们的概念和计算公式是解题的关键. 2.一组数据2,x,6,3,3,5的众数是3和5,则这组数据的中位数是() A.3 B.4 C.5 D.6 【答案】B 【解析】 【分析】 由众数的定义求出x=5,再根据中位数的定义即可解答. 【详解】 解:∵数据2,x,3,3,5的众数是3和5, ∴x=5,

则数据为2、3、3、5、5、6,这组数据为35 2 =4. 故答案为B. 【点睛】 本题主要考查众数和中位数,根据题意确定x的值以及求中位数的方法是解答本题的关键. 3.如图,是根据九年级某班50名同学一周的锻炼情况绘制的条形统计图,下面关于该班50名同学一周锻炼时间的说法错误的是() A.平均数是6 B.中位数是6.5 C.众数是7 D.平均每周锻炼超过6小时的人数占该班人数的一半 【答案】A 【解析】 【分析】 根据中位数、众数和平均数的概念分别求得这组数据的中位数、众数和平均数,由图可知锻炼时间超过6小时的有20+5=25人.即可判断四个选项的正确与否. 【详解】 A、平均数为1 50 ×(5×7+18×6+20×7+5×8)=6.46,故本选项错误,符合题意; B、∵一共有50个数据, ∴按从小到大排列,第25,26个数据的平均值是中位数, ∴中位数是6.5,故此选项正确,不合题意; C、因为7出现了20次,出现的次数最多,所以众数为:7,故此选项正确,不合题意; D、由图可知锻炼时间超过6小时的有20+5=25人,故平均每周锻炼超过6小时的人占总数的一半,故此选项正确,不合题意; 故选A. 【点睛】 此题考查了中位数、众数和平均数的概念等知识,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,如果中位数的概念掌握得不好,不把数据按要求重新排列,就会错误地将这组数据最中间的那个数当作中位数.

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

回归分析练习题与参考答案

1 下面是7个地区2000年的人均国生产总值(GDP)与人均消费水平的统计数据:地区人均GDP/元人均消费水平/元 北京上海 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间与预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

(3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 .540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

回归分析测试题

测试题 1.下列说法中错误的是() A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点 (i=1,2,3,…,n)将散布在一条直线附近 B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。 C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数 D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系 2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程是() A.B.C.D. 3.回归直线必过点() A.(0,0)B.C.D. 4.在画两个变量的散点图时,下面叙述正确的是() A.预报变量在轴上,解释变量在轴上 B.解释变量在轴上,预报变量在轴上 C.可以选择两个变量中任意一个变量在轴上 D.可以选择两个变量中任意一个变量在轴上 5.两个变量相关性越强,相关系数r() A.越接近于0B.越接近于1C.越接近于-1 D.绝对值越接近1 6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()A.0B.1 C.-1 D.-1或1 由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,

则下面的叙述正确的是() A.她儿子10岁时的身高一定是145.83 B.她儿子10岁时的身高在145.83以上 C.她儿子10岁时的身高在145.83左右 D.她儿子10岁时的身高在145.83以下 8.两个变量有线性相关关系且正相关,则回归直线方程中,的系数()A.B.C.D. 能力提升: (1)画出散点图; (2)求每月产品的总成本y与该月产量x之间的回归直线方程。 10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业 (1)计算x与y的相关系数; (2)对这两个变量之间是否线性相关进行相关性检验; (3)设回归直线方程为,求系数,。 综合探究: 11.一只红铃虫的产卵数y和温度x有关。现收集了7对观测数据列于表中,试建立y 参考答案: 基础达标: 1.B

2013.11.24年国家公务员考试真题及答案解析行测《资料分析》

2014年国家公务员考试真题及答案解析行测《资料分析》 第五部分资料分析 (共20题,参考时限20分钟) 所给出的图、表、文字或综合性资料均有若干个问题要你回答。你应根据资料提供的信息进行分析、比较、计算和判断处理。 请开始答题: 一、根据以下资料,回答116~120题。 2012年全国国道网车流量较大的地区主要集中在北京、天津、上海、江苏、浙江、广东和山东,上述省市国道网的日平均交通量均超过2万辆。全国国道网日平均行驶量为244883万,北京、天津、河北、山西、上海、浙江、湖北、广东的国道年平均拥挤度均超过0.6.其中,国家高速公路日平均交通量为22181辆,日平均行驶量为148742万车公里;普通国道日平均交通量为10845辆,日平均行驶量为111164万车公里。全国调整公路日平均交通量为21305辆,日平均行驶量为204717万车公里。(注:交通拥挤度指公路上某一路段折算交通量与适应交通量的比值,反映交通的繁忙程度。) 2008~2012年全国国道与高速公路日平均交通量及年平均交通拥挤度116.2009~2012年全国国道日平均交通量同比增速最快的一年是: A.2010年 B.2009年 C.2012年 D.2011年 117.2008~2012年全国国道与高速公路年平均拥挤度数值相差最小的年份,高速公路全年日平均交通量为:

A.10765辆 B.16837辆 C.12632辆 D.19423辆 118.以下关于2012年日平均行驶量由高到低排序正确的是: A。国家高速公路—全国高速公路—普通国道 B。全国高速公路—国家高速公路—全国国道网 C。全国国道网—普通国道—国家高速公路 D。全国国道网—全国高速公路—普通国道 119.2012年国家高速公路日平均交通量约是普通国道日平均交通量的:A.1.7倍 B.1.5倍 C.2.0倍 D.1.8倍 120.能够从上述资料中推出的是: A.2008~2012年,全国国道交通繁忙程度持续增加 B.2012年国道网日平均交通量超过2万辆的省份最多有6个 C.2008~2012年,全国高速公路交通繁忙程度持续增加 D.2012年国道年平均拥挤度超过0.6的省份至少有8个 二、根据以下资料,回答121~125题。

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( )

应用回归分析试题二

应用回归分析试题(二) 一、选择题 1. 在对两个变量x , y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释;②收集数据(X i 、),1,2,…, n ;③ 求线性回归方程;④求未知参数; ⑤根据所搜集的数据绘制 散点图。 如果根据可行性要求能够作出变量x ,y 具有线性相关结论,则在下列 操作中正确的是(D ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 2. 下列说法中正确的是(B ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 3. 下面的各图中,散点图与相关系数r 不符合的是(B ) \ 4 yi i .? — |

5. 在画两个变量的散点图时,下面哪个叙述是正确的 (B ) (A) 预报变量在x 轴上,解释变量在y 轴上 (B) 解释变量在x 轴上,预报变量在y 轴上 (C) 可以选择两个变量中任意一个变量在 X 轴上 (D) 可以选择两个变量中任意一个变量 二、 填空题 m 丄 1. y 关于m 个自变量的所有可能回归方程有-一1个。 2. H 是帽子矩阵,贝S tr(H)=p+1。 3. 回归分析中从研究对象上可分为一元和多元。 4. 回归模型的一般形式是 y ° 1X 1 2X 2 p X p 。 5. Cov(e) 2(l H) (e 为多元回归的残差阵)。 三、 叙述题 1.引起异常值消除的方法(至少5个)? 答案:异常值消除方法: (1) 重新核实数据; (2) 重新测量数据; (3) 删除或重新观测异常值数据; (4) 增加必要的自变量; 则正确的叙述是(D ) A .身咼一定是145.83cm C .身高低于145.00cm B .身高超过146.00cm D .身高在145.83cm 左右

相关文档
最新文档