应用回归分析试卷.doc

应用回归分析试卷.doc
应用回归分析试卷.doc

1、对于一元线性回归01(1,2,...,)i i i y x i n ββε=++=,()0i E ε=,2

var()i εσ=,

cov(,)0()i j i j εε=≠,下列说法错误的是

(A)0β,1β的最小二乘估计0?β,1

?β 都是无偏估计; (B)0β,1β的最小二乘估计0?β,1?β对1y ,2y ,...,n y 是线性的;

2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y 的期望成正比,则可通过下列哪种变换将方差常数化 (A) 1

y

(C) ln(1)y +;(D)ln y .

3、下列说法错误的是

(A)强影响点不一定是异常值;

(B)在多元回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的; (C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关.

4、下面给出了4个残差图,哪个图形表示误差序列是自相关的

(A)

应用回归分析试题(一)

(C)0β,1β的最小二乘估计0?β,1

?β之间是相关的; (D)若误差服从正态分布,0β,1β的最小二乘估计和极大似然估计是不一样的.

(C) (D)

5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的

(A)

(B)

(C) (D)

二、填空题(每空2分,共20分)

1、考虑模型y X βε=+,2var()n I εσ=,其中:X n p '?,秩为p ',2

0σ>不一定

已知,则?β

=__________________, ?var()β=___________,若ε服从正态分布,则 22

?()n p σ

σ

'-___________,其中2

是2

σ的无偏估计. 2、下表给出了四变量模型的回归结果:

则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________.

3、已知因变量y 与自变量1x ,2x ,3x ,4x ,下表给出了所有可能回归模型的AIC 值,则最优子集是_____________________.

4、在诊断自相关现象时,若0.66DW =,则误差序列的自相关系数ρ的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法.

5、设因变量y 与自变量x 的观察值分别为12,,...,n y y y 和12,,...,n x x x ,则以*

x 为折点的

折线模型可表示为_____________________.

三、(共45分)研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的线性回归关系.观察数据及残差值i e 、学生化残差i SRE 、删除学生化残差()i SRE 、库克距离i D 、杠杆值ii ch 见表一

表一

表二 参数估计表

已知0.025(6) 2.447t =,0.025(7) 2.365t =,0.05(3,6) 4.76F =,0.05(4,7) 4.12F =,根据上述结果,解答如下问题:

1、计算误差方差2

σ的无偏估计及判定系数2

R .(8分)

2、对1x ,2x ,3x 的回归系数进行显著性检验.(显著性水平0.05α=)(12分)

3、对回归方程进行显著性检验.(显著性水平0.05α=)(8分)

4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分)

5、写出y 关于1x ,2x ,3x 的回归方程,并结合实际对问题作一些基本分析(7分) 四、(共8分)某种合金中的主要成分为金属A 与金属B ,研究者经过13次试验,发现这两种金属成分之和x 与膨胀系数y 之间有一定的数量关系,但对这两种金属成分之和x 是否对膨胀系数y 有二次效应没有把握,经计算得y 与x 的回归的残差平方和为3.7,y 与x 、

2x 的回归的残差平方和为0.252,试在0.05的显著性水平下检验x 对y 是否有二次效应?

(参考数据0.050.05(1,10) 4.96,(2,10) 4.1F F ==)

五、(共12分)(1)简单描述一下自变量12,,...,p x x x 之间存在多重共线性的定义;(2分) (2)多重共线性的诊断方法主要有哪两种?(4分) (3)消除多重共线性的方法主要有哪几种?(6分)

应用回归分析试题(二)

一、选择题

1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平均值为2,数据y 的平均值为3,则 ( A )

A .回归直线必过点(2,3)

B .回归直线一定不过点(2,3)

C .点(2,3)在回归直线上方

D .点(2,3)在回归直线下方

2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( A )A .y x 1=+ B .y x 2=+ C .y 2x 1=+ D.y x 1=-

3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤:

①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ),1,2i =,…,n ;

③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图

如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( D )

A .①②⑤③④

B .③②④⑤①

C .②④③①⑤

D .②⑤④③①

4. 下列说法中正确的是(B )

A .任何两个变量都具有相关关系

B .人的知识与其年龄具有相关关系

C .散点图中的各点是分散的没有规律

D .根据散点图求得的回归直线方程都是有意义的

5. 给出下列结论:

(1)在回归分析中,可用指数系数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;

(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;

(3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好;

(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有(B )个.

A .1

B .2

C .3

D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时(C )

A.y 平均增加1.5个单位

B.y 平均增加2个单位

C.y 平均减少1.5个单位

D.y 平均减少2个单位

7. 下面的各图中,散点图与相关系数r 不符合的是(B )

8. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为

?7.1973.93y

x =+,据此可以预测这个孩子10岁时的身高,则正确的叙述是( D ) A .身高一定是145.83cm B .身高超过146.00cm

C .身高低于145.00cm

D .身高在145.83cm 左右

9. 在画两个变量的散点图时,下面哪个叙述是正确的( B ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上

10. 两个变量y 与x 的回归模型中,通常用2

R 来刻画回归的效果,则正确的叙述是( D ) A. 2

R 越小,残差平方和小 B. 2

R 越大,残差平方和大 C. 2

R 于残差平方和无关 D. 2

R 越小,残差平方和大

11. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2

R 如下 ,其中拟合效果最好的模型是( A )

A.模型1的相关指数2

R 为0.98 B.模型2的相关指数2

R 为0.80 C.模型3的相关指数2

R 为0.50 D.模型4的相关指数2

R 为0.25

12. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( B ) A.总偏差平方和 B.残差平方和

C.回归平方和

D.相关指数R 2

13.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为?6090y x =+,下列判断正确的是(C ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元

14. 下列结论正确的是(C )

①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

A.①② B.①②③ C.①②④ D.①②③④

15. 已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( C ) A. 1.234y x =+ B. 1.235y x =+ C. 1.230.08y x =+ D.0.08 1.23y x =+

二、填空题

16. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数2R 的值分别约为0.96和0.85,则拟合效果好的模型是 甲 .

17. 在回归分析中残差的计算公式为 列联表、三维柱形图、二维条形图 . 18. 线性回归模型y bx a e

=++(a 和b 为模型的未知参数)中,e 称为 随机误差 . 19. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2.…n)若e i 恒

为0,则R 2

为___ e i 恒为0,说明随机误差对y i 贡献为0. 三、解答题

20. 调查某市出租车使用年限x 和该年支出维修费用y (万元),得到数据如下:

使用年限x 2 3

4

5 6 维修费用y 2.2 3.8 5.5 6.5 7.0

(2)由(1)中结论预测第

10年所支出的维修费用.(1

21()()()n

i i i n i i x x y y b x x a y bx

==?

-?-??=?-??=-??∑∑) 20. 解析: (1i 1

2

3 4 5 i x

2 3 4 5 6 i y 22

38

55

65

70

i i y x

44

114

220

325

420

2i x

4 9

16

25 36

4=x , 5=y , 905

1

2=∑=i i

x , 3.1125

1

=∑=i i i y x

于是23.14

5905

453.112552

2

51

25

1=?-??-=

--=

∑∑==x

x y

x y

x b i i i i

i , 08.0423.15=?-=-=bx y a

∴线性回归方程为:08

.023.1^

+=+=x a bx y (2)当x=10时,

38.1208.01023.1^=+?=y (万元)

即估计使用10年时维修费用是1238万元 回归方程为: 1.230.08y x =+

(2) 预计第10年需要支出维修费用12.38 万元.

21. 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:

(1)画出数据对应的散点图;

(2)求线性回归方程,并在散点图中加上回归直线;

(3)据(2)的结果估计当房屋面积为2

150m 时的销售价格. (4)求第2个点的残差。

21. 解析:(1)数据对应的散点图如图所示:

(2)1095151==∑=i i x x ,1570)(2

5

1

=-=∑=x x l i i xx ,

308))((,2.235

1

=--==∑=y y x x l y i i i xy

设所求回归直线方程为a bx y +=

则1962.01570

308

≈=

=

xx

xy l l b 8166.11570

308

1092.23≈?

-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y

(3)据(2),当2

150x m =时,销售价格的估计值为:

2466.318166.11501962.0=+?=y

(万元)

必看经典例题

1. 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。要检验x 与y 之间的线性关系是否显著,即检验假设:01:0H β=。

(1)线性关系检验的统计量F 值是多少? (2)给定显著性水平a =0.05,F a 是多少? (3)是拒绝原假设还是不拒绝原假设?

(4)假定x 与y 之间是负相关,计算相关系数r 。 (5)检验x 与y 之间的线性关系是否显著?

解:(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;

因此:F=1SSR k SSE n k --=60

14018

=27 (2)()1,18F α=()0.051,18F =4.41 (3)拒绝原假设,线性关系显著。 (4)

,由于是负相关,因此r=-0.7746

(5)从F 检验看线性关系显著。

2. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:

(1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

(3)销售量与广告费用之间的相关系数是多少?

(4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显著性(a =0.05)。

解:

(2)R 2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。 (3)r=0.9877。

(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。 (5)回归系数的检验:p=2.17E —09<α,回归系数不等于0,显著。 回归直线的检验:p=2.17E —09<α,回归直线显著。

3. 根据两个自变量得到的多元回归方程为12?18.4 2.01

4.74y

x x =-++,并且已知n =10,SST =6 724.125,SSR =6 216.375,1?0.0813s β=,

2

?s β=0.056 7。要求:

(1)在a=0.05的显著性水平下,12,x x 与y 的线性关系是否显著? (2)在a =0.05的显著性水平下,1β是否显著?

(3)在a =0.05的显著性水平下,2β是否显著?

解(1)回归方程的显著性检验:

假设:H 0:1β=2β=0 H 1:1β,2β不全等于0 SSE=SST-SSR=6 724.125-6 216.375=507.75 F=

1SSR p SSE n p --=6724.1252

507.751021

--=42.85

()2,7F α=4.74,F>()2,7F α,认为线性关系显著。

(2)回归系数的显著性检验: 假设:H 0:1β=0 H 1:1β≠0 t=

1

1S ββ= 2.010.0813

=24.72 ()21t n p α--=2.36,t >()27t α,认为y 与x 1线性关系显著。

(3)回归系数的显著性检验: 假设:H 0:2β=0 H 1:2β≠0 t=

2

2S β

β= 4.740.0567=83.6 ()21t n p α--=2.36,t >()27t α,认为y 与x 2线性关系显著。

4. 根据下面Excel 输出的回归结果,说明模型中涉及多少个自变量、少个观察值?写出回归方程,并根据F ,s e ,R 2及调整的2a R 的值对模型进行讨论。

df SS MS F Significance F

回归

3 321946.8018

107315.6006

8.961759

0.002724

残差11 131723.1982 11974.84

总计14 453670

Coefficients 标准误差t Stat P-value

Intercept

X Variable 1 X Variable 2 X Variable 3 657.0534

5.710311

-0.416917

-3.471481

167.459539

1.791836

0.322193

1.442935

3.923655

3.186849

-1.293998

-2.405847

0.002378

0.008655

0.222174

0.034870

解:自变量3个,观察值15个。

回归方程:?y=657.0534+5.710311X1-0.416917X2-3.471481X3

拟合优度:判定系数R2=0.70965,调整的2

a

R=0.630463,说明三个自变量对因变量的影响的比例占到63%。

回归方程的检验:F检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系显著。

回归系数的检验:

1

β的t检验的P=0.008655,在显著性为5%的情况下,y与X1线性关系显

著。

2

β的t检验的P=0.222174,在显著性为5%的情况下,y与X2线性关系不显著。

3

β的t检验的P=0.034870,在显著性为5%的情况下,y与X3线性关系显著。

因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。

回归分析测试题-21页文档资料

测试题 1.下列说法中错误的是() A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…, n)将散布在一条直线附近B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。 C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数 D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系 2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是() A.B. C.D. 3.回归直线必过点() A.(0,0)B. C. D. 4.在画两个变量的散点图时,下面叙述正确的是() A.预报变量在轴上,解释变量在轴上 B.解释变量在轴上,预报变量在轴上 C.可以选择两个变量中任意一个变量在轴上 D.可以选择两个变量中任意一个变量在轴上 5.两个变量相关性越强,相关系数r() A.越接近于0 B.越接近于1 C.越接近于-1 D.绝

对值越接近1 6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为() A.0 B.1 C.-1 D.-1或1 7.一位母亲记录了她儿子3到9岁的身高,数据如下表: 年龄(岁)3456789 身高(94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高, 则下面的叙述正确的是() A.她儿子10岁时的身高一定是145.83 B.她儿子10岁时的身高在145.83以上 C.她儿子10岁时的身高在145.83左右 D.她儿子10岁时的身高在145.83以下 8.两个变量有线性相关关系且正相关,则回归直线方程中, 的系数() A.B.C.D. 能力提升: 9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:

语文期末考试试卷分析

语文期末考试 试卷分析 一、试卷总体评价 本次高三语文试题在命制过程中严格依据2018年课标卷《考试说明》和《课程标准》的具体要求,在题型设置上紧扣2018年高考语文试题的变化特征,做到高度契合,目的在于引导学生认识高考语文,把握命题的基本特征,从而实现心中有数的测试目标,全卷总分150分,分为现代文阅读、古诗文阅读、语言文字应用以及写作等四个部分,注重考查学生的语文知识积淀和语文解题能力。通过考试后的成绩分析来看,达到了测试的预期目标,一方面,让学生明确了高考语文试题的基本特征和命题规律,有效检测了学生前期的学习状况,同时为教师了解学情,明确现状提供了依据,为后期高考语文一轮复习方案的制定提供了重要参考。 二、答卷存在的问题 (1)基础知识薄弱。病句、成语题普遍较差,据不完全统计,成语题的正确率不会高于20%,名句名篇默写平均分只有1.35分,如此低难度的题目考试效果却不十分理想,显示出的根本问题在于学生学习态度不端正,不肯下功夫去背诵,对语文学习总的时间投入过少。

(2)缺少规范意识。就高考语文而言,许多题目的解题具有一定的规律性,如“理解句子含义题”,在解题时就要树立表层含义,深层含义,主旨意义等三个角度,着重从关键词语,上下文语境,以及文章主题等三个角度去思考。许多同学在完成该题时缺少规范的表达,甚至于无所适从,不知道从何入手。 (3)应试技巧欠缺。如选择题不少同学选中某项,一见钟情后不再用别的选项来检验,以致出现差错。现代文阅读解题时不知道"回到文中",对于主观题而言,尽量用原文有关词句回答问题,即使用自己的语言组织也要从原文找根据,树立起文本意识。 (4)文言能力较差。遇到文言翻译题,要么不会,要么翻译与原文大相径庭,要么翻译出的句子有明显的语病,达不到“信”、“达”的基本要求,该题得分率不到40%,提升空间很大。 (5)写作缺少结构。许多同学的写作毫无章法,不顾应试作文的特点,洋洋洒洒,下笔千言,结果大大超出了800字的范围,叫人产生视觉疲劳,反而出力不讨好。答题过程中字迹潦草,与整洁美观的卷面要求相差甚远,不仅扣掉显性的卷面清洁分1—2分,而且隐含的文面印象分也大打折扣。 四、应对措施 1、调动学生学习的积极性。针对大多数学生不重视语文学科的状况,要充分调动学生的学习积极性,提升课堂效率。

应用回归分析,第7章课后习题参考答案

第7章岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X|≈0,回归系数估计的方差就很大,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X’X)-1为奇异时,给X’X加上一个正常数矩阵 D, 那么X’X+D接近奇异的程度就会比X′X接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k有哪几种方法? 答:最优 是依赖于未知参数 和 的,几种常见的选择方法是: 岭迹法:选择 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多;

方差扩大因子法: ,其对角线元 是岭估计的方差扩大因子。要让 ; 残差平方和:满足 成立的最大的 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量; 2. 当k值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随着k的增加迅速趋近于零。像这样岭回归系数不稳定、震动趋于零的自变量,我们也可以予以剔除; 3. 去掉标准化岭回归系数很不稳定的自变量。如果有若干个岭回归系数不稳定,究竟去掉几个,去掉那几个,要根据去掉某个变量后重新进行岭回归分析的效果来确定。

高考试题 回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

根据以上数据,则 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题 中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随机 误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 () 0.55i i y y =-=∑, 7≈2.646. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+ 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据测 量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下: (1) 设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低

二年级道德与法治期末考试试卷分析

二年级道德与法治期末考试试卷分析 袁庄乡中心小学二.一班李喜玲 一、试卷的评价 (一)试卷的基本情况 《道德与法治》考试时间为60分钟。本学科期末考试的题型填空题、选择题、辨析题、连线题、简答题,这五个部分组成。 (二)试卷的基本特点 1、基础性强。试题立足于基础知识,与学生的生活和学习密切相关,以重点知识来设计题目。重在考查学生对道德法制基础知识的掌握情况。 2、标高适度。基于目前小学生的学习能力,试卷没出现较大的偏题、怪题。整卷的试题难度应该说是比较适中的。 3、题目设计具有简明性。题意指向明确,题目的表述较清楚,简单明了,学生审题时一目了然。 二、试卷成绩情况 这张试卷主要考察小学二年级上册道德与法制的内容。从总体考试成绩来看,班平均分87.9,优秀率65%,及格率为96.8%, 三、针对考试内容进行分析 1、首先,第一部分是填空题,共计20分,得分率为80%左右,当然,这和平时教师的教及作业有着密切的联系(学习指导),这也说明老师和学生在平时的课堂教学中特别注重对基础知识的把握。 2、其次,第二部分为判断题,共计20分。本题先对某个观点进行判断,其次再说明理由此题得分率为60%左右,相对来说比较低。这也说明学生在答题时没有认真审题。 3、第三部分选择题,共计20分,本题主要考察学生的阅读能力、分析能力、思考能力、查找答案的能力等,每位学生的水平不一,结果丢分较多。这充分反映了考生政治学习与考试的各项基本技能和综合能力有待提高。 4、第四部分连线,共计12,分此题做的较好,没有失分现象。 5、第五部分为简答题,共计28分,本题主要考察学生上课认真听讲和做笔记的能力。一般来说,简答题考的就是课本上原原本本的知识点,认真听讲和认真做笔记的同学则容易拿满分。但此题失分较多其主要表现在: (1)考生的基本功有待提高,错别字现象、字迹模糊不清现象、语言表达不通顺现象等依然存在。说明学生的基本功不扎实。基础打的不牢。 (2)考生理解题意、分析问题、解决问题能力不强。答卷中答非所问,文字表达不切要点等现象也很严重。有许多同学做题不认真,没有认真审题,对题意理解不深,考虑问题不全面,造成不必要的丢分。 (3)考生的应试能力不强。很多学生不理解考试的问题,不能回答,造成失分。这就表明考生如何选择有效信息作答的应试能力有待提高。 总之,考生在答卷过程中所呈现出来的一系表象,为指导我们今后的道法教学和考试提供可贵的一手资料,我们应深刻剖析。这就要求我们在今后的教学中要注重学生综合能力的提高。 四、改进措施 1、注重培养学生阅读能力、分析能力、概括和综合能力。 2、加强学法指导,教师在教学中要教学生如何审题,如何寻找试题的关键词捕

应用回归分析填空题和答案

应用回归分析:填空 (1) 回归分析是处理变量间_______关系的一种数理统计方法,若变量间具有线性关系,则称相应的回归分析为____________;若变量间不具有线性关系,就称相应的回归分析为___________________。 (2) 现代统计学中研究统计关系的两个重要分支是_________和_____________。 (3) 回归模型的建立是基于回归变量的样本统计数据,常用的样本数据分为___ ___________________和______________________。 (4) 回归模型通常应用于______________________、____________________和_____________________等方面。 (5) 最小二乘法的基本特点是使回归值与_________________________平方和为最小,最小二乘法的理论依据是___________________________。 (6) 多元线性回归模型ε β += X Y ,回归参数β的最小二乘估计为 β ?=_________________________。 (7) 设线性回归模型参数向量β(p+1维)的最小二乘估计为β?,c 为p+1维常数向量,则______________是____________的最小方差线性无偏估计。 (8) 在线性回归分析中,最小二乘估计的性质有______________; _____ _____________和____________________等。 (9) 多元线性回归模型n i x x y i ip p i i ,,2,1,110 =++++=εβββ,误差项 ()n i i ,,2,1, =ε需满足的markov Gauss -假设为: (a):________________________________________; (b):________________________________________; (c):_________________________________________。 (10) 对回归方程做显著性检验时,可以用P 值代替检验统计量值,作出拒绝或接受原假设的决定:当P_______α时,接受0H ;当P________α时,拒绝0H 。 (11) 在p 元线性回归中,确定随机变量y 与自变量12,,,p x x x 间是否有线性

应用回归分析第三章课后习题整理

y1 1 x11 x12 x1p 0 1 3.1 y2 1 x21 x22 x2p 1 + 2 即y=x + yn 1 xn1 xn2 xnp p n 基本假定 (1) 解释变量x1,x2…,xp 是确定性变量,不是随机变量,且要求 rank(X)=p+1

n 注 tr(H) h 1 3.4不能断定这个方程一定很理想,因为样本决定系数与回归方程中 自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较 多,使样本量与自变量的个数接近时, R 2易接近1,其中隐藏一些虚 假成分。 3.5当接受H o 时,认定在给定的显著性水平 下,自变量x1,x2, xp 对因变量y 无显著影响,于是通过x1,x2, xp 去推断y 也就无多大意 义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描 述,而误用了线性模型,使得自变量对因变量无显著影响;另一方面 可能是在考虑自变量时,把影响因变量y 的自变量漏掉了,可以重新 考虑建模问题。 当拒绝H o 时,我们也不能过于相信这个检验,认为这个回归模型 已经完美了,当拒绝H o 时,我们只能认为这个模型在一定程度上说明 了自变量x1,x2, xp 与自变量y 的线性关系,这时仍不能排除排除我 们漏掉了一些重要的自变量。 3.6中心化经验回归方程的常数项为0,回归方程只包含p 个参数估计 值1, 2, p 比一般的经验回归方程减少了一个未知参数,在变量较 SSE (y y)2 e12 e22 1 2 1 E( ) E( - SSE* - n p 1 n p n 2 [D(e) (E(e ))2 ] 1 n (1 1 n 2 en n E( e 1 1 n p 1 1 n p 1 1 "1 1 n p 1 J (n D(e) 1 (p 1)) 1_ p 1 1 1 n p 1 2 2 n E(e 2 ) (1 h ) 2 1

高考试题回归分析,独立性检验

高考试题回归分析,独 立性检验 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元 家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( )

应用回归分析-第3章课后习题参考答案

第3章 多元线性回归 思考与练习参考答案 3.1 见教材P64-65 3.2 讨论样本容量n 与自变量个数p 的关系,它们对模型的参数估计有何影响? 答:在多元线性回归模型中,样本容量n 与自变量个数p 的关系是:n>>p 。如果n<=p 对模型的参数估计会带来很严重的影响。因为: 1. 在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。 2. 解释变量X 是确定性变量,要求()1rank p n =+

应用回归分析试卷

1、对于一元线性回归01(1,2,...,)i i i y x i n ββε=++=,()0i E ε=,2 var()i εσ=, cov(,)0()i j i j εε=≠,下列说法错误的是 (A)0β,1β的最小二乘估计0?β,1 ?β 都是无偏估计; (B)0β,1β的最小二乘估计0?β,1?β对1y ,2y ,...,n y 是线性的; 2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y 的期望成正比,则可通过下列哪种变换将方差常数化 (A) 1 y ; (C) ln(1)y +;(D)ln y . 3、下列说法错误的是 (A)强影响点不一定是异常值; (B)在多元回归中,回归系数显着性的t 检验与回归方程显着性的F 检验是等价的; (C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关. 4、下面给出了4个残差图,哪个图形表示误差序列是自相关的 (A) (C) 5 应用回归分析试题(一) (C)0β,1β的最小二乘估计0?β,1 ?β之间是相关的; (D)若误差服从正态分布,0β,1β的最小二乘估计和极大似然估计是不一样的.

(A) (B) (C) (D) 二、填空题(每空2分,共20分) 1、考虑模型y X βε=+,2var()n I εσ=,其中:X n p '?,秩为p ',2 0σ>不一定 已知,则?β =__________________, ?var()β=___________,若ε服从正态分布,则 22 ?()n p σ σ'-:___________,其中2?σ 是2σ的无偏估计. 2、下表给出了四变量模型的回归结果: 则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________. 3、已知因变量y 与自变量1x ,2x ,3x ,4x ,下表给出了所有可能回归模型的AIC 值,则最优子集是_____________________. 4、在诊断自相关现象时,若0.66DW =,则误差序列的自相关系数ρ的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法. 5、设因变量y 与自变量x 的观察值分别为12,,...,n y y y 和12,,...,n x x x ,则以* x 为折点的 折线模型可表示为_____________________. 三、(共45分)研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的线性回归关系.观察数据及残差值i e 、学生化残差i SRE 、

数学期末考试试卷分析

数学期末考试试卷分析 数学期末考试试卷分析 一、试题分析: 本次测试,考核知识内容全面,覆盖面广,重视了基础知识、基本技能,以及解决问题能力的考查,有一定的综合性和灵活性,能突出学生灵活运用知识能力的考评,以实现学用结合,学以致用的目的。本试卷通过不同形式,从不同侧面考查了学生对知识的掌握情况。从难易程度看,总体上说难易适度,结构合理。考试时间充沛,学生都能从容答题。 参考人数47 良好人数1 良好率100优秀人数32 优秀率6808 平均值9130 二、错题分析 (一)填空。本题注重于本册数学基础知识的题型,共有1小题,其

中第13题、14题和1题错得较多。第13题,从100到300的数中,有()个十位和各位相同的数。多数学生填30,算成3段,实际上100-200,200-300是两段,学生知识迁移能力不强。第14题考查的内容是组合,少数学生出现错误,基本上是讲过的原题,少数学生基础不扎实。第14题是一道排列题,讲过好多遍,学生觉得自己会了,自己一做就出现错误。 (二)判断。本题共有题。考察小数、面积、年月日、等知识,学生正确率较高。 (三)选择题。本题共有题,得分率较高。错的比较多的是第题要使34×□的积是三位数,□中最大填几?部分学生分析能力不强。 (四)计算。本题分口算和笔算两部分,主要考查学生的计算能力。得分率较高。但也有个别学生做题比较粗心,如口算算错,笔算中进位、退位忘记,数字抄错,得数忘记写等等。 (五)比较大小。得分率较高。 (六)数据分析题。错误原因主要是小数计算出现问题。 (七)解决问题。第3题和第题的错误率较高,第三题要先求宽,用

应用回归分析,第4章课后习题参考答案

第4章违背基本假设的情况 思考与练习参考答案 4.1 试举例说明产生异方差的原因。 答:例4.1:截面资料下研究居民家庭的储蓄行为 Y i=β0+β1X i+εi 其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。 由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。 例4.2:以某一行业的企业为样本建立企业生产函数模型 Y i=A iβ1K iβ2L iβ3eεi 被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。 4.2 异方差带来的后果有哪些? 答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 2、变量的显著性检验失去意义 3、回归方程的应用效果极不理想 总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。 4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差

的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。 加权最小二乘法的方法: 4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。 答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ,以调整各项在平方和中的作用,加权最小二乘的离差平方和为: ∑=----=n i ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ (2) 加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββ?,,?,?10 使式(2)的离差平方和w Q 达极小。所得加权最小二乘经验回归方程记做 22011 1 ???()()N N w i i i i i i i i Q w y y w y x ββ===-=--∑∑22 __ 1 _ 2 _ _ 02 222 ()() ?()?1 11 1 ,i i N w i i i w i w i w w w w w kx i i i i m i i i m i w x x y y x x y x w kx x kx w x σβββσσ==---=-= = ===∑∑1N i =1 1表示=或

回归分析模拟试题

(1)根据给定的模型,考察当x趋向于无穷大时y的变化,确定参数C0的初始值; (2)求给定的模型关于参数C0、C1、C2的导数; (3)若取参数的初始值C0=100,C1=4to7搜索步长0.1,C2=3to5搜索步长0.1,利用高斯-牛顿迭代法进行参数估计,得到结果如下: 请写出完成该运算的SAS程序(数据集sta7)、拟合所得的模型,计算所得的相关指数R2。Data its_4; Input x y@@; Cards; 1 0.5 2 2.5 3 3.5 4 24 5 54.7 6 82.1 7 94.8

8 96.2 9 96.4 ; ________________________________ Proc qplot; Plot y*x=’*’/grtd; Run; ______________________________ Proc nlin; Paras c0=100 c1=3 to 6 by 0.02 c2=3 to 6 by 0.02; Model y=c0-c0/(1+(x/c2)**c1); Run; 多重共线性对回归参数的估计有何影响? 1.对参数的估计值不精确,也不稳定。样本观测值稍有变动,增加或减少解释变量都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。 2.参数估计的标准差较大,使参数的显著性t检验增加了接受原假设的可能,从而舍去对被解释变量有显著影响的解释变量。 主成分回归的思想和分析步骤: 有偏估计的方法:参数的有偏估计方法有岭回归、主成分回归和偏最小二乘。 主成分回归的思想和方法: (1)主成分回归是利用主成分分析的思想,在损失信息很少的前提下把原变量利用正交旋转变化转化为较少个数的主成分(综合指标),计算样品在所选主成分上的得分,将原因变量对原来各分析样品主成分得分进行回归,并将各主成分分别对原自变量进行回归后再代入原因变量对主成分的回归方程就得到主成分回归方程。 (2)分析步骤: 1.求原自变量集的相关系数矩阵及其特征值和相应的标准正交特征向量; 2.按从大到小排列特征值,以累计方差贡献率>=85%选取前面较大的若干个特征值,利用其相应的特征向量构成主成分; 3.计算各样品在所选主成分上的得分; 4.利用原因变量对所选主成分得分进行回归,各主成分分析对原自变量进行回归并将所得的回归结果代入原因变量对所选主成分的回归方法既得结果 该方法的主要用途是消除自变量间的多重共线性,它与回归参数的普通最小二重估计的主

七年级上册数学期末考试-试卷分析

七年级数学期末考试试卷分析 一、试卷分析: 从试卷卷面情况来看,考查的知识面较广,类型比较多样灵活,同时紧扣课本、贴近生活。既考查了学生对基础知识把握的程度,又考查了学生的实际应用、计算、思维以及解决问题的能力,不仅顾及了各个层次学生的水平,又有所侧重。这份试题尤其注重对基础知识的检测,以及学生综合运用知识的能力。 二、学生情况分析: 从本次考试成绩来看,相对期中考试有所上升。本班共有学生31人,参加考试31人,优秀人数:,优秀率;及格人数:及格率:;低分人数:低分率:;均分是分,最高分分,最低分分。主要原因是:学生粗心大意,做题不够细心,特别是计算题出错最多。后进生的基础太差,优生的成绩不够理想。 三、各题得分情况分析: 第一题:选择题(共10个小题,每小题3分,共30分)本题得21分以上的同学不多,主要是第7、8、10、12小题,学生失分严重。 第二题:填空题(共5个小题,每小题3分,共15分) 该题14、15小题绝大部分考生能有正确答案,但13、16、17两小题错误者占80%左右。这反映学生对问题缺乏综合分析和判断的能力。特别是第17小题,学生对数学语言意义的理解上存在一定问题。找规律大多数学生理解不了题意,找不到规律,说明平时教学中对数学

观察、理解、分析、建立思维方法培养训练意识仍有缺失。 第三题:解答题 18、20计算题及解方程(共18分)这是学生最好得分的题目,但也是易失分的题,后进生都做的较好,但解方程的第二小题失分率70%。这反映学生对于去分母这一知识掌握的还不够。计算题大多数学生计算能力强,能熟练应用解题技巧进行计算,但仍有少数学生粗心出错。 第19题:(共2个小题,共9分)这一题完成的较差,失分率只有85%,这说明学生在进行多项式加减时仍然忘记带括号和去括号法则的符号变化。 第22题:(共10分)本题考察学生对含有分母的方程(含有参数)的解法,学生在解方程过程中不能明确x,m的关系导致这个题失分严重 第23题:解决实际问题(共2小题,10分)该题得满得4分以上的占30%,0分的占10%,这说明学生的理解力,推理能力,逻辑思维力不强,对问题该如何正确回答理解不清导致丢分。 第24题:(共3小题,12分)该题考察学生对角平分线概念的理解,第(1)小题学生掌握较好,但是(2)(3)题失分严重,主要原因是对未知角度学生不能结合图形很好的转换,不能列出相关角的关系式。 四、改进的措施: 通过前面对试题的分析,在今后的教学中除了要把握好知识体

应用回归分析测试题

一 选择题 1、对于一元线性回归01+(1,2,,)i i i y x i n ββε=+= ,()0i E ε=,2 var()i εσ=, cov(,)0(i j)i j εε=≠,下列说法错误的( BC ) (A) 01ββ,的最小二乘估计01 ??ββ,都是无偏估计; (B) 01ββ,的最小二乘估计01??ββ,对12,,n y y y ,是线性的; (C) 01ββ,的最小二乘估计01 ??ββ,之间是相关的; (D) 若误差服从正态分布,01ββ,的最小二乘估计和极大似然估计是不一样的. 2、下列说法错误的是 ( B ) (A)强影响点不一定是异常值; (B)在多元回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的; (C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关. 3、在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据{(x ,y )},i=1,2,,n i i ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图。 如果根据可行性要求能够作出变量,x,y 具有线性相关结论,则在下列操作中正确的是( D ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4、下列说法中正确的是(B ) A.任何两个变量都具有相关关系 ; B.人的知识与其年龄具有相关关系 ; C .散点图中的各点是分散的没有规律 ; D .根据散点图求得的回归直线方程都是有意义的。 5、下面的各图中,散点图与相关系数r 不符合的是( B )

2018年期末考试试卷分析【精品范文】

2018年期末考试试卷分析 2018年期末考试试卷分析 31.(1)试题分析 (一)试题评价 本题组是31题材料分析题的第(1)问,以初中生小奇一家致富为材料,设问为“结合材料,分析小奇家致富的主要原因是什么?”,分值为2分。本题主要考查国家精准扶贫、乡村振兴发展的知识,答案具有开放性和灵活性,学生可以从国家政策、个人努力、家乡资源三个角度组织语言回答,学生只要答到两个不同角度即可满分,试题难度适中。材料里也透露了部分答案的信息,如“国家加大对贫困地区基础设施的投入”,小奇家乡有自然风景优美,人文历史浓厚,学生通过审查材料也能获得答案信息,所以本题的设计较好地考查了学生的阅读能力,审题能力,分析能力,体现了考试大纲的要求。 (二)得分情况分析 本题总分2分,最高得分2分,最低得分0分,平均分1.5分,得分率75%,总体得分较好。

(三)学生答题常见错误 1、部分学生试卷留空白,或者书写差,字迹潦草看不清。 2、角度不全面,国家政策、个人努力、家乡资源三个角度只回答其中一个角度。 3、没有结合材料审题、答题,写的答案泛泛而谈,假大空,没有结合材料信息谈小奇家致富的主要原因。 (四)错误成因分析 1、考生阅读、理解材料的能力不高,对材料不重视,只看设问不看背景材料,不会从材料中筛选关键词,利用材料透露的信息组织答案,所写答案没有针对性。 2、部分考生语言组织能力不强,表达不完整,只写几个字,马虎应对;或者表达不简洁,直接抄材料不归纳,答案指向性不明,导致写了很多分数也不高。 (五)教学意见和建议

1、提高学生针对材料中的关键词组织答题语言的能力,建议在教学中加强学生审题能力和结合材料分析能力的训练,提高学生多角度、多角度、有针对性答题的能力。 2、针对不同设问,规范答题格式,培养学生材料和考点相结合的答题习惯,避免空谈材料或者长篇大论堆积考点,促使学生养成良好的答题习惯和答题规范。 31(2)小结 一、试题评价 本小题设问为:“如果你是小奇,用哪些理由说服父母选择这套方案?” 主要考查国情部分的核心知识点:“节能”“生态”“智能”,还有心理、道德、法律部分的“个性”“安全”“娱乐”,材料涉及网络、扶贫、乡村振兴、智能家居,范围涉及广泛,综合性强,要求紧扣材料,运用基础知识,具体化,材料化,知识化。

应用回归分析试题套

应用回归分析试题(一) 1、对于一元线性回归y 0i X i i(i 1,2,..., n),E(J 0 , var( J cov( i, j) 0(i j),下列说法错误的是 (A) 0,1的最小一乘估计? '0, ?都是无偏估计; (B) 0,1的最小一乘估计? 0, Q ?对y,y2,... ,y n是线性的; (C) 0,1的最小一乘估计 ? , ?之间是相关的; (D)若误差服从正态分布,0,1的最小二乘估计和极大似然估计是不一样的 2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换.如果误差方差与因变量y的期望成正比,则可通过下列哪种变换将方差常数化 1 (A) - ;(B) “ ;(C) ln( y 1) ;(D) In y. y 、 3、下列说法错误的是 (A) 强影响点不一定是异常值; (B) 在多元回归中,回归系数显着性的t检验与回归方程显着性的F检验是等价的; (C) 一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量; (D) 异常值的识别与特定的模型有关. 4、下面给岀了4个残差图,哪个图形表示误差序列是自相关的 (A) (B) (C) (D) 5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的 (A) (B) (C)(D) 二、填空题(每空2分,共20分)

2 2 1、考虑模型y X ,var( ) I n,其中X : n p,秩为p,0不一定

已知,则 ? ________________ , var ( ?) _________ ,若 服从正态分布,则 2、下表给岀了四变量模型的回归结果: 则残差平方和= ___________ ,总的观察值个数 = ___________ ,回归平方和的自由度 = ________ . 3、已知因变量 y 与自变量X i ,X 2, X 3,X 4,下表给岀了所有可能回归模型的 AIC 值,则最 优子集是 _______________________ . 4、 在诊断自相关现象时,若 DW 0.66,则误差序列的自相关系数 的估计值= _______ ,若 存在自相关现象,常用的处理方法有迭代法、 _____________ 、科克伦-奥克特迭代法. 5、 设因变量y 与自变量X 的观察值分别为 y 「y 2,..., y n 和x 1, x 2 ,..., x n ,则以x *为折点的折 线模型可表示为 ________________________ . 三、(共45分)研究货运总量y (万吨)与工业总产值x 1 (亿元)、农业总产值x 2 (亿元)、 居民非商品支岀X 3 (亿元)的线性回归关系.观察数据及残差值e i 、学生化残差SRE i 、删除 学生化残差SRE (i )、库克距离D i 、杠杆值ch ii 见表 (n P)?2 ___________ ,其中?2是2的无偏估计

相关文档
最新文档