一元线性回归模型习题及答案解析

合集下载

高一数学一元线性回归案例试题

高一数学一元线性回归案例试题

高一数学一元线性回归案例试题1. (2014•重庆一模)某小卖部销售一品牌饮料的零售价x (元/瓶)与销量y (瓶)的关系统计如下:已知x ,y 的关系符合线性回归方程,其中,.当单价为4.2元时,估计该小卖部销售这种品牌饮料的销量为( ) A.20 B.22 C.24 D.26 【答案】D【解析】利用平均数公式计算平均数,,利用b=﹣20求出a ,即可得到回归直线方程,把x=4.2代入回归方程求出y 值. 解:===3.5;==40,∴a=40﹣(﹣20)×3.5=110,∴回归直线方程为:=b +a=﹣20+110, 当=4.2时,=﹣20×4.2+110=26, 故选:D .点评:本题考查回归方程的求法,考查学生的计算能力,运算要细心.2. (2014•新余二模)已知某产品连续4个月的广告费用x i (i=1,2,3,4)千元与销售额y i (i=1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息: ①x 1+x 2+x 3+x 4=18,y 1+y 2+y 3+y 4=14;②广告费用x 和销售额y 之间具有较强的线性相关关系; ③回归直线方程=bx+a 中的b=0.8(用最小二乘法求得); 那么,当广告费用为6千元时,可预测销售额约为( ) A .3.5万元 B .4.7万元 C .4.9万元D .6.5万元【答案】B【解析】求出数据的中心点的坐标,代入回归直线方程求得系数a ,根据广告费用为6千元,求得预报变量y 的值. 解:∵=,=, ∴数据的中心为(,), 则=0.8×+a ,∴a=﹣,当广告费用为6千元时,可预测销售额y=0.8×6﹣0.1=4.7(万元). 故选:B .点评:本题考查了线性回归分析思想,考查了学生的数据处理能力,在回归分析中数据的中心在回归直线上.3. (2014•辽宁模拟)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x (cm )160165170175180)A.70.09kg B.70.12kg C.70.55kg D.71.05kg【答案】B【解析】根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出的值,现在方程是一个确定的方程,根据所给的x的值,代入线性回归方程,预报身高为172cm的高三男生的体重解:由表中数据可得==170,==69∵(,)一定在回归直线方程=0.56x+上故69=0.56×170+解得=﹣26.2故=0.56x﹣26.2当x=172时,=0.56×172﹣26.2="70.12"故选B.点评:本题主要考查线性回归方程的求解与运用,解题的关键是线性回归方程经过样本点的中心同时注意理解线性回归方程中相关系数的意义.4.(2014•郑州模拟)某车间加工零件的数量x与加工时间y的统计数据如表:现已求得上表数据的回归方程中的值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为()A.84分钟B.94分钟C.102分钟D.112分钟【答案】C【解析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a的值,写出线性回归方程.将x=100代入回归直线方程,得y,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数.解:由表中数据得:=20,=30,又值为0.9,故a=30﹣0.9×20=12,∴y=0.9x+12.将x=100代入回归直线方程,得y=0.9×100+12=102(分钟).∴预测加工100个零件需要102分钟.故选C.点评:本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a的值,是一个中档题目.5.(2012•吉安县模拟)已知x,y的取值如表:x1234从散点图分析,y与x线性相关,且回归方程为,则a=()A.﹣0.15B.﹣0.26C.﹣0.35D.﹣0.61【答案】A【解析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出a的值,解:∵,∴这组数据的样本中心点是(2.5,4.5),∵y与x线性相关,且,,∴4.5=1.86×2.5+a,,∴a=﹣0.15,故选A.点评:本题考查线性回归方程的求解和应用,是一个基础题6.(2012•湘潭模拟)一位母亲记录了儿子3~7岁时的身高,并根据记录数据求得身高(单位:cm)与年龄的回归模型为.若用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是()A.身高一定是145cm B.身高在145cm以上C.身高在145cm左右D.身高在145cm以下【答案】C【解析】根据回归模型为,将x=10代入即可得到预测值.解:根据回归模型为,可得x=10时,=145cm故可预测10岁时的身高在145cm左右故选C.点评:本题考查回归模型的运用,解题的关键是理解回归模型的含义,从而合理预测.7.(2011•丰台区二模)已知x,y的取值如下表:从散点图可以看出y与x线性相关,且回归方程为,则a=()【答案】B【解析】本题考查的知识点是线性回归直线的性质,由线性回归直线方程中系数的求法,我们可知在回归直线上,满足回归直线的方程,我们根据已知表中数据计算出,再将点的坐标代入回归直线方程,即可求出对应的a值.解:∵点在回归直线上,计算得,∴回归方程过点(2,4.5)代入得4.5=0.95×2+a∴a=2.6;故选B.点评:本题就是考查回归方程过定点,考查线性回归方程,考查待定系数法求字母系数,是一个基础题8.(2010•沈阳三模)已知两个统计案例如下:①为了探究患慢性支气管炎与吸烟关系,调查了339名50岁以上的人,调查结果如表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析②取平均值B.①独立性检验②回归分析C.①回归分析②独立性检验D.①独立性检验②取平均值【答案】B【解析】本题考查的知识点是回归分析和独立性检验的概念及用法,回归分析主要判断两个定量变量之间的相关关系,而独立性检验主要用来分析两个定性变量(或称分类变量)的关系,由题目可知①中两个变量是定性变量(或称分类变量),②中两个变量是两个定量变量,分析即可得到答案.解:∵①中两个变量是定性变量(或称分类变量),②中两个变量是两个定量变量,∴对这些数据的处理所应用的统计方法是:①独立性检验②回归分析故选B点评:要判断处理数据时应采用的统计方法,关键是要分析数据中两个变量是定性变量还是定量变量,回归分析主要判断两个定量变量之间的相关关系,而独立性检验主要用来分析两个定性变量(或称分类变量)的关系.9.(2005•上海模拟)某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:A.计算机,营销,物流B.机械,计算机,化工C.营销,贸易,建筑D.机械,营销,建筑,化工【答案】B【解析】由于用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,根据表格的数据可以分别求出所有行业的应聘人数与招聘人数比值,然后根据这些比值即可求解.解:依题意得化工行业的应聘人数小于招聘人数,物流的应聘人数小于招聘人数,且比值化工行业大于物流机械的应聘人数大于招聘人数,故选B.点评:本题的考点是回归分析,主要考查了统计表的识别能力,解题的关键是会根据表格找出以后条件解决问题.10.实验测得四组(x,y)的值分别为(1,2),(2,3),(3,4),(4,4),则y与x间的线性回归方程是()A.y=﹣1+x B.y=1+x C.y=1.5+0.7x D.y=1+2x【答案】C【解析】根据所给的四对数据,算出y与x的平均数,把所求的平均数代入求b的公式,算出b 的值,再把它代入求a的式子,求出a的值,写出线性回归方程即可.解:根据题意得:==2.5,==3.25,b==0.7,a=﹣b=3.25﹣0.7×2.5=1.5,∴y与x间的线性回归方程是y=1.5+0.7x.故选:C.点评:本题考查线性回归方程的求法,在一组具有相关关系的变量的数据间,利用最小二乘法做出线性回归方程的系数,再代入样本中心点求出a的值,本题是一个基础题.。

南财计量经济学答案第二章 一元线性回归模型

南财计量经济学答案第二章 一元线性回归模型

五、计算分析题 1.解:(1)收入、年龄、家庭状况、政府的相关政 策等也是影响生育率的重要的因素,在上述简单 回归模型中,它们被包含在了随机扰动项之中。 有些因素可能与受教育水平相关,如收入水平与 教育水平往往呈正相关、年龄大小与教育水平呈 负相关等。 (2)当归结在随机扰动项中的重要影响因素与模 型中的教育水平educ相关时,上述回归模型不能 够揭示教育对生育率在其他条件不变下的影响, 因为这时出现解释变量与随机扰动项相关的情形, 基本假设3不满足。
ˆ ei2 回归估计的标准误差:
(n 2) 58.3539 (12 2) 2.4157
(3) 对进行显著水平为5%的显著性检验
t
*
^
ˆ 2 2
^
ˆ) SE ( 2
ˆ

ˆ 2
ˆ) SE ( 2

^
~ t (n 2)
ˆ ) SE ( 2
4、解: (1)这是一个横截面序列回归。 (2)截距2.6911表示咖啡零售价为每磅0美元时, 每天每人平均消费量为2.6911杯,这个数字没有 经济意义;斜率-0.4795表示咖啡零售价与消费量 负相关,价格上升1美元/杯,则平均每天每人消 费量减少0.4795杯; (3)不能; (4)不能;在同一条需求曲线上不同点的价格弹性 不同,若要求出,须给出具体的值及与之对应的 值。
2 i

334229.09 0.7863 425053.73
ˆ Y ˆ X 549.8 0.7863 647.88 66.2872 1 2
ˆ 66.2872 0.7863 X 估计结果为: Y i i 说明该百货公司销售收入每增加1元,平均说来销售成本将增 加0.7863元。 (2)计算可决系数和回归估计的标准误差 2 ˆ x )2 ˆ 2 x2 ˆ y ( i 可决系数为:R 2 i 2 i 2

计量经济学第三版课后习题答案第二章 经典单方程计量经济学模型:一元线性回归模型

计量经济学第三版课后习题答案第二章  经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。

首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。

总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。

同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。

统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。

后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。

其一,若干基本假设。

样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。

其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。

Goss-markov定理表明OLS估计量是最佳线性无偏估计量。

其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。

生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

一元线性回归模型(习题与解答)

一元线性回归模型(习题与解答)

β1 X i + u i ,试证明
Var ( β 1 ) =
2-7. 试证明: (1) (2) (3)

∑X
σ u2
2 i
∑e
i
= 0 ,从而: e = 0
i
∑e x
i
=0
∑e Y
i
∧ i
= 0 ;即残差 ei 与 Yi 的估计值之积的和为零。
2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证
10) 最小平方法
2-2.判断正误并说明理由: 1) 2) 3) 4) 5) 随机误差项 ui 和残差项 ei 是一回事 总体回归函数给出了对应于每一个自变量的因变量的值 线性回归模型意味着变量是线性的 在线性回归模型中,解释变量是原因,被解释变量是结果 随机变量的条件均值与非条件均值是一回事
2-3.回答下列问题: 1) 2) 3) 4) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 总体方差与参数估计误差的区别与联系。 随机误差项 ui 和残差项 ei 的区别与联系。 根据最小二乘原理, 所估计的模型已经使得拟合误差达到最小, 为什么还要讨论模型的
其中带“^”者表示“估计值” 。
2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正 的、负的、还是无法确定?并说明理由。
因变量 GNP 个人储蓄 小麦产出 美国国防开支 棒球明星本垒打的次数 总统声誉 学生计量经济学成绩 日本汽车的进口量 利率 利率 降雨量 前苏联国防开支 其年薪 任职时间 其统计学成绩 美国人均国民收入 自变量
3
或债券的收益率;rm 表示有价证券的收益率(用市场指数表示,如标准普尔 500 指数) ;t 表示时间。在投资分析中,β1 被称为债券的安全系数β,是用来度量市场的风险程度的, 即市场的发展对公司的财产有何影响。依据 1956~1976 年间 240 个月的数据,Fogler 和 Ganpathy 得到 IBM 股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

一元线性回归模型典型例题分析

一元线性回归模型典型例题分析

第二章 一元线性回归模型典型例题分析例1、令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。

生育率对教育年数的简单回归模型为μββ++=educ kids 10(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。

随机扰动项μ的分布未知,其他所有假设都满足。

如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?例3.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号内为标准差:)011.0()105.151(067.0105.384ˆtt Y S +==0.538 023.199ˆ=σ (1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗? (4)检验统计值?例4.下列方程哪些是正确的?哪些是错误的?为什么?⑴ y xt n t t=+=αβ12,,, ⑵ yx t n t tt=++=αβμ12,,, ⑶ y x t n t t t=++= ,,,αβμ12⑷ ,,,y x t n t t t =++=αβμ12 ⑸ y x t n t t =+= ,,,αβ12 ⑹ ,,,y x t n t t=+=αβ12 ⑺ y x t n t t t =++= ,,,αβμ12 ⑻ ,,,y x t n t t t=++=αβμ12 其中带“^”者表示“估计值”。

例5.对于过原点回归模型i i i u X Y +=1β ,试证明∑=∧221)(iu X Var σβ例6、对没有截距项的一元回归模型i i i X Y μβ+=1称之为过原点回归(regression through the origin )。

一元线性回归模型习题及答案

一元线性回归模型习题及答案

一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

B A ii ˆˆ0Y Y 0σ∑=时,(-)=B 2ii ˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

DA ()()()i i 12i X X Y -Y ˆX X β--∑∑= B ()i i i i 122i i n X Y -X Y ˆn X -X β∑∑∑∑∑=C i i 122iX Y -nXY ˆX -nX β∑∑= D i i i i12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

计量经济学:一元线性回归模型习题与答案

一、单选题1、假设检验采用的逻辑推理方法是A.归纳推理法B.类比推理法C.反证法D.演绎推理法正确答案:C2、在Eviews软件操作中,预测是用()命令。

A.GENERATEB.PLOTC.FORECASTD.SCAT正确答案:C3、对任意两个随机变量X和Y,若EXY=EX*EY,则()A.X和Y不独立B.X和Y相互独立C.Var(XY)=VarX*VarYD.Var(X+Y)=VarX+VarY正确答案:D4、设随机变量X1,X2,...,Xn(n>1)独立同分布,且方差σ2>0。

令随机变量Y=1n ∑X ini=1,则()A.Var(X1+Y)=n+2nσ2B.Cov(X1,Y)=1nσ2C. Var(X1−Y)=n+2nσ2D. Cov(X1,Y)=σ2正确答案:B5、设随机变量X~t(n)(n>1),Y=1X,则A. Y~F(1,n)B. Y~F(n,1)C. Y~χ2(n−1)D. Y~χ2(b)正确答案:B二、多选题1、变量的显著性T检验的步骤有哪些?A.以原假设H0构造T统计量B.对总体参数提出假设C.给定显著性水平α,查t分布表得临界值tα/2(n-2)D.比较t统计量和临界值正确答案:A、B、C、D2、随机误差项的主要影响因素是A.变量观测值的观测误差的影响B.在解释变量中被忽略的因素的影响C.都不是D.模型关系的设定误差的影响正确答案:A、B、D3、下列中属于最小二乘法基本假设的有A.解释变量X是确定性变量,不是随机变量B.m服从零均值、同方差、零协方差的正态分布:μi~N(0,σμ2) i=1,2, …,nC.随机误差项μ与解释变量X之间不相关:Cov(Xi,μi)=0i=1,2, …,nD.随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。

正确答案:A、B、C、D4、最小二乘估计量的性质A.有效性B.无偏性C.一致性D.线性性正确答案:A、B、D5、缩小置信区间的途径有哪些A.增大样本容量B.降低模型的拟合优度C.提高模型的拟合优度D.减小样本容量正确答案:A、C三、判断题1、可以通过散点图来确定模型的形式。

统计学一元线性回归课后习题答案分析

运送时间y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。
运送时间(天)
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态
(4)计算判定系数,并解释其意义。
= 81444968.68 =0.9963 81750763.71
人均GDP对人均消费的影响达到99.6%。
(5)检验回归方程线性关系的显著性(a=0.05)。
提出假设
H0:1=0 人均消费水平与人均GDP之间的
线性关系不显著 计算检验统计量F
F SSR 1 81444968.68 1 1331.6921 SSE (n 2) 305795.03 (7 2)

次数
1
81.1
21
2
76.6
58
3
76.6
85
4
75.7
68
5
73.8
74
6
72.2
93
7
71.2
72
8
70.8
122
9
91.4
18
10
68.5
125
1)绘制散点图,说明二者之间的股息形态
顾客投诉次数
140 120 100
80 60 40 20
0 0
20
40
60
航班正点率
二者之间为负的线性相关关系
1580.46315 E( y0 ) 2975.74999
人均GDP为5 000元时,人均消费水平95%的预 测区间为[1580.46315,2975.74999]。

高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)

8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。

一元线性回归模型

第三章一、练习题 (一)简答题1、对随机项i ε作了哪些假定?这些假定为什么是必要的?2、简要说明显著性检验的意义和过程?3、已知回归模型μβα++=x y ,式中一为某类公司一名员工的年收入(元),x 为工作时间(年)。

随机扰动项μ的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释α和β。

(2)OLS 估计量αˆ和βˆ满足线性性、无偏性及有效性吗?简单陈述理由。

(3)对参数的假设检验还能进行吗?简单陈述理由。

4、为什么用决定系数R 2评价拟合优度,而不用残差平方和作为评价标准?5、可决系数2R 说明了什么?在简单线性回归中它与斜率系数的t 检验的关系是什么?6、有n 组观测值(X i ,Y i )i=1,2,…,n ,用最小二乘法将Y 对X 回归得X Y 21ˆˆˆαα+=,将X 对Y 回归得Y X 21ˆˆˆββ+=,这两条直线是否一致?在什么条件下一致?(二)计算题1、下表1989-2003年我国的财政收入y (亿元)与国民生产总值x (亿元)的统计资料:2003 116603.2资料来源:《中国统计年鉴2004》,中国统计出版社(1)做出散点图,建立财政收入随GDP 变化的一元线性回归模型,并解释斜率系数的经济意义;(2)对所建立的回归模型进行检验;(3)若2004年的GDP 为25000亿元,计算2004年财政收入的预测值。

2、下表是1989-2003年我国的城镇居民家庭人均可支配收入(元)x 与城市人均住宅建筑面积(平方米)y 的统计资料:资料来源:《中国统计年鉴2004》,中国统计出版社(1)做出散点图,建立城市人均住宅建筑面积随城镇居民家庭人均可支配收入的一元线性回归模型,并解释斜率系数的经济意义; (2)对所建立的回归模型进行检验;(3)若2004年的城镇居民家庭人均可支配收入为9000元,计算2004年的城市人均住宅建筑面积预测值。

3、对于模型:n i x y i i i ,,1 =++=εβα从10个观测值中计算出;20,200,26,40,822=====∑∑∑∑∑i i i i i iy x x y x y,请回答以下问题:(1)求出模型中α和β的OLS 估计量;(2)当10=x 时,计算y 的预测值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

BA i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

DA ()()()ii12i X X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii 122iX Y -nXY ˆX -nXβ∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i i ˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

DA ˆ0r=1σ=时, B ˆ0r=-1σ=时, C ˆ0r=0σ=时, D ˆ0r=1r=-1σ=时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为ˆY356 1.5X -=,这说明__________。

DA 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少元10、在总体回归直线01ˆE Y X ββ+()=中,1β表示__________。

B A 当X 增加一个单位时,Y 增加1β个单位 B 当X 增加一个单位时,Y 平均增加1β个单位 C 当Y 增加一个单位时,X 增加1β个单位 D 当Y 增加一个单位时,X 平均增加1β个单位11、对回归模型i 01i i Y X u ββ+=+进行检验时,通常假定i u 服从__________。

CA 2i N 0) σ(, B t(n-2) C 2N 0)σ(, D t(n)12、以Y 表示实际观测值,ˆY表示回归估计值,则普通最小二乘法估计参数的准则是使__________。

Di i 2i i i i 2i i ˆA Y Y 0ˆB Y Y 0ˆC Y Y ˆD Y Y ∑∑∑∑ (-)= (-)= (-)=最小 (-)=最小13、设Y 表示实际观测值,ˆY表示OLS 估计回归值,则下列哪项成立__________。

D ˆˆA YY B Y Y ˆˆC YY D Y Y = = = =14、用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点_________。

DˆA X Y B X YˆC X Y D X Y (,) (,) (,) (,)15、以Y 表示实际观测值,ˆY表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01iˆˆˆY X ββ+=满足__________。

A ii2i i 2i i 2i i ˆA Y Y 0B Y Y 0ˆC Y Y 0ˆD Y Y 0∑∑∑∑ (-)= (-)= (-)= (-)=16、用一组有30个观测值的样本估计模型i 01i i Y X u ββ+=+,在的显着性水平下对1β的显着性作t 检验,则1β显着地不等于零的条件是其统计量t 大于__________。

D A (30) B (30) C (28) D (28) 17、已知某一直线回归方程的判定系数为,则解释变量与被解释变量间的线性相关系数为__________。

BA B C D18、相关系数r 的取值范围是__________。

DA r ≤-1B r ≥1C 0≤r ≤1D -1≤r ≤119、判定系数R 2的取值范围是__________。

CA R2≤-1B R2≥1C 0≤R2≤1D -1≤R2≤120、某一特定的X 水平上,总体Y 分布的离散度越大,即σ2越大,则__________。

A A 预测区间越宽,精度越低 B 预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D 预测区间越窄,预测误差越大 22、如果X 和Y 在统计上独立,则相关系数等于__________。

C A 1 B -1 C 0 D ∞23、根据决定系数R 2与F 统计量的关系可知,当R 2=1时,有__________。

D A F =1 B F =-1 C F =0 D F =∞24、在C —D 生产函数βαK AL Y =中,__________。

A A.α和β是弹性 和α是弹性 和β是弹性 是弹性25、回归模型i i i u X Y ++=10ββ中,关于检验010=β:H 所用的统计量)ˆ(ˆ111βββVar -,下列说法正确的是__________。

DA 服从)(22-n χ B 服从)(1-n t C 服从)(12-n χ D 服从)(2-n t26、在二元线性回归模型i i i i u X X Y +++=22110βββ中,1β表示__________。

A A 当X2不变时,X1每变动一个单位Y 的平均变动。

B 当X1不变时,X2每变动一个单位Y 的平均变动。

C 当X1和X2都保持不变时,Y 的平均变动。

D 当X1和X2都变动一个单位时,Y 的平均变动。

27、在双对数模型i i i u X Y ++=ln ln ln 10ββ中,1β的含义是__________。

D A Y 关于X 的增长量 B Y 关于X 的增长速度 C Y 关于X 的边际倾向 D Y 关于X 的弹性26、根据样本资料已估计得出人均消费支出Y 对人均收入X 的回归模型为i i X Y ln 75.000.2ln +=,这表明人均收入每增加1%,人均消费支出将增加__________。

CA 2%B %C %D %28、按经典假设,线性回归模型中的解释变量应是非随机变量,且__________。

A A 与随机误差项不相关 B 与残差项不相关 C 与被解释变量不相关 D 与回归值不相关29、根据判定系数R 2与F 统计量的关系可知,当R 2=1时有__________。

C =1 =-1 =∞ =0 30、下面说法正确的是__________。

DA.内生变量是非随机变量B.前定变量是随机变量C.外生变量是随机变量D.外生变量是非随机变量31、在具体的模型中,被认为是具有一定概率分布的随机变量是__________。

A A.内生变量 B.外生变量 C.虚拟变量 D.前定变量 32、回归分析中定义的__________。

B A.解释变量和被解释变量都是随机变量B.解释变量为非随机变量,被解释变量为随机变量C.解释变量和被解释变量都为非随机变量D.解释变量为随机变量,被解释变量为非随机变量33、计量经济模型中的被解释变量一定是__________。

C A .控制变量 B .政策变量 C .内生变量 D .外生变量二、多项选择题1、指出下列哪些现象是相关关系__________。

ACDA 家庭消费支出与收入B 商品销售额与销售量、销售价格C 物价水平与商品需求量D 小麦高产与施肥量E 学习成绩总分与各门课程分数2、一元线性回归模型i 01i i Y X u ββ+=+的经典假设包括__________。

ABCDEA ()0t E u =B 2var()t u σ=C cov(,)0t s u u =D (,)0t t Cov x u =E 2~(0,)t u N σ3、以Y 表示实际观测值,ˆY表示OLS 估计回归值,e 表示残差,则回归直线满足__________。

ABEii2i i 2i i i i A X Y ˆB Y YˆC Y Y 0ˆD Y Y 0E cov(X ,e )=0∑∑∑∑ 通过样本均值点(,) = (-)= (-)= 4、ˆY表示OLS 估计回归值,u 表示随机误差项,e 表示残差。

如果Y 与X 为线性相关关系,则下列哪些是正确的__________。

ACi 01ii1ii 01i i i1iii 01i A E Y X ˆˆB Y X ˆˆC Y X e ˆˆˆD YX e ˆˆE E(Y )X ββββββββββ+++++++ ()= = ===5、ˆY表示OLS 估计回归值,u 表示随机误差项。

如果Y 与X 为线性相关关系,则下列哪些是正确的__________。

BEi 01i i 01i ii1iii 01i i i1iA Y XB Y X u ˆˆC Y X u ˆˆˆD Y X u ˆˆˆE YX ββββββββββ+++++++ = =+ ===6、回归分析中估计回归参数的方法主要有__________。

CDE A 相关系数法 B 方差分析法 C 最小二乘估计法 D 极大似然法 E 矩估计法7、用OLS 法估计模型i 01i i Y X u ββ+=+的参数,要使参数估计量为最佳线性无偏估计量,则要求__________。

ABCDEA i E(u )=0B 2i Var(u )=σC i j Cov(u ,u )=0D i u 服从正态分布E X 为非随机变量,与随机误差项i u 不相关。

8、假设线性回归模型满足全部基本假设,则其参数的估计量具备__________。

CDE A 可靠性 B 合理性 C 线性 D 无偏性 E 有效性9、普通最小二乘估计的直线具有以下特性__________。

ABDE A 通过样本均值点(,)X YBˆii Y Y =∑∑C 2ˆ()0iiY Y-=∑ D 0ie =∑E (,)0i i Cov X e =10、由回归直线i 01iˆˆˆY X ββ+=估计出来的i ˆY 值__________。

相关文档
最新文档