(完整版)线性回归方程——非线性方程转化为线性方程

合集下载

(整理版)非线性回归问题

非线性回归问题两个变量不呈线性关系，不能直接利用线性回归方程建立两个变量的关系，可以通过变换的方法转化为线性回归模型。

分析非线性回归问题的具体做法是：〔1〕假设问题中已给出经验公式，这时可以将变量x 进行置换〔换元〕，将变量的非线性关系转化为线性关系，将问题化为线性回归分析问题来解决．〔2〕假设问题中没有给出经验公式，需要我们画出数据的散点图，通过与各种函数〔如指数函数、对数函数、幂函数等〕的图象作比拟，选择一种与这些散点拟合得最好的函数，然后采用适当的变量置换，将问题化为线性回归分析问题来解决．下面举例说明非线性回归分析问题的解法．例1 在彩色显影中，由经验可知：形成染料光学密度y 与析出银的光学密度x 由公式e b xy A =〔b <0〕表示，现测得实验数据如下：试求对的回归方程．分析：该例是一个非线性回归分析问题，由于题目中已给定了要求的曲线为eb xy A =〔b <0〕类型，我们只要通过所给的11对样本数据求出A 和b ，即可确定x 与y 的相关关系的曲线方程．解：由题意可知，对于给定的公式e bxy A =〔b <0〕两边取自然对数，得ln ln b y A x=+．与线性回归方程对照可以看出，只要取1u x=，ln v y =，ln a A =，就有v a bu =+，这是v 对u 的线性回归直线方程，对此我们再套用相关性检验，求回归系数b 和a ．题目中所给数据由变量置换1u =，ln v y =变为如表所示的数据：由于｜r ｜=0.998>0.602，可知u 与v 具有很强的线性相关关系．再求得0.146b =-，0.548a =，∴v =0.5480.146u -，把u 和v 置换回来可得0.146ln 0.548y x=-， ∴0.1460.1460.1460.5480.548e1.73xxxy eee---===，∴回归曲线方程为0.1461.73exy -=．点评：解决此题的思路是通过适当的变量置换把非线性回归方程转化为线性回归方程，然后再套用线性回归分析的解题步骤．例2 为了研究某种细菌随时间x 变化的繁殖个数，收集数据如下：天数x 1 2 3 4 5 6 繁殖个数y612254995190〔1〕作出这些数据的散点图；〔2〕求出y 对x 的回归方程．解析：〔1〕作出散点图如图1所示．〔2〕由散点图看出样本点分布在一条指数型曲线e bxy c =〔c ＞0〕的周围，那么ln ln y bx c =+．令ln ln z y a c ==，，那么z bx a =+．x1 2 3 4 5 6 z相应的散点图如图2．从图2可以看出，变换后的样本点分布在一条直线附近，因此可以用线性回归方程来拟合．由表中数据得到线性回归方程为0.69 1.115z x =+．因此细菌的繁殖个数对温度的非线性回归方程为0.69 1.115e x y +=．点评：通过作散点图看出，此题是一个非线性回归问题，通过变量置换转化为线性回归问题求解的．值得注意的是，此题的数据与回归曲线是拟合得相当好的，这说明确定性关系〔如公式、函数关系式〕和相关关系之间并没有一条不可逾越的鸿沟．由于有实验误差、测量误差等存在，变量之间确实定性关系往往通过相关关系表现出来；反过来，在有些问题中，可以研究相关关系来深入了解变量变化的内在规律，从而找到它们确实定性关系．。

非线性回归分析常见曲线及方程

非线性回归分析常见曲线及方程Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】非线性回归分析回归分析中，当研究的因果关系只涉及和一个时，叫做一元回归分析；当研究的因果关系涉及因变量和两个或两个以上自变量时，叫做多元回归分析。

此外，回归分析中，又依据描述自变量与因变量之间因果关系的表达式是线性的还是非线性的，分为线性回归分析和非线性回归分析。

通常线性回归分析法是最基本的分析方法，遇到非线性回归问题可以借助数学手段化为线性回归问题处理两个现象变量之间的相关关系并非线性关系，而呈现某种非线性的曲线关系，如：双曲线、二次曲线、三次曲线、幂函数曲线、指数函数曲线(Gompertz)、S型曲线(Logistic) 对数曲线、指数曲线等，以这些变量之间的曲线相关关系，拟合相应的回归曲线，建立非线性回归方程，进行回归分析称为非线性回归分析常见非线性规划曲线1.双曲线1bay x =+2.二次曲线3.三次曲线4.幂函数曲线5.指数函数曲线(Gompertz)6.倒指数曲线y=a/e b x其中a>0，7.S型曲线(Logistic)1e x ya b-=+8.对数曲线y=a+b log x,x>09.指数曲线y=a e bx其中参数a>01．回归：（1）确定回归系数的命令[beta，r，J]=nlinfit（x,y,’model’,beta0）（2）非线性回归命令：nlintool（x，y，’model’, beta0，alpha）2．预测和预测误差估计：[Y，DELTA]=nlpredci（’model’, x，beta，r，J）求nlinfit 或lintool所得的回归函数在x处的预测值Y及预测值的显着性水平为1-alpha的置信区间Y，DELTA.例2 观测物体降落的距离s与时间t的关系，得到数据如下表，求s关于t的回归方程2ˆct=.+btas+解：1. 对将要拟合的非线性模型y=a/e b x，建立M文件如下：function yhat=volum(beta,x)yhat=beta(1)*exp(beta(2)./x);2．输入数据：x=2:16;y=[ 10];beta0=[8 2]';3．求回归系数：[beta,r ,J]=nlinfit(x',y','volum',beta0)； beta即得回归模型为：1.064111.6036e x y-=4．预测及作图：[YY,delta]=nlpredci('volum',x',beta,r ,J)； plot(x,y,'k+',x,YY,'r')2．非线性函数的线性化曲线方程曲线图形变换公式变换后的线性函数by ax＝ln ln ln c a v x u y＝＝＝ u c bv +＝bx y ae ＝ln ln c a u y＝＝u c bv +＝b xe y a＝1ln ln x c a v u y=＝＝u c bv +＝ln y a b x +＝ln v x u y＝＝ u bv +＝a。

(完整版)多元线性回归模型习题及答案

多元线性回归模型一、单项选择题1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中，计算得多重决定系数为0.8500，则调整后的多重决定系数为（ D ）A. 0.8603B. 0.8389C. 0.8655D.0.8327 2.下列样本模型中，哪一个模型通常是无效的（B ） A.iC （消费）=500+0.8iI （收入）B. di Q （商品需求）=10+0.8i I （收入）+0.9i P （价格） C. si Q （商品供给）=20+0.75i P （价格）D. iY （产出量）=0.650.6i L （劳动）0.4i K （资本）3.用一组有30个观测值的样本估计模型01122t t t ty b b x b x u =+++后，在0.05的显著性水平上对1b 的显著性作t 检验，则1b 显著地不等于零的条件是其统计量t 大于等于（ C ）A.)30(05.0t B.)28(025.0t C.)27(025.0t D.)28,1(025.0F4.模型tt t u x b b y ++=ln ln ln 10中，1b 的实际含义是（ B ）A.x 关于y 的弹性B. y 关于x 的弹性C. x 关于y 的边际倾向D. y 关于x 的边际倾向5、在多元线性回归模型中，若某个解释变量对其余解释变量的判定系数接近于１，则表明模型中存在（ C ）A.异方差性B.序列相关C.多重共线性D.高拟合优度6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中，检验0:0(0,1,2,...)t H b i k ==时，所用的统计量服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)7. 调整的判定系数与多重判定系数之间有如下关系( D )A.2211n R R n k -=-- B. 22111n R R n k -=---C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=----8．关于经济计量模型进行预测出现误差的原因，正确的说法是（ C ）。

（整理）计量经济学第四章非线性回归模型的线性化

（整理）计量经济学第四章⾮线性回归模型的线性化第四章⾮线性回归模型的线性化以上介绍了线性回归模型。

但有时候变量之间的关系是⾮线性的。

例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述⾮线性回归模型是⽆法⽤最⼩⼆乘法估计参数的。

可采⽤⾮线性⽅法进⾏估计。

估计过程⾮常复杂和困难，在20世纪40年代之前⼏乎不可能实现。

计算机的出现⼤⼤⽅便了⾮线性回归模型的估计。

专⽤软件使这种计算变得⾮常容易。

但本章不是介绍这类模型的估计。

另外还有⼀类⾮线性回归模型。

其形式是⾮线性的，但可以通过适当的变换，转化为线性模型，然后利⽤线性回归模型的估计与检验⽅法进⾏处理。

称此类模型为可线性化的⾮线性模型。

下⾯介绍⼏种典型的可以线性化的⾮线性模型。

4.1 可线性化的模型⑴指数函数模型y t = t t ubx ae + (4.1)b >0 和b <0两种情形的图形分别见图4.1和4.2。

显然x t 和y t 的关系是⾮线性的。

对上式等号两侧同取⾃然对数，得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。

其中u t 表⽰随机误差项。

010203040501234XY 1图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =t+, (b < 0)⑵对数函数模型y t = a + b Ln x t+ u t(4.4)b>0和b<0两种情形的图形分别见图4.3和4.4。

x t和y t的关系是⾮线性的。

令x t* = Lnx t, 则y t = a + b x t* + u t(4.5)变量y t和x t* 已变换成为线性关系。

图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶幂函数模型y t= a x t b t u e(4.6) b取不同值的图形分别见图4.5和4.6。

线性回归方程公式

线性回归方程公式线性回归是一种常见的统计学方法，用于建立一个预测目标变量与一个或多个自变量之间的线性关系模型。

它是一种广泛应用的回归方法，适用于各种领域，如经济学、金融学、社会学、生物学和工程学等。

线性回归模型可以表示为以下形式：Y = b0 + b1*X1 + b2*X2+ ... + bp*Xp，其中Y是目标变量，X1、X2、...、Xp是自变量，b0、b1、b2、...、bp是回归系数。

这个方程描述了目标变量Y与自变量X之间的线性关系，通过调整回归系数的值可以拟合数据并预测未知数据的值。

线性回归模型的目标是找到最佳拟合直线，使得预测值与实际观测值之间的误差最小化。

常用的误差衡量指标是残差平方和（RSS），也可以使用其他指标如平均绝对误差（MAE）和均方根误差（RMSE）。

线性回归模型的建立过程包括两个主要步骤：参数估计和模型评估。

参数估计是通过最小化误差来确定回归系数的值。

最常用的方法是最小二乘法，通过最小化残差平方和来估计回归系数。

模型评估是用来评估模型的拟合优度和预测能力，常用的指标包括决定系数（R^2）、调整决定系数（Adjusted R^2）和F统计量。

线性回归模型的假设包括线性关系、误差项的独立性、误差项的方差恒定以及误差项服从正态分布。

如果这些假设不成立，可能会导致模型的拟合效果不佳或不可靠的预测结果。

对于线性回归模型的建立，首先需要收集相关的数据，然后进行数据的处理和变量选择。

数据处理包括缺失值处理、异常值处理和变量转换等。

变量选择是通过统计方法或经验判断来选择对目标变量有影响的自变量。

常见的变量选择方法包括逐步回归、岭回归和lasso回归等。

在建立模型之后，需要对模型进行评估和验证。

评估模型的拟合优度是通过决定系数和F统计量来实现的，较高的决定系数和较小的F统计量表明模型的拟合效果较好。

验证模型的预测能力可以使用交叉验证等方法。

线性回归模型还有一些扩展形式，如多项式回归、加权回归和广义线性回归等。

高一数学必修三课件第章线性回归方程

01
02
03
变量
在某一过程中可以取不同数值的量。
自变量
能够影响其它变量，而又不受其它变量影响的变量。
因变量
依赖于其它变量，而又不能影响其它变量的变量。
散点图及其特点
散点图
用点的密度和变化趋势表示两指标之间的直线和曲线关系的图。
特点
能直观表现出影响因素和预测对象之间的总体关系趋势。
线性回归方程定义
通过绘制自变量和因变量的散点图，观察数据点分布形态，若呈现非线性形态，则可能存在非线性关系。
曲线拟合
根据散点图形态，选择合适的曲线类型进行拟合，如二次曲线、指数曲线、对数曲线等。
3
变换自变量或因变量
通过对自变量或因变量进行变换，如取对数、平方、开方等，将非线性关系转化为线性关系。
可化为线性关系非线性模型
一致性
随着样本量的增加，线性回归方程的系数估计值会逐渐接近真实值。
预测值与置信区间估计
预测值
根据回归方程和给定的自变量值，可以计算出因变量的预测值。
置信区间
通过构造置信区间，可以对预测值进行区间估计，表示预测值的可靠程度。
置信水平
置信水平表示了置信区间包含真实值的概率，常用的置信水平有95%和99% 。
在数据采集过程中，可能存在某些自变量被重复测量或高度相关的情况。
变量设计问题
样本量问题
在变量设计时，可能存在某些自变量之间存在固有的高度相关性。
当样本量较小而自变量较多时，也容易出现多重共线性问题。
识别和处理多重共线性方法
观察自变量间的相关系数
如果两个自变量间的相关系数很高，则可能存在多重共线性。
案例二

11线性回归方程的求法

根据最小二乘法估计a 和 b就是未知参数a和b的最好估计，
i xi 1 2 y i x i2
2 ， x i i=1 n
x
， y
， xi yi
i=1
n
.
例1 从某大学中随机选取8名女大学生，其身高和体重数据如表1-1所示。
1 编号身高/cm 165 体重/kg 48
2 3 4 5 6 7 8 165 157 170 175 165 155 170 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程，并预报一名身高为 ( x, y)称为 172cm的女大学生的体重。
n
样本点的中心根据最小二乘法估计a 和 b就是未知参数 a和b的最好估计，
例1 从某大学中随机选取8名女大学生，其身高和体重数据如表1-1所示。
1 编号身高/cm 165 体重/kg 48
2 3 4 5 6 7 8 165 157 170 175 165 155 170 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程，并预报一名身高为 172cm的女大学生的体重。
施化肥量x 15
20
25
30
35
40
45
水稻产量y 330 345 365 y
500 450 400 350 300 10
405 445
450 455
散点图
水稻产量
··
20
·
·
· · ·
施化肥量
30 40 50
x
探索2：在这些点附近可画直线不止一条，哪条直线最能代表x与y之间的关系呢？发现：图中各点，大致分布在某条直线附近。

第23讲非线性回归方程(解析版)

第23讲非线性回归方程一、必备秘籍当经验回归方程并非形如y bx a =+(,a b R ∈）时，称之为非线性经验回归方程，当两个变量不呈线性相关关系时，依据样本点的分布选择合适的曲线方程来模拟，常见的非线性经验回归方程的转换方式总结如下：1.确定研究对象，明确哪个是解释变量，哪个是响应变量；2.由经验确定非线性经验回归方程的模型；3.通过变换（一般题目都有明显的暗示如何换元，换元成什么变量），将非线性经验回归模型转化为线性经验回归模型（特别注意：使用线性回归方程的公式，注意代入变换后的变量）；4.按照公式计算经验回归方程中的参数，得到经验回归方程；5.消去新元，得到非线性经验回归方程；6.得出结果后分析残差图是否有异常．二、例题讲解1．（2021·全国高三专题练习（文））人类已经进入大数据时代.目前，数据量级已经从TB (1TB =1024GB )级别跃升到PB (1PB =1024TB )，EB (1EB =1024PB )乃至ZB (1ZB =1024EB )级别.国际数据公司(IDC )研究结果表明，2008年全球产生的数据量为0.49ZB ，2009年数据量为0.8ZB ，2010年增长到1.2ZB ，2011年数据量更是高达1.82ZB .下表是国际数据公司(IDC )研究的全球近6年每年产生的数据量(单位：ZB )及相关统计量的值：表中ln i i z y =，16i i z z ==∑.（1）根据上表数据信息判断，方程21c xy c e =⋅(e 是自然对数的底数)更适宜作为该公司统计的年数据量y 关于年份序号x 的回归方程类型，试求此回归方程(2c 精确到0.01).（2）有人预计2021年全世界产生的数据规模将超过2011年的50倍.根据（1）中的回归方程，说明这种判断是否准确，并说明理由.参考数据： 4.5695.58e ≈， 4.5897.51e ≈，回归方程y a bx =+中，斜率最小二乘法公式为()()()1122211n niii ii i nniij i x x y y x y nxyb x x xnx====---==--∑∑∑∑，a y bx =-.【答案】（1） 1.520.38x y e +=；（2）见解析. 【分析】（1）设ln z y =，则12ln z c c x =+，再根据参考数据及公式即可得解（2）先将8x =代入得预计2021年数据量，进而和2011年的50倍比较大小即可得解【详解】（1）由21c xy c e =⋅，两边同时取自然对数得()2112ln ln ln c x y c e c c x =⋅=+，设ln z y =，则12ln z c c x =+. 因为 3.5x =， 2.85z =，()62117.58i i x x=-=∑，()()616.7.i i i x x z z =--=∑，所以()()()12216.730.3817.58niii nij x x z z c x x ==--==≈-∑∑，12ln 2.850.38 3.5 1.52c z c x =-=-⨯=.所以 1.520.38ln z x y =+=，所以 1.520.38x y e +=；（2）令8x =，得 1.520.388 4.56ˆ95.58 1.825091ye e +⨯==≈>⨯=. 预计2021年全世界产生的数据规模会超过2011年的50倍. 【点睛】关键点点睛：对于非线性回归方程的求解，一般要结合题意作变换，转化为线性回归方程来求解，同时也要注意相应数据的变化.((11ii nj x b ===∑∑再直接选择数据，字母x 没有((11n ii nj x b ===∑∑参考数据总选择需要的数据代入计算。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

线性回归方程——非线性方程转化为线性方程例1．(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费，需了解年宣传费x （单位：千元）对年销售量y （单位：t ）和年利润z （单位：千元）的影响，对近8年的宣传费x i 和年销售量y i (i =1,2,⋯,8)数据作了初步处理，得到下面的散点图及一些统计量的值.x̅ y ̅ w ̅46.6 563 6.8289.81.61469108.8表中w i =√x i ，w ̅ =18 ∑w i 8i=1，，I ）根据散点图判断，y =a +bx 与y =c +d √x ，哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型（给出判断即可，不必说明理由）；，II ）根据（I ）的判断结果及表中数据，建立y 关于x 的回归方程；（III ）已知这种产品的年利润z 与x ，y 的关系为z =0.2y −x ，根据（II ）的结果回答下列问题：（i ）年宣传费x =49时，年销售量及年利润的预报值是多少？（ii ）年宣传费x 为何值时，年利润的预报值最大？附：对于一组数据(u 1,v 1) (u 2,v 2) ，…，(u n ,v n ) 其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为：β̂=∑(u i −u)(v i −v)ni=1∑(u i −u)2ni=1，α̂=v −β̂u . 【答案】(Ⅰ)y =c +d √x 适宜作为年销售量y 关于年宣传费x 的回归方程类型；(Ⅱ)y ̂=100.6+68√x ；(Ⅲ)(i)答案见解析；(ii)46.24千元.【解析】（I ）由散点图可以判断，y =c +d √x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. （II ）令w =√x ，先建立y 关于w 的线性回归方程，由于d̂=∑(w i −w)(y i −y)8i=1∑(w i −w)28i=1=108.81.6=68，∴ĉ=y −d ̂w =563−68×6.8=100.6， ∴y 关于w 的线性回归方程为y ̂=100.6+68w ，因此y 关于x 的回归方程为y ̂=100.6+68√x .（III ）(ⅰ)由（II ）知，当x =49时，年销售量y 的预报值y ̂=100.6+68√49=576.6，年利润z 的预报值为ẑ=576.6×0.2−49=66.32.，ⅱ）根据（II ）的结果知，年利润z 的预报值ẑ=0.2(100.6+68√x)−x =−x +13.6√x +20.12，所以当√x =13.62=6.8，即x =46.24时，ẑ取得最大值. 故年宣传费为46.24千元时，年利润的预报值最大.例2．某地级市共有200000中小学生，其中有7%学生在2017年享受了“国家精准扶贫”政策，在享受“国家精准扶贫”政策的学生中困难程度分为三个等次：一般困难、很困难、特别困难，且人数之比为5:3:2，为进一步帮助这些学生，当地市政府设立“专项教育基金”，对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元。

经济学家调查发现，当地人均可支配年收入较上一年每增加n%，一般困难的学生中有3n%会脱贫，脱贫后将不再享受“精准扶贫”政策，很困难的学生中有2n%转为一般困难，特别困难的学生中有n%转为很困难。

现统计了该地级市2013年到2017年共5年的人均可支配年收入，对数据初步处理后得到了如图所示的散点图和表中统计量的值，其中年份x取13时代表2013年，x与y（万元）近似满足关系式y=C1⋅2C2x，其中C1,C2为常数。

（2013年至2019年该市中学生人数大致保持不变）其中k i=log2y i，k̅=15∑5i=1k i（Ⅰ）估计该市2018年人均可支配年收入；（Ⅰ）求该市2018年的“专项教育基金”的财政预算大约为多少？附：对于一组具有线性相关关系的数据(u1,v1),(u2,v2),⋯,(u n,v n)，其回归直线方程v=βu+α的斜率和截距的最小二乘估计分别为β̂=∑ni=1(u i−u̅)(v i−v̅)∑n i=1(u i−u̅)2,α̂=v̅−β̂u̅.【答案】（Ⅰ）2.8（万）;（Ⅱ）1624万.【详解】（Ⅰ）因为x̅=15(13+14+15+16+17)=15，所以∑5i=1(x i−x̅)2=(−2)2+(−1)2+12+22=10.由k=log2y得k=log2C1+C2x，所以C2=∑5i=1(x i−x̅)(k i−k̅)∑5i=1(x i−x̅)2=110，log2C1=k̅−C2x̅=1.2−110×15=−0.3，所以C1=2−0.3=0.8，所以y=0.8×2x10.当x=18时，2018年人均可支配年收入y=0.8×21.8=0.8×3.5=2.8（万）（Ⅱ）由题意知2017年时该市享受“国家精准扶贫”政策的学生共200000×7%=14000人一般困难、很困难、特别困难的中学生依次有7000人、4200人、2800人， 2018年人均可支配收入比2017年增长0.8×21.8−0.8×21.70.8×21.7=20.1−1=0.1=10%所以2018年该市特别困难的中学生有2800×(1-10%)=2520人，很困难的学生有4200×(1-20%)+2800×10%=3640人一般困难的学生有7000×(1-30%)+4200×20%=5740人.所以2018年的“专项教育基金”的财政预算大约为5740×1000+3640×1500+2520×2000=1624万.例3．近期，某公交公司分别推出支付宝和徽信扫码支付乘车活动，活动设置了一段时间的推广期，由于推广期内优惠力度较大，吸引越来越多的人开始使用扫码支付．某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次，用x 表示活动推出的天数，y 表示每天使用扫码支付的人次(单位：十人次)，统计数据如表l 所示：表1根据以上数据，绘制了如右图所示的散点图．(1)根据散点图判断，在推广期内，y =a +bx 与y =c ⋅d x (c，d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可，不必说明理由)，(2)根据(1)的判断结果及表1中的数据，求y 关于x 的回归方程，并预测活动推出第8天使用扫码支付的人次；参考数据：其中υi =1gy i ,υ=17∑υi 7i=1参考公式：对于一组数据(u 1,υ1),(u 2,υ2),⋅⋅⋅,(u n ,υn )，其回归直线υ̂=a ̂+β̂u 的斜率和截距的最小二乘估计公式分别为：β̂=∑u i υi −nuυni=1∑u i 2−nu 2ni=1,a ̂=υ−β̂u ̂. 【答案】（1）y =c ⋅d x ，2，3470【详解】（1）根据散点图判断，y =c ⋅d x 适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型；（2）∵y =c ⋅d x ，两边同时取常用对数得：1gy =1g(c ⋅d x ) =1gc +1gd ⋅x ，设1gy =v, ∴v =1gc +1gd ⋅x∵x =4,v =1.54, ∑x i 27i=1=140， ∴l g ̂d =∑x i v i 7i=1−7xv ∑x i2−7x 27i=1=50.12−7×4×1.54140−7×42=728=0.25，把样本中心点(4,1.54)代入v =1gc +1gd ⋅x ,得: l g ̂c =0.54， ∴v ̂=0.54+0.25x ，∴l g ̂y =0.54+0.25x ，∴y 关于x 的回归方程式：y ̂=100.54+0.25x =100.54×(100.25)x =3.47×100.25x，把x =8代入上式，y ̂=3.47×102=347，活动推出第8天使用扫码支付的人次为3470，例4．近年来，随着我国汽车消费水平的提高，二手车流通行业得到迅猛发展．某汽车交易市场对2017年成交的二手车交易前的使用时间（以下简称“使用时间”）进行统计，得到频率分布直方图如图1．图1 图2（1）记“在2017年成交的二手车中随机选取一辆，该车的使用年限在(8 , 16]”为事件A ，试估计A 的概率；（2）根据该汽车交易市场的历史资料，得到散点图如图2，其中x (单位：年)表示二手车的使用时间，y (单位：万元)表示相应的二手车的平均交易价格．由散点图看出，可采用y =e a+bx 作为二手车平均交易价格y 关于其使用年限x 的回归方程，相关数据如下表（表中Y i =lny i ，Y =110∑Yi 10i=1，，①根据回归方程类型及表中数据，建立y 关于x 的回归方程；②该汽车交易市场对使用8年以内(含8年)的二手车收取成交价格4%的佣金，对使用时间8年以上(不含8年)的二手车收取成交价格10%的佣金．在图1对使用时间的分组中，以各组的区间中点值代表该组的各个值．若以2017年的数据作为决策依据，计算该汽车交易市场对成交的每辆车收取的平均佣金．附注：①对于一组数据(u 1,v 1),(u 2,v 2),⋯(u n ,v n )，其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β̂=∑u i v i n i=1−nu̅ v ̅∑u i 2ni=1−nu ̅2,α̂=v̅−β̂ u ̅， ②参考数据：e 2.95≈19.1 , e 1.75≈5.75 , e 0.55≈1.73 , e −0.65≈0.52 , e −1.85≈0.16，【答案】（1）0.40；（2）y ̂=e 3.55−0.3x 0.29万元【详解】（1）由频率分布直方图得，该汽车交易市场2017年成交的二手车使用时间在(8,12]的频率为0.07×4=0.28，在(12,16]的频率为0.03×4=0.12 ,所以P (A )=0.28+0.12=0.40，（2）①由y =e a+bx 得lny =a +bx ，即Y 关于x 的线性回归方程为Ŷ=a +bx ，因为b ̂=∑x i Y i −10x̅⋅Y ̅10i=1∑x i 2−10x̅210i=1=79.75−10×5.5×1.9385−10×5.52=−0.3，a ̂=Y ̅−b ̂⋅x̅=1.9−(−0.3)×5.5=3.55 所以Y 关于x 的线性回归方程为Y ̂=3.55−0.3x ，即y 关于x 的回归方程为y ̂=e 3.55−0.3x ②根据①中的回归方程y ̂=e 3.55−0.3x 和图1，对成交的二手车可预测：使用时间在(0，4]的平均成交价格为e 3.55−0.3×2=e 2.95≈19.1，对应的频率为0.2，使用时间在(4，8]的平均成交价格为e 3.55−0.3×6=e 1.75≈5.75，对应的频率为0.36，使用时间在(8，12]的平均成交价格为e 3.55−0.3×10=e 0.55≈1.73，对应的频率为0.28，使用时间在(12，16]的平均成交价格为e3.55−0.3×14=e−0.65≈0.52，对应的频率为0.12，使用时间在(16，20]的平均成交价格为e3.55−0.3×18=e−1.85≈0.16，对应的频率为0.04所以该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.2×19.1+0.36×5.75)×4%+(0.28×1.73+0.12×0.52+0.04×0.16)×10% =0.29092≈0.29万元例5．菜农定期使用低害杀虫农药对蔬菜进行喷洒，以防止害虫的危害，但采集上市时蔬菜仍存有少量的残留农药，食用时需要用清水清洗干净，下表是用清水x(单位：千克)清洗该蔬菜1千克后，蔬菜上残留的农药y(单位：微克)的数据作了初步处理，得到下面的散点图及一些统计量的值． y （微克）x （千克）其中ω=x 2（I ）根据散点图判断，y ̂=bx +a 与y ̂=dx 2+c ，哪一个适宜作为蔬菜农药残量y ̂与用水量x 的回归方程类型（给出判断即可，不必说明理由）；(Ⅱ)若用解析式y ̂=dx 2+c 作为蔬菜农药残量y ̂与用水量x 的回归方程，求出y ̂与x 的回归方程．(c ，d 精确到0.1) (Ⅲ)对于某种残留在蔬菜上的农药，当它的残留量低于20微克时对人体无害，为了放心食用该蔬菜，请估计需要用多少千克的清水清洗一千克蔬菜？(精确到0.1，参考数据√5≈2.236) 附：参考公式：回归方程y ̂=a ̂+b̂x 中斜率和截距的最小二乘估计公式分别为： b ̂=∑(x i −x̅)(y i −y ̅)n i=1∑(x i −x̅)2n i=1, a ̂=y ̅−b ̂x̅ 【答案】（1）见解析；（2）y ̂=−2.0x 2+60.0；（3）需要用4．5千克的清水清洗一千克蔬菜. 【详解】（I ）根据散点图判断y ̂=dx 2+c 适宜作为蔬菜农药残量y ̂与用水量x 的回归方程类型；（Ⅱ）令w =x 2，先建立y 关于w 的线性回归方程，由于d̂=∑(w i −w )8i=1(y i −y )∑(w i −w )8i=12=−751374≈−2.0，∴ĉ=y −d̂w =38+2×11=60． ∴y 关于w 的线性回归方程为y ̂=−2.0w +60.0， ∴y 关于x 的回归方程为y ̂=−2.0x 2+60.0．(Ⅲ)当y ̂<20时，−2.0x 2+60.0<20 ，x >2√5≈4.5∴为了放心食用该蔬菜，估计需要用4．5千克的清水清洗一千克蔬菜。