18年高考数学常见题型解法归纳反馈训练第69讲线性和非线性回归模型的建立
高中数学专题02 非线性回归方程解析版

专题2 非线性回归方程例1. 某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:模型①:由最小二乘法公式求得y 与x 的线性回归方程5081697=+ˆ..yx ; 模型②:由散点图的样本点分布,可以认为样本点集中在曲线=bx y ae 的附近. (1)根据表中数据,求模型②的回归方程=ˆbx yae .(a 精确到个位,b 精确到001.). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据1(v ,1)w ,2(v ,2)w ,⋯,(n v ,)n w ,其回归直线αβ=+ˆˆˆwv 的斜率和截距的最小二乘法估计分别为121βαβ==--==--∑∑()()ˆˆ,()nii i nii ww v v w v vv . ②刻画回归效果的相关指数221211==-=--∑∑()()nii i n ii yy Ryy .③参考数据:546235≈.e ,14342≈..e .表中101110===∑,i i ii u lny u u.【解析】解:(1)对=bx y ae 取对数,得=+lny bx lna , 设=u lny ,=c lna ,先建立u 关于x 的线性回归方程.1011021900010883==--==≈-∑∑()().ˆ.()ii i ii xx u u bxx , 6050108555456546=-≈-⨯=≈ˆˆ.....cu bx ,546235=≈≈ˆ.ˆc a e e . ∴模型②的回归方程为011235=.ˆx ye ; (2)由表格中的数据,有3040714607>,即101022113040714607==>--∑∑()()iii i yy yy ,即10102211304071460711==-<---∑∑()()iii i yy yy ,∴2212<R R ,模型①的相关指数21R 小于模型②的22R ,说明回归模型②的拟合效果更好.2021年时,13=x ,预测旅游人数为0111314323523523542987⨯==≈⨯=..ˆ.y e e (万人).例2. 近年来,随着国家综合国力的提升和科技的进步,截至2018年底,中国铁路运营里程达13.2万千米,这个数字比1949年增长了5倍;高铁运营里程突破2.9万千米,占世界高铁运营里程的60%以上,居世界第一位.如表截取了20122016-年中国高铁密度的发展情况(单位:千米/万平方千米).已知高铁密度y 与年份代码x 之间满足关系式=(b y ax a ,b 为大于0的常数).若对=b y ax 两边取自然对数,得到=+lny blnx lna ,可以发现lny 与lnx 线性相关.(1)根据所给数据,求y 关于x 的回归方程ˆ(lna ,ˆb 保留到小数点后一位);(2)利用(1)的结论,预测到哪一年,高铁密度会超过30千米/万平方千米.参考公式:设具有线性相关系的两个变量x ,y 的一组数据为(i x ,1=)(i y i ,2,⋯⋯)n ,则回归方程ˆˆˆybx a =+的系数:121==--=-∑∑()()ˆ()nii i nii xx y y b xx ,=-ˆay bx . 参考数据:515092=-≈∑.ii i lnxlny lnx lny ,5221516=-≈∑()().ii lnx lnx ,515=≈∑ii lnx,5114=≈∑ii lny,274≈.,3034≈.ln .【解析】解:(1)对00=>>(,)b y ax a b 两边取自然对数,得=+lny blnx lna ; 令=i i v lnx ,=i i u lny ,1=i ,2,3,⋯,n ; 得u 与v 具有线性相关关系,计算51522150920575165==-===-∑∑.ˆ..i i i ii v uvubvv ,140575122255=-=-⨯=ˆ..lna u bv , ∴06≈ˆ.b,22≈≈.lna , ∴0622=+ˆ..u v ,故y 关于x 的回归方程为0622+=..ˆlnx y e , 即2206=..ˆye x ; (2)在(1)的回归方程中,0622+=..lnx y e ,高铁密度超过30千米/万平方千米; 即062230+>..lnx e ,06223034+>≈...lnx ln ,2>lnx .274>≈.x e ,即8=x 时,高铁密度超过30千米/万平方千米;所以预测2019年,高铁密度超过30千米/万平方千米.例3. 某公司生产一种产品,从流水线上随机抽取100件产品,统计其质量指数并绘制频率分布直方图(如图1):产品的质量指数在[50,70)的为三等品,在[70,90)的为二等品,在[90,110]的为一等品,该产品的三、二、一等品的销售利润分别为每件1.5,3.5,5.5(单位:元),以这100件产品的质量指数位于各区间的频率代替产品的质量指数位于该区间的概率. (1)求每件产品的平均销售利润;(2)该公司为了解年营销费用x (单位:万元)对年销售量y (单位:万件)的影响,对近5年的年营销费用i x 和年销售量i y (1,2,3,4,5)i =数据做了初步处理,得到的散点图(如图2)及一些统计量的值.表中ln i i u x =,ln i i v y =,5115i i u u ==∑,5115i i v v ==∑根据散点图判断,by a x =可以作为年销售量y (万件)关于年营销费用x (万元)的回归方程.(ⅰ)建立y 关于x 的回归方程;(ⅰ)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?(收益=销售利润-营销费用,取 4.15964e =)参考公式:对于一组数据:11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小乘估计分别为^121()()()nii i nii uu v v uu β==--=-∑∑,^v u αβ∧∧=-【解析】(1)设每件产品的销售利润为ξ元,则ξ的所有可能取值为1.5,3.5,5.5 由直方图可得:一、二、三等品的频率分别为0.4,0.45,0.15, 所以()1.50.15P ξ==,()3.50.45P ξ==, ()5.50.4P ξ==,所以:随机变量ξ的分布列为:所以, 1.50.15 3.50.45 5.50.44E ξ=⨯+⨯+⨯= 故每件产品的平均销售利润为4元.(2)(ⅰ)由·b y a x =得,()ln ln ?ln ln by a x a b x ==+,令ln u x =,ln v y =,ln c a =,则v c bu =+,由表中数据可得,()()()1210.410.251.6ˆ4ni i i n i i u u v v b u u ==--===-∑∑, 则24.8716.300.25 4.15955ˆc v bu∧∧=-=-⨯= 所以, 4.1590.25v u ∧=+,即14.1594ln 4.1590.25ln ln ?y x e x ∧⎛⎫=+= ⎪⎝⎭因为 4.15964e=,所以1464?y x ∧=故所求的回归方程为1464?y x =(ⅰ)设年收益为z 万元,则()14256z E y x x x ξ=-=-设14t x =,()4256f t t t =-,则()()33'2564464f t t t=-=-当()0,4t ∈时,()'0f t >,()f t 在()0,4单调递增, 当()4,t ∈+∞时,()'0f t <,()f t 在()4,+∞单调递减. 所以,当4t =,即256x =时,z 有最大值为768即该厂应投入256万元营销费,能使得该产品一年的收益达到最大768万元.例4. 近年来,随着互联网技术的快速发展,共享经济覆盖的范围迅速扩张,继共享单车、共享汽车之后,共享房屋以“民宿”、“农家乐”等形式开始在很多平台上线.某创业者计划在某景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近六家“农家乐”跟踪调查了100天.得到的统计数据如下表,x 为收费标准(单位:元/日),t 为入住天数(单位:),以频率作为各自的“入住率”,收费标准x 与“入住率”y 的散点图如图(1)若从以上六家“农家乐”中随机抽取两家深入调查,记ξ为“入住率”超过0.6的农家乐的个数,求ξ的概率分布列;(2)令ln z x =,由散点图判断ˆˆˆybx a =+与ˆˆy bz a =+哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程.(ˆb结果保留一位小数) (3)若一年按365天计算,试估计收费标准为多少时,年销售额L 最大?(年销售额365L =⋅入住率⋅收费标准x )参考数据:1221ˆ,ni i i n ii x y nx y b x nx ==-⋅=-∑∑621,200,0.45,32500,ˆˆ0ii a y bx x y x ==-===∑ 615.1,12.7,i i i z y z =≈≈∑6231158.1,148.4ii ze =≈≈∑【解析】(1)ξ的所有可能取值为0,1,2.则()0P ξ== 2426C C 62,155== ()1124268115C C P C ξ⋅===,()2P ξ== 2226C C 115= ξ∴的分布列(2)由散点图可知ˆˆˆybz a =+更适合于此模型. 其中6162216 1.070.52.0ˆ46i i i i i z y zy bz z ==--==≈--∑∑,ˆ3ˆˆay bz =-= 所求的回归方程为0.5ˆ3ylnx =-+ (3)()3650.53L lnx x =-+=3651095.2xlnx x -+ 365365365322L lnx =--+⨯'令505148.4L lnx x e =⇒=⇒=≈' ∴若一年按365天计算,当收费标准约为148.4元/日时,年销售额L 最大,最大值约为27083元.例5. 已知某种细菌的适宜生长温度为10C 25C ︒~︒,为了研究该种细菌的繁殖数量y (单位:个)随温度x (单位:C ︒)变化的规律,收集数据如下:对数据进行初步处理后,得到了一些统计量的值,如下表所示:其中ln i i k y =,7117i i k k ==∑.(1)请绘出y 关于x 的散点图,并根据散点图判断y bx a =+与21e c xy c =哪一个更适合作为该种细菌的繁殖数量y 关于x 的回归方程类型(结果精确到0.1);(2)当温度为25C ︒时,该种细菌的繁殖数量的预报值为多少?参考公式:对于一组数据()(),1,2,3,...,i i u v i n =,其回归线ˆˆˆvu βα=+的斜率和截距的最小二乘估计分别为:()121ˆ()()niii nii u u v v u u β==--=-∑∑,ˆˆav u β=-.参考数据: 5.5e 245≈.【解析】(1)绘出的散点图如图所示,根据散点图判断21c xy c e =更适合作为该种细菌的繁殖数量y 关于x 的回归方程类型;(2)∵21c xy c e=,∴21lny c x lnc =+,∴()()()71272120.50.2112i ii i i x x k k c x x ==--==≈-∑∑,1220.53.8180.5112lnck c x =-=-⨯≈, ∴0.51c e =,20.20.51c xx y c e e +==,当温度为25C ︒时,该种细菌的繁殖数量的预报值为 5.5245e ≈.例6. 噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D (单位:分贝)与声音能量(单位:2/W cm )之间的关系,将测量得到的声音强度1D 和声音能量i I (i =1,2…,10)数据作了初步处理,得到如图散点图及一些统计量的值.表中lg i i W I =,101110i i W W ==∑。
总结:线性回归分析的基本步骤

总结:线性回归分析的基本步骤-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII线性回归分析的基本步骤步骤一、建立模型知识点:1、总体回归模型、总体回归方程、样本回归模型、样本回归方程 ①总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。
Y X U β=+特点:由于随机误差项U 的存在,使得Y 和X 不在一条直线/平面上。
例1:某镇共有60个家庭,经普查,60个家庭的每周收入(X )与每周消费(Y )数据如下:作出其散点图如下:②总体回归方程(线):由于假定0EU =,因此因变量的均值与自变量总处于一条直线上,这条直线()|E Y X X β=就称为总体回归线(方程)。
总体回归方程的求法:以例1的数据为例由于01|i i i E Y X X ββ=+,因此任意带入两个X i 和其对应的E (Y |X i )值,即可求出01ββ和,并进而得到总体回归方程。
如将()()222777100,|77200,|137X E Y X X E Y X ====和代入()01|i i i E Y X X ββ=+可得:01001177100171372000.6ββββββ=+=⎧⎧⇒⎨⎨=+=⎩⎩以上求出01ββ和反映了E (Y |X i )和X i 之间的真实关系,即所求的总体回归方程为:()|170.6i i i E Y X X =+,其图形为:③样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。
如在例1中,通过抽样考察,我们得到了20个家庭的样本数据: 那么描述样本数据中因变量Y 和自变量X 之间非确定依赖关系的模型ˆY X e β=+就称为样本回归模型。
④样本回归方程(线):通过样本数据估计出ˆβ,得到样本观测值的拟合值与解释变量之间的关系方程ˆˆY Xβ=称为样本回归方程。
如下图所示:⑤四者之间的关系:ⅰ:总体回归模型建立在总体数据之上,它描述的是因变量Y和自变量X之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,它描述的是因变量Y和自变量X之间的近似于真实的非确定型依赖关系。
2018学年高中数学选修1-2课件:1.2 回归分析 精品

阶
段
段
一
三
1.2 回归分析
学
阶 段 二
业 分 层 测
评
1.会作出两个有关联变量的散点图,并利用散点图认识变量间的相关关系. 2.了解线性回归模型,能根据给出的线性回归方程系数公式建立线性回归方 程.重点、难点 3.了解回归分析的基本思想、方法及简单应用.
[基础·初探]
教材整理 1 线性回归模型
(2)由题意可得:y^=0.8x+2+e,当 x=10 时,y^=0.8×10+2+e=10+e, 又|e|≤0.5,∴9.5≤y^≤10.5.
故今年支出预计不会超过 10.5 亿. 【答案】 (1)①②③ (2)10.5
1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间 是否存在相关关系,然后利用最小二乘法求出回归直线方程.
所以 y 与 x 之间具有很强的线性相关关系.
(2)y 与 x 具有线性相关关系,设回归直线方程为
10
xi- x yi- y
Байду номын сангаас
i=1
y^=^a+b^x,则有b^=
≈1.22,
10
xi- x 2
i=1
^a=y- -b^x- =72.3-1.22×71=-14.32. 所以 y 关于 x 的回归直线方程为y^=1.22x-14.32.
【解】 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线 附近,因此两个变量线性相关.
设回归直线为y^=b^x+^a,由题知x- =42.5,y- =34, 则求得b^=∑ i=4∑ i=14x1ixy2ii--44x-x- 2y- =-132750≈-3. ^a=y- -b^x- =34-(-3)×42.5=161.5. ∴y^=-3x+161.5.
2018年高考数学 专题28 线性规划问题的求解策略黄金解题模板

专题28 线性规划问题的求解策略【高考地位】线性规划问题是高考的必考内容,其基本解题策略是定区域、化函数、找最值。
近年来,高考中的线性规划问题更趋灵活多样,体现了“活、变、新”等特点,更加深刻的考查学生解决综合性问题的能力。
在高考中以各种题型中均出现过,其试题难度属中高档题.【方法点评】类型一线性目标函数问题使用情景:求目标函数的最值解题模板:第一步根据已知约束条件画出其可行域;第二步平移目标函数的直线系,根据直线的斜率和截距之间的关系求出其最优解;第三步得出结论.例1 已知实数,x y满足不等式组2,220,xyx y⎧⎪-⎨⎪+-⎩,≥≥≤则2x y-的最大值是___________.【答案】6例2 已知x 、y 满足不等式组 2303301x y x y y +-≤⎧⎪+-≥⎨⎪≤⎩,则2z x y =+的最大值是 .【答案】6【变式演练1】已知变量,x y 满足约束条件Ω:21y x y x y a ≤⎧⎪+≥⎨⎪-≤⎩,若Ω表示的区域面积为4,则3z x y =-的最大值为___________.【答案】7【解析】试题分析:画出不等式组表示的区域如图,因BC AC ⊥且BC AC =,故区域的面积为4)212)(3(21=--+=a a S ,解之得1=a ,平移动直线z x y -=3,结合图形可以看出当动直线经过点)2,3(B 时,动直线z x y -=3的截距z -最小,z 最大,729max =-=z ,故应填7.考点:线性规划的有关知识及运用.【变式演练2】已知约束条件400x k x y x y ≥⎧⎪+-≤⎨⎪-≤⎩表示面积为1的直角三角形区域,则实数k 的值为( )A .0B .1 C.1或3 D .3【答案】B考点:1、线性规划;2、三角形的面积.类型二 非线性目标函数问题使用情景:求非线性目标函数的最值解题模板:第一步根据已知约束条件画出其可行域;第二步借助目标函数的几何意义,并利用数形结合法将所求问题转化为我们所熟悉的问题如直线的斜率问题、两点的距离的平方等;第三步得出结论.例3 已知不等式组0,0,4312xx yx y≥⎧⎪-≤⎨⎪+≤⎩,则11yzx-=+的最大值为.【答案】3例4 在平面直角坐标系xOy中,M为不等式组360200,0x yx yx y--≤⎧⎪-+≥⎨⎪≥≥⎩所表示的区域上一动点, 已知点()1,2A-,则直线AM斜率的最小值为()A.23- B.2- C.0 D.45【答案】B【解析】试题分析:可行域为一个四边形OBCD及其内部,其中(0,2),(2,0),(4,6)B C D,因此直线AM斜率的最小值为直线AO斜率,为2-,选B.考点:线性规划【易错点睛】线性规划的实质是把代数问题几何化,即数形结合的思想.需要注意的是:一,准确无误地作出可行域;二,画目标函数所对应的直线时,要注意与约束条件中的直线的斜率进行比较,避免出错;三,一般情况下,目标函数的最大或最小值会在可行域的端点或边界上取得.例5 若,x y满足2040x yx yy-+≥⎧⎪+-≤⎨⎪>⎩,则2||z y x=-的最大值为()A.-8 B.-4 C.1 D.2 【答案】D考点:1、可行域的画法;2、最优解的求法.【方法点晴】本题主要考查线性规划中利用可行域求目标函数的最值,属简单题.求目标函数最值的一般步骤是“一画、二移、三求”:(1)作出可行域(一定要注意是实线还是虚线);(2)找到目标函数对应的最优解对应点(在可行域内平移变形后的目标函数,最先通过或最后通过的顶点就是最优解);(3)将最优解坐标代入目标函数求出最值.【变式演练3】已知实数,x y满足401010x yyx+-≤⎧⎪-≥⎨⎪-≥⎩,则2yzx=的最大值是()A.13B.9 C.2 D.11【答案】B【解析】试题解析:先画出二元一次不等式所表示的平面区域(如图),则1,1≥≥y x 要使xy 2最大,只需y 最大,x 最小,由图像可知当xy z 2=经过定)3,1(A 时,z 最大,最大值为9.选B. 考点:线性规划.【变式演练4】若变量y x ,满足约束条件⎪⎩⎪⎨⎧≥+-≤-≥+022002y x y x y x ,且a x y z -=仅在点)21,1(-A 处取得最大值,则实数a 的取值范围为( )A .)1,2[--B .)1,(--∞C .)1,2(--D .)1,1(-【答案】C考点:线性规划.【变式演练5】已知实数,x y 满足21010x y x y -+≥⎧⎨--≤⎩,则22x y z x ++=的取值范围为( ) A .100,3⎡⎤⎢⎥⎣⎦ B .(]10,2,3⎡⎫-∞+∞⎪⎢⎣⎭ C .102,3⎡⎤⎢⎥⎣⎦ D .(]10,0,3⎡⎫-∞+∞⎪⎢⎣⎭【答案】D考点:简单的线性规划问题.类型三 含参数线性目标函数问题使用情景:求含参数线性目标函数的最值解题模板:第一步 根据已知约束条件画出其可行域;第二步 画目标函数所对应的直线时,要注意与约束条件中的直线的斜率进行比较并进行分类讨论;第三步 得出结论.例6已知,x y 满足2y x x y x a ≥⎧⎪+≤⎨⎪≥⎩,且2z x y =-的最大值是最小值的-2倍,则a 的值是 . 【答案】12【解析】试题分析:由题意得可行域为一个三角形ABC 及其内部,其中(,)(,2),(1,1),(1)A a a B a a C a -<,直线2z x y =-过C 点时取最大值,过B 点时取最小值,因此112(22)2a a a =--+⇒=考点:线性规划【易错点睛】线性规划的实质是把代数问题几何化,即数形结合的思想.需要注意的是:一,准确无误地作出可行域;二,画目标函数所对应的直线时,要注意与约束条件中的直线的斜率进行比较,避免出错;三,一般情况下,目标函数的最大或最小值会在可行域的端点或边界上取得.【变式演练6】设1m >,变量x ,y 在约束条件,,1y x y mx x y ≥⎧⎪≤⎨⎪+≤⎩下,目标函数z x my =+的最大值为2,则m =_________.【答案】1m =+考点:简单的线性规划的应用.【高考再现】1.【2016高考山东文数】若变量x ,y 满足2,239,0,x y x y x +≤⎧⎪-≤⎨⎪≥⎩则x 2+y 2的最大值是( )(A )4(B )9(C )10(D )12【答案】C2.【2016高考浙江文数】若平面区域30,230,230x yx yx y+-≥⎧⎪--≤⎨⎪-+≥⎩夹在两条斜率为1的平行直线之间,则这两条平行直线间的距离的最小值是()【答案】B 【解析】3.【2016高考新课标1文数】某高科技企业生产产品A 和产品B 需要甲、乙两种新型材料.生产一件产品A 需要甲材料1.5kg,乙材料1kg,用5个工时;生产一件产品B 需要甲材料0.5kg,乙材料0.3kg,用3个工时,生产一件产品A 的利润为2100元,生产一件产品B 的利润为900元.该企业现有甲材料150kg,乙材料90kg,则在不超过600个工时的条件下,生产产品A 、产品B 的利润之和的最大值为 元.【答案】216000【解析】试题分析:设生产产品A 、产品B 分别为x 、y 件,利润之和为z 元,那么1.50.5150,0.390,53600,0,0.x y x y x y x y +⎧⎪+⎪⎪+⎨⎪⎪⎪⎩…………… ①目标函数2100900z x y =+. 二元一次不等式组①等价于3300,103900,53600,0,0.x y x y x y x y +⎧⎪+⎪⎪+⎨⎪⎪⎪⎩?…………② 作出二元一次不等式组②表示的平面区域(如图),即可行域.4.【2016高考新课标2文数】若x ,y 满足约束条件103030x y x y x -+≥⎧⎪+-≥⎨⎪-≤⎩,则2z x y =-的最小值为__________【答案】5- 【解析】试题分析:由1030x y x y -+=⎧⎨+-=⎩得12x y =⎧⎨=⎩,点()1,2A ,由1030x y x -+=⎧⎨-=⎩得34x y =⎧⎨=⎩,点()3,4B ,由3030x x y -=⎧⎨+-=⎩得3x y =⎧⎨=⎩,点()C 3,0,分别将A ,B ,C 代入2z x y =-得:1223z A =-⨯=-,3245z B =-⨯=-,C 3203z =-⨯=,所以2z x y =-的最小值为5-.考点: 简单的线性规划.【名师点睛】利用线性规划求最值,一般用图解法求解,其步骤是:(1)在平面直角坐标系内作出可行域;(2)考虑目标函数的几何意义,将目标函数进行变形;(3)确定最优解:在可行域内平行移动目标函数变形后的直线,从而确定最优解; (4)求最值:将最优解代入目标函数即可求出最大值或最小值.5.【2016高考新课标Ⅲ文数】若,x y 满足约束条件210,210,1,x y x y x -+≥⎧⎪--≤⎨⎪≤⎩则235z x y =+-的最大值为_____________. 【答案】10-6.【2016高考上海文科】若,x y满足0,0,1,xyy x≥⎧⎪≥⎨⎪≥+⎩则2x y-的最大值为_______.【答案】2-7. 【2016高考天津文数】某化肥厂生产甲、乙两种混合肥料,需要A,B,C三种主要原料.生产1车皮甲种肥料和生产1车皮乙中肥料所需三种原料的吨数如下表所示:现有A种原料200吨,B种原料360吨,C种原料300吨,在此基础上生产甲乙两种肥料.已知生产1车皮甲种肥料,产生的利润为2万元;生产1车皮乙种肥料,产生的利润为3万元.分别用x,y表示生产甲、乙两种肥料的车皮数.(Ⅰ)用x,y列出满足生产条件的数学关系式,并画出相应的平面区域;(Ⅱ)问分别生产甲、乙两种肥料各多少车皮,能够产生最大的利润?并求出此最大利润.【答案】(Ⅰ)详见解析(Ⅱ)生产甲种肥料20车皮,乙种肥料24车皮时利润最大,且最大利润为112万元【解析】试题分析:(Ⅰ)根据生产原料不能超过A种原料200吨,B种原料360吨,C种原料300吨,列不等关系式,即可行域,再根据直线及区域画出可行域(Ⅱ)目标函数为利润y x z 32+=,根据直线平移及截距变化规律确定最大利润试题解析:(Ⅰ)解:由已知y x ,满足的数学关系式为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥≥≤+≤+≤+003001033605820054y x y x y x y x ,该二元一次不等式组所表示的区域为图1中的阴影部分.(1)的坐标为)24,20(M ,所以112243202max =⨯+⨯=z .答:生产甲种肥料20车皮,乙种肥料24车皮时利润最大,且最大利润为112万元.(2)考点:线性规划【反馈练习】1.【广东省五校2018届高三12月联考数学(文)试题】设x , y 满足约束条件220,{260, 20,x y x y y --≤+-≥-≤则xz y=的取值范围是( )A. []1,4 B. 71,2⎡⎤⎢⎥⎣⎦ C. 1,14⎡⎤⎢⎥⎣⎦ D. 2,17⎡⎤⎢⎥⎣⎦【答案】A【解析】可行域为如图所示的ABC ∆内部(包括边界),yx表示经过原点O 与可行域的点(),x y 连线的斜率,易求得()()114,1,2,2,,1,,144OA OB y A B k k x ⎡⎤==∴∈⎢⎥⎣⎦,从而[]1,4x y∈, 故选A.【方法点晴】本题主要考查线性规划中利用可行域求目标函数的最值,属简单题.求目标函数最值的一般步骤是“一画、二找、三求”:(1)作出可行域(一定要注意是实线还是虚线);(2)找到目标函数对应的最优解对应点(在可行域内平移或旋转变形后的目标函数,最先通过或最后通过的顶点就是最优解);(3)将最优解坐标代入目标函数求出最值.2.【河南省林州市第一中学2018届高三12月调研考试数学(文)试题】已知,x y N +∈且满足约束条件1{22 5x y x y x -<-><,则x y +的最小值为 ( )A. 1B. 4C. 6D. 7 【答案】C点睛:求线性目标函数z =ax +by(ab≠0)的最值,当b >0时,直线过可行域且在y 轴上截距最大时,z 值最大,在y 轴截距最小时,z 值最小;当b <0时,直线过可行域且在y 轴上截距最大时,z 值最小,在y 轴上截距最小时,z 值最大.3.【河南省漯河市高级中学2018届高三上学期第四次模拟考试数学(理)试题】已知M , N 是不等式组11{ 106x y x y x y ≥≥-+≥+≤ ,所表示的平面区域内的两个不同的点,则MN 的最大值是( )A.2C. 172【答案】B因此|MN|的最大值是故选:B点睛:本题考查的是线性规划问题,解决线性规划问题的实质是把代数问题几何化,即数形结合思想.需要注意的是:一,准确无误地作出可行域;二,画目标函数所对应的直线时,要注意让其斜率与约束条件中的直线的斜率进行比较,避免出错;三,一般情况下,目标函数的最大值或最小值会在可行域的端点或边界上取得.4.【广西玉林、柳州2017届高三4月联考数学(文)试题】若,x y满足约束条件10{040xx yx y-≥-≤+-≤,则2z x y=-的最小值为__________.【答案】-15.【湖南省五市十校教研教改共同体2018届高三12月联考数学(理)试题】若实数,x y 满足不等式组10{10 x y x y x a+-≥-+≥≤,若目标函数2z ax y =-的最大值为1,则实数a 的值是( )1D. 3 【答案】B【解析】作可行域如图,则直线2z ax y =-过点B (),1a a -时,z 取得最大值, ()2211,1a a a --==(负值舍去),选B.点睛:线性规划的实质是把代数问题几何化,即数形结合的思想.需要注意的是:一,准确无误地作出可行域;二,画目标函数所对应的直线时,要注意与约束条件中的直线的斜率进行比较,避免出错;三,一般情况下,目标函数的最大或最小值会在可行域的端点或边界上取得.6.【四川省德阳市2018届高三三校联合测试数学(理)试题】已知函数()3223f x x ax bx c =+++的两个极值点分别在()1,0-与()0,1内,则2a b -的取值范围是A. 33,22⎛⎫-⎪⎝⎭ B. 3,12⎛⎫- ⎪⎝⎭ C. 13,22⎛⎫- ⎪⎝⎭D. 31,2⎛⎫ ⎪⎝⎭【答案】A7.【辽宁省大连市2018届高三第二次联考数学(文)试题】若实数,x y 满足不等式组10{220 0x y x y y -+≥+-≥≥,则321z x y =++的最小值为__________. 【答案】3【解析】所以过点()0,1时, min 3z =。
总结:线性回归分析的基本步骤

线性回归分析的基本步骤步骤一、建立模型知识点:1、总体回归模型、总体回归方程、样本回归模型、样本回归方程 ①总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。
Y X U β=+特点:由于随机误差项U 的存在,使得Y 和X 不在一条直线/平面上。
例1:某镇共有60个家庭,经普查,60个家庭的每周收入(X )与每周消费(Y )数据如下:作出其散点图如下:②总体回归方程(线):由于假定0EU =,因此因变量的均值与自变量总处于一条直线上,这条直线()|E Y X X β=就称为总体回归线(方程)。
总体回归方程的求法:以例1的数据为例,求出E (Y |X 由于01|i i i E Y X X ββ=+,因此任意带入两个X i 和其对应的E (Y |X i )值,即可求出01ββ和,并进而得到总体回归方程。
如将()()222777100,|77200,|137X E Y X X E Y X ====和代入()01|i i i E Y X X ββ=+可得:01001177100171372000.6ββββββ=+=⎧⎧⇒⎨⎨=+=⎩⎩以上求出01ββ和反映了E (Y |X i )和X i 之间的真实关系,即所求的总体回归方程为:()|170.6i i i E Y X X =+,其图形为:③样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。
如在例1中,通过抽样考察,我们得到了20个家庭的样本数据:那么描述样本数据中因变量Y 和自变量X 之间非确定依赖关系的模型ˆY X e β=+就称为样本回归模型。
④样本回归方程(线):通过样本数据估计出ˆβ,得到样本观测值的拟合值与解释变量之间的关系方程ˆˆY X β=称为样本回归方程。
如下图所示:⑤四者之间的关系:ⅰ:总体回归模型建立在总体数据之上,它描述的是因变量Y 和自变量X 之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,它描述的是因变量Y 和自变量X 之间的近似于真实的非确定型依赖关系。
专题18 线性回归方程的应用(课时训练)解析版

专题18 线性回归方程的应用A 组 基础巩固1.(2021·全国高二专题练习(理))下列说法正确的是( ) A .两个变量的相关关系一定是线性相关B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于0C .在回归直线方程y =0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位 D .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越大 【答案】D 【分析】根据独立性检验的概念以及基本思想即可得出选项. 【详解】A ,两个变量的相关关系有线性相关或非线性相关,故A 错误;B ,两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1,故B 错误;C ,在回归直线方程y =0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加0.2个单位,故C 错误; D ,由独立性检验知“判断‘X 与Y 有关系’的把握程度越大”正确, 故选:D .2.(2021·山东临沂市·高三二模)在天文学上恒星的亮度一般用星等来表示,直接测量到的天体亮度被称为视星等m ,而把天体置于10秒差距的距离处所得到的视星等称为绝对星等M ,它能反映天体的发光本领.如果我们观测到了恒星的光谱,可以知道一些类型恒星的绝对星等,就可以利用光谱视差法来获得这些恒星的距离.下表是某校天文爱好者社团在网上收集到一些恒星的相关数据,那么最适合作为星等差y 关于距离x (光年)的回归方程类型的是( )A .2y a bx =+B .lg =+y a b xC .y a =+D .y a bx =+【答案】B 【分析】由表格数据在直角坐标系中标注点坐标,勾画出大概图象,对比2,lg x x x 的图象,即可知其回归方程类型. 【详解】根据表格数据,在直角坐标系中从左至右依次标注表格数据代表的点,拟合曲线如下图示,图象左侧无限靠近y 轴,不与y 轴相交,故其拟合曲线比较接近lg y x =的图象, 故选:B.3.(2021·四川宜宾市·高三三模(文))我校实验二部数学学习兴趣小组为研究某作物种子的发芽率y 和温度x (单位:C ︒)的关系,由实验数据得到右面的散点图. 由此散点图,最适宜作为发芽率y 和温度x 的回归方程类型的是 ( )A .y a bx =+B .ln y a b x =+C .e x y a b =+D .2y a bx =+【答案】B 【分析】先利用散点图判断增长状态,再逐个分析选项是否合适即可. 【详解】由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢. A 中,y a bx =+是直线型,均匀增长,不符合要求; B 中,ln y a b x =+是对数型,增长缓慢,符合要求;C 中,e x y a b =+是指数型,爆炸式增长,增长快,不符合要求;D 中,2y a bx =+是二次函数型,图象呈现下凸,增长也较快,不符合要求. 故对数型最适宜该回归模型. 故选:B.4.(2021·全国高三专题练习(文))某公司由于改进了经营模式,经济效益与日俱增.统计了2018年10月到2019年4月的纯收益y (单位:万元)的数据,如下表:得到y 关于t 的线性回归方程为 4.7551.36y t =+.请预测该公司2019年6月的纯收益为( ) A .万元 B .98.86万元 C .103.61万元 D .108.36万元【答案】C 【分析】根据表格可得6月对应的代码为11t =,代入线性回归方程即可得到答案.【详解】将2019年6月代号11t =带入题中的线性回归方程,得 4.751151.36103.61y =⨯+=.故选:C . 【点睛】本题主要考查线性回归方程的应用,属于基础题.5.(2020·全国高二课时练习)“关注夕阳、爱老敬老”—某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x 年(2013年是第一年)与捐赠的现金y (万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程,则预测2019年捐赠的现金大约是A .5万元B .5.2万元C .5.25万元D .5.5万元【答案】C 【分析】由已知求出,x y ,代入回归直线的方程,求得m ,然后取7x =,求得y 的值,即可得到答案. 【详解】由已知得,,所以样本点的中心点的坐标为,代入, 得3.5 4.50.35m =+,即0.7m =,所以,取7x =,得ˆ0.770.35 5.25y=⨯+=, 预测2019年捐赠的现金大约是5.25万元. 【点睛】本题主要考查了线性回归方程以及应用,其中解答中熟记回归直线的方程经过样本中心点是解答的关键,着重考查了推理与计算能力,属于基础题.6.(2020·全国高三专题练习)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据:由最小二乘法得y 与x 的线性回归方程为,则当7x =时,繁殖个数y 的预测值为 A .4.9 B .5.25 C .5.95 D .6.15【答案】B 【分析】根据表格中的数据,求得样本中心为,代入回归直线方程,求得ˆ0.35a =,得到回归直线的方程为,即可作出预测,得到答案. 【详解】由题意,根据表格中的数据,可得, 即样本中心为,代入回归直线方程,即79ˆ0.722a=⨯+, 解得ˆ0.35a =,即回归直线的方程为,当7x =时,ˆ0.770.35 5.25y=⨯+=,故选B . 【点睛】本题主要考查了回归直线方程的应用,其中解答中熟记回归直线方程的特征,求得回归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.7.(2018·全国高一课时练习)登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃. 【答案】-6 【解析】由题意可得x =10,y =40,所以ˆay =+2x =40+2×10=60,所以ˆy =-2x+60,当ˆy =72时,-2x+60=72,解得x=-6.8.(2018·全国高一课时练习)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验收集到的数据如下表: 零件数x 10 20 30 40 50 加工时间y/min 62758189由最小二乘法求得回归方程为ˆy=0.67x+54.9,现发现表中有一个数据模糊不清,请你推断出该数据的值为_____. 【答案】68 【解析】由于回归直线方程过样本中心点,,代入回归直线方程得3070.673054.95a+=⨯+,解得68a =,故填68. 9.(2017·商丘市第一高级中学高二月考(文))某城市2007年到2011年人口总数与年份的关系如表所示.据此估计2017年该城市人口总数_____.(参考数据和公式: ˆˆˆ3.2,b a y bx==-)【答案】35.6 【解析】2x =,10y =,5222222i 00123430ix==++++=∑,故y 关于x 的线性回归方程为 当10x =时,10.(2017·河南洛阳市·高二期末(文))某企业想通过做广告来提高销售额,经预测可知本企业产品的广告费x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:由表中的数据得线性回归方程为,其中ˆ 6.5b=,由此预测当广告费为7百万元时,销售额为__________万元. 【答案】63 【解析】根据已知数据可知:2456830406050705,5055x y ++++++++====.50 6.5517.5ˆˆay bx =-=-⨯=. .当7x =时,ˆ63y=. 11.(2021·全国高三其他模拟)2020年全面建成小康社会取得伟大历史成就,决战脱贫攻坚取得决定性胜利.某市积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收,某商家统计了7个月的月广告投入x (单位:万元)与月销量y (单位:万件)的数据如表所示:(1)已知可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明,并求y 关于x 的线性回归方程; (2)根据(1)的结论,预计月广告投入大于多少万元时,月销量能突破70万件. 参考数据:()()71150i i i x xy y =--=∑,()721820i i y y=-=∑,.参考公式:相关系数;回归直线的斜率和截距的最小二乘估计分别为()()()121nii i nii xx y yb xx==--=-∑∑,.【答案】(1)相关系数0.99r ≈,线性回归模型能够很好地拟合y 与x 的关系;;(2)9.04万元. 【分析】(1)现根据题中数据求得相关系数0.99r ≈,从而说明线性回归模型能够很好地拟合y 与x 的关系,再根据题中数据求得b 和a ,进而求得回归方程; (2)解不等式70y >即可求出结果. 【详解】(1)由题意,知, ∴()()()()()()()7222222211424344455464i i x x=-=-+-+-+-+-+-∑()27428+-=.结合()()71150iii x x y y =--=∑,()721820ii y y =-=∑可得,相关系数()()737.50.9937.88iix x y y r --===≈≈∑,显然y 与x 的线性相关程度相当高,从而线性回归模型能够很好地拟合y 与x 的关系. 易知,28323545 495260437y ++++++==,∴75151434147a y bx =-=-⨯=. ∴y 关于x 的线性回归方程为. (2)若月销量突破70万件,则, 解得2269.0425x >=. 故当月广告投入大于9.04万元时,月销量能突破70万件. 【点睛】易错点睛:解决有关线性回归方程问题时需要特别注意:回归直线的斜率b 是线性回归方程中x 的系数,在应用公式及将数据代入线性回归方程时,不要把回归直线的斜率b 与截距a 搞混.12.(2021·福建厦门市·厦门外国语学校高三其他模拟)根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种疫苗的情况,得如下统计表:(1)建立y 关于x 的线性回归方程;(2)预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程中斜率和截距的最小二乘估计公式分别为: ,. 【答案】(1);(2). 【分析】(1)本题首先可以求出x 、,然后求出b 、a ,即可求出y 关于x 的线性回归方程; (2)本题可设,数列的前n 项和为n S ,然后根据等差数列求和公式得出21185nS n n ,最后求出6S 、7S ,即可得出结果.【详解】 (1),,则,222919355a=-⨯=,故y关于x的线性回归方程.(2)20080160%=,设,数列的前n项和为n S,易知数列是等差数列,则,因为6127.2S,7163.8S,所以预测该村80%居民接种新冠疫苗需要天.【点睛】关键点点睛:本题考查线性回归方程的求法以及实际应用,能否根据表中数据求出b、a是解决本题的关键,考查等差数列求和公式的应用,考查计算能力,是中档题.B 组 能力提升14.(多选题)(2021·全国高三专题练习)2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升,某手机商城统计了近5个月来5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为455y x =+,则下列说法正确的是( ) A .147a = B .y 与x 正相关C .y 与x 的相关系数为负数D .8月份该手机商城的5G 手机销量约为36.5万部 【答案】AB 【分析】计算出销量的平均数,利用总销量可得a 值;由回归方程中的x 的系数为正可知,y 与x 正相关;将7x =代入,可得8月份该手机商城的5G 手机销量.【详解】由表中数据,计算得()11234535x =⨯++++=,所以4535140y =⨯+=, 于是得,解得147a =,故A 正确;由回归方程中的x 的系数为正可知,y 与x 正相关,且其相关系数0r >,故B 正确,C 错误; 8月份时,7x =,32y =(万部),故D 错误. 故选:AB . 【点睛】本题考查两个变量的线性相关关系,考查了线性回归方程的应用,考查学生逻辑推理能力,属于中档题. 15.(多选题)(2020·济南市章丘区第四中学)给出下列命题,其中正确的命题有( )A .设具有相关关系的两个变量x ,y 的相关系数为r ,则越接近于0,x ,y 之间的线性相关程度越高B .随机变量2(3)~,2X N ,若23X η=+,则()1D η=C .公共汽车上有10位乘客,沿途5个车站,乘客下车的可能方式有510种D .回归方程为中,变量y 与x 具有正的线性相关关系,变量x 增加1个单位时,y 平均增加0.85个单位 【答案】BD 【分析】A.根据相关系数的应用,即可做出判断;B.由正态分布可知,()3E X =,()4D X =,且,计算()D η的值;C.根据分步计数原理直接计算结果;D.根据回归方程的形式,即可做出判断. 【详解】A.设具有相关关系的两个变量,x y 的相关系数为r ,则越接近于0,,x y 之间的线性相关程度越弱,故A 不正确;B. 随机变量2(3)~,2X N ,则()3E X =,()4D X =,若23X η=+,则,得()1D η=,故B 正确;C.由分步计数原理可知,每位乘客下车方法有5种,所以乘客下车的可能方式有105种,故C 不正确;D.由回归方程的形式可知,,变量y 与x 具有正的线性相关关系,变量x 增加1个单位时,y 平均增加0.85个单位,故D 正确. 故选:BD 【点睛】本题考查回归方程,分步计数原理,正态分布方差的性质,以及相关系数的辨析,属于基础题型. 16.(2021·重庆高三三模)近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y (单位:元)与当天揽收的快递件数x (单位:千件)之间的关系,对该网点近5天的每日揽件量i x (单位:千件)与当日收发一件快递的平均成本i y (单位;元)(i =1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.表中1i i w x =,5115i i w w ==∑.(1)根据散点图判断,y a bx =+与dy c x=+哪一个适宜作为y 关于x 的回归方程类型?并根据判断结果及表中数据求出y 关于x 的回归方程;(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x (单位:千件)与单件快递的平均价格t (单位;元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:①预测该网点某天揽收2000件快递可获得的总利润;②单件快递的平均价格t 为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线的斜率和截距的最小二乘估计分别为,v u αβ=-.【答案】(1)dy c x =+适宜作为y 关于x 的回归方程类型,回归方程为4 3.5y x=+;(2)①总利润约为12000元;②平均价格t 为8元. 【分析】(1)点不在一条直线的近旁,但与双曲线类似,可得回归曲线类型.令1w x=,根据已知数据求得回归方程y c dw =+,即可得结论.(2)①利用(1)的结论求出利润函数,令2x =可得估计利润值;②由二次函数性质可得. 【详解】解:(1)dy c x=+适宜作为y 关于x 的回归方程类型. 令1w x=,则y dw c =+, 2.02840.507d ==,5.1640.415 3.5c y d w =-⋅=-⨯=,∴4 3.5y w =+,即所求回归方程为43.5y x=+; (2)设收发x 千件快递获利z 千元,则,[]1,15x ∈,①当2x =时,12z =,故该网点某天揽收2000件快递可获得的总利润约为12000元; ②()2173922z x =--+,∴当9x =即8t =时,z 取最大值,故单件快递的平均价格t 为8元时,该网点一天内收发快递所获利润的预报值最大.17.(2021·安徽蚌埠市·蚌埠二中高三其他模拟(文))自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).(1)将4月9日作为第1次统计,若将统计时间序号作为变量x ,每次累计确诊人数作为变量x ,得到函数关系,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值6x =,603.09y =,1111ln 5.9811i i y ==∑,()()11115835.70i ii x y xy =--=∑,()1121110ii x x =-=∑,()1121ln ln 11.90i i y y=-=∑,, 4.0657.97e ≈, 4.0758.56e ≈, 4.0859.15e ≈,根据相关数据,确定该函数关系式(参数a ,b 的取值精确到0.01);(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率. 参考公式:线性回归方程中,,; 【答案】(1)0.3258.56x y e =;(2)45. 【分析】(1)由已知函数,两边到自然对数可得,再计算b ,ln a ,可得函数方程.(2)先由分层抽样的方法求得老年、中年、青年分别抽取的人数,运用列举法和古典概率公式可求得答案. 【详解】(1)因为,所以, 由已知得,, 4.0758.56a e =≈,∴所求函数方程为0.3258.56x y e =.(2)从90人中按照分层抽样的方法随机抽取6人, 老年、中年、青年分别抽取的人数为3人,2人,1人,记3个老年人为1A ,2A ,3A ,2个中年人为1B ,2B ,1个青年人为1C , 抽取的全部结果为,,,,,,,,,,,,,,共15种. 至少1人是老年人的有,,,,,,,,,,,,共12种. 所以至少1人是老年人的概率为124155p ==. 【点睛】关键点睛:本题考查线性回归方程的应用,分层抽样,古典概率的求解,关键在于正确地理解线性回归方程的意义,准确地运用古典概率公式.。
可线性化的回归分析课件
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 ·选修2-t
正式作业
课本P86习题3- 1 第3 ,4题。
第三章 §1
第三章 §1
成才之路 ·高中新ຫໍສະໝຸດ 程 ·学习指导 ·北师大版 ·数学 ·选修2-t
4 .常见的非线性回归模型转化为线性回归模型如下: (1)幂函数曲线y=axb 作变换u=lny ,v=lnx ,c=lna ,得线性函数u=c+bv. (2)指数曲线y=aebx 作变换u=lny ,c=lna ,得线性函数u=c+bx.
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 ·选修2-t
(2)若体重超过相同身高的女性体重平均值的1.2倍为偏胖, 低于0.8倍为偏瘦,那么这个地区一名身高175cm、体重82kg 的在校女生的体重是否正常?
[ 分析 ] 由样本点画出散点图,找出拟合函数曲线,转
化为线性回归模型解题.注意最后要将中间变量值用x代换.
第三章 §1
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 ·选修2-t
[解析] (1)根据上表中的数据画出散点图如图所示.
由图可看出,样本点分布在某条类似指数函数曲线y= ec1 +c2x 的周围,其中c1和c2是待定的参数,令z=lny,变 换 后的样本数据表如下:
x 60 70 80 90 100 110 120 130 140 150 160 170 y 1.81 2.07 2.30 2.50 2.71 2.86 3.04 3.29 3.44 3.66 3.86 4.01
第三章 §1
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 ·选修2-t 第三章 §1
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 ·选修2-t 第三章 §1
(整理)总结:线性回归分析的基本步骤
线性回归分析的基本步骤步骤一、建立模型知识点:1、总体回归模型、总体回归方程、样本回归模型、样本回归方程 ①总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。
Y X U β=+特点:由于随机误差项U 的存在,使得Y 和X 不在一条直线/平面上。
例1:某镇共有60个家庭,经普查,60个家庭的每周收入(X )与每周消费(Y )数据如下:作出其散点图如下:②总体回归方程(线):由于假定0EU =,因此因变量的均值与自变量总处于一条直线上,这条直线()|E Y X X β=就称为总体回归线(方程)。
总体回归方程的求法:以例1的数据为例,求出E (Y |X 由于01|i i i E Y X X ββ=+,因此任意带入两个X i 和其对应的E (Y |X i )值,即可求出01ββ和,并进而得到总体回归方程。
如将()()222777100,|77200,|137X E Y X X E Y X ====和代入()01|i i i E Y X X ββ=+可得:01001177100171372000.6ββββββ=+=⎧⎧⇒⎨⎨=+=⎩⎩以上求出01ββ和反映了E (Y |X i )和X i 之间的真实关系,即所求的总体回归方程为:()|170.6i i i E Y X X =+,其图形为:③样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。
如在例1中,通过抽样考察,我们得到了20个家庭的样本数据: 那么描述样本数据中因变量Y 和自变量X 之间非确定依赖关系的模型ˆY X e β=+就称为样本回归模型。
④样本回归方程(线):通过样本数据估计出ˆβ,得到样本观测值的拟合值与解释变量之间的关系方程ˆˆY X β=称为样本回归方程。
如下图所示:⑤四者之间的关系:ⅰ:总体回归模型建立在总体数据之上,它描述的是因变量Y和自变量X 之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,它描述的是因变量Y和自变量X之间的近似于真实的非确定型依赖关系。
2018版高中数学 专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3
专题03 线性回归方程及其应用一、选择题1.【北京101中学2016-2017学年下学期高二年级期中考试】一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的回归模型为y =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A . 身高一定是145.83cmB . 身高在145.83cm 以上C . 身高在145.83cm 左右D . 身高在145.83cm 以下【答案】C【解析】由回归模型可得y =7.1910x +73.93=145.83,所以预测这个孩子10岁时的身高在145.83cm 左右。
2.【吉林省辽源市田家炳高级中学2017-2018学年高二下学期3月月考】有位同学家开了个小卖部,他为了研究气温对热饮销售的影响,经过统计得到一天所卖的热饮杯数(y )与当天气温(x ℃)之间的线性关系,其回归方程为ˆy=-2.35x +147.77.如果某天气温为2℃,则该小卖部大约能卖出热饮的杯数是( ) A . 140 B . 143 C . 152 D . 156【答案】B点睛:本题主要考查的知识点是线性回归方程的应用,即根据所给的或者是做出的线性回归方程,预报y 的值,这是一些解答题目中经常会出现的一个问题,是一个基础题。
关键是根据所给的一个热饮杯数与当天气温之际的线性关系,做出其回归方程。
3.【四川省棠湖中学2018届高三3月月考】如表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程为0.70.5ˆ3yx =+,则表中m 的值为( )A. 3B. 3.5C. 4.5D. 2.5 【答案】A点睛:回归直线一定经过样本中心(),x y,是线性回归分析中的重要结论,利用此结论可求回归方程中的参数,也可求样本点中的参数.4.【河北省阜城中学 2017-2018学年高二上学期期末考试】对具有线性相关关系的变量x,y,测得一组数据如下根据上表,利用最小二乘法得它们的回归直线方程为=10.5x+,据此模型预测当x=10时,y的估计值为()A. 105.5B. 106C. 106.5D. 107【答案】C【解析】根据表中数据,计算,,代入回归直线方程=10.5x+中,计算,∴回归直线方程为=10.5x+;当x=10时,y的估计值为=10.5×10+1.5=106.5.故选:C.5.【黑龙江省哈尔滨市第六中学2017-2018学年高二3月月考】下表是降耗技术改造后生产甲产品过程中记录的产量 (吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出关于的线性回归方程,那么表中的值为( )A. 4B. 3.15C. 4.5D. 3【答案】D6.【陕西省西北工业大学附属中学2017-2018学年高二上学期期中考试】假设关于某设备使用年限(年)和所支出的维修费用(万元)有如下统计资料:若对呈线性相关关系,则与的线性回归方程必过的点是()A . B. C. D.【答案】D【解析】∵,,∴这组数据的样本中心点是,∵线性回归方程过样本中心点,∴线性回归方程一定过点,故选D .7.【湖南省张家界市2017-2018年全市联考高二数学】为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为. 已知,,. 若该班某学生的脚长为24,据此估计其身高为A . 160B . 163C . 166D . 170【答案】C8.【广西钦州市2017-2018学年高二上学期期末考试】设回归方程为73y x ∧=-,当变量x 增加两个单位时( )A . y 平均增加3个单位B . y 平均减少3个单位C . y 平均增加6个单位D . y 平均减少6个单位【答案】D【解析】回归直线方程为73y x ∧=-, ∴变量x 增加两个单位时,函数值要平均增加6-个单位,即减少6个单位,故选D .9.【广西钦州市2017-2018学年高二上学期期末考试】某钢铁研究所经研究得到结论,废品率%x 和每吨生铁成本y (元)之间的回归直线方程为2562y x ∧=+,这表明( )A . 废品率每吨增加1%,生铁成本增加258元B . 废品率每吨增加1%,生铁成本增加2元C . 废品率每吨增加1%,生铁成本每吨增加2元D . 废品率不变,生铁成本为256元【答案】C与每吨生铁成本y (元)之间的相关关系,故回归直线方程为2562y x ∧=+时,表明废品率每增加,生铁成本每吨平均增加2元,故选C .10.【湖北省孝感市八校2017-2018学年高二上学期期末考试】下列说法中错误的是( )A . 先把高二年级的2000名学生编号为1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +, 100m +, 150m +的学生,这样的抽样方法是系统抽样法B . 线性回归直线y b x a ∧∧∧=+一定过样本中心点C . 若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1 D . 若一组数据1、a 、3的平均数是2【答案】C∴该组数据的方差是s 1﹣2)2+(2﹣2)2+(3﹣2)D 正确. 故选:C11.【湖南省长郡中学2017-2018学年高二上学期期末考试】下表是某小卖部统计出的五天中卖出热茶的杯数与当天气温的对比表:若卖出热茶的杯数y 与气温x 近似地满足线性关系,则其关系式最接近的是( )A . 6y x =+B . 42y x =-+C . 260y x =-+D . 378y x =-+【答案】C【解析】1813104024343951629,4255x y ++++++++====∴, 260y x =-+过点()9,42 ,选C .12.【四川省广安市2017-2018学年高二上学期期末考试】对变量,x y 有观测数据()(),1,2,,10i i x y i =⋯,得散点图(1);对变量,u v 有观测数据(()(),1,2,,10i i u v i =⋯,得散点图(2),由这两个散点图可以判断( )A . 变量x 与y 正相关, u 与v 正相关B . 变量x 与y 正相关, u 与v 负相关C . 变量x 与y 负相关, u 与v 正相关D . 变量x 与y 负相关, u 与v 负相关【答案】C二、填空题13.【四川省成都外国语学校2017-2018学年高二下学期入学考试】从某大学随机抽取的5名女大学生的身高x (厘米)和体重y (公斤)数据如下表;根据上表可得回归直线方程为0.9298ˆ 6.yx =-,则表格中空白处的值为________. 【答案】60,96.8=55,解得y =60,故答案为:60.14.【广东省中山一中、仲元中学等七校2017-2018学年高二3月联考】某农场农作物使用肥料量x 与产量y 的统计数据如下表:根据上表,可得回归方程y =bx +a 中的b 为9.4,据此模型,预报使用肥料量为6吨时产量为____吨. 【答案】65.5点睛:本题考查回归方程的求解及应用。
总结:线性回归分析的基本步骤
线性回归分析的基本步骤步骤一、建立模型知识点:1、总体回归模型、总体回归方程、样本回归模型、样本回归方程①总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。
Y X Uβ=+特点:由于随机误差项U 的存在,使得Y 和X 不在一条直线/平面上。
例1:某镇共有60个家庭,经普查,60个家庭的每周收入(X )与每周消费(Y )数据如下:每周收入(X )每周消费支出(Y )805560657075 100657074808588 1207984909498 140809395103108113115160102107110116118125 180110115120130135140 200120136140144145 220135137140152157160162240137145155165175189 260150152175178180185191作出其散点图如下:②总体回归方程(线):由于假定,因此因变量的均值与自变0EU =量总处于一条直线上,这条直线就称为总体回归线(方()|E Y X X β=程)。
总体回归方程的求法:以例1的数据为例1)对第一个X i ,求出E (Y |X i )。
每周收入(X )每周消费支出(Y )E (Y |X i )805560657075 65100657074808588 771207984909498 89140809395103108113115101160102107110116118125 113180110115120130135140 125200120136140144145 137220135137140152157160162149240137145155165175189 161260150152175178180185191173由于()01|i i i E Y X X ββ=+,因此任意带入两个X i 和其对应的E (Y |X i )值,即可求出01ββ一,并进而得到总体回归方程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
第69讲 线性和非线性回归模型的建立
【知识要点】
一、建立线性回归模型的基本步骤:
①确定研究对象,明确哪个是解释变量,哪个是预报变量;
②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系);
③由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程ybxa);
④按照公式计算回归方程中的参数(如最小二乘法),得到线性回归方程;
⑤得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
二、建立非线性回归模型的基本步骤:
①确定研究对象,明确哪个是解释变量,哪个是预报变量;
②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
③由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、指数
函数、对数函数模型等);
④通过换元,将非线性回归方程模型转化为线性回归方程模型;
⑤按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
⑥消去新元,得到非线性回归方程;
⑦得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
三、检查数据模型拟合效果的好坏,一般有三种方法.
方法一:通过残差分析,如果残差点比较均匀地落在水平的带状区域中,则说明选用的模型比较合适,
反之,不合适.
方法二:通过残差平方和分析,如果残差的平方和越小,则说明选用的模型比较合适,反之,不合适.
方法三:用相关系数来刻画回归的效果,其计算公式是:
2
2
121()1()niiniiyyRyy
其中iyy=真实值-预报值=残差,2R值越大,说明残差的平方和越小,也就是
说模型的拟合效果越好.
【方法讲评】
2
题型一 线性回归模型的建立
解题步骤
①确定研究对象,明确哪个是解释变量,哪个是预报变量;
②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线
性关系);
③由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方
程ybxa);
④按照公式计算回归方程中的参数(如最小二乘法),得到线性回归方程;
⑤得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型
是否合适等.
【例1】某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们
分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日 期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(°C) 10 11 13 12 8
发芽数y(颗)
23 25 30 26 16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取
的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关
于x的线性回归方程ybxa;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性
回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
(注:1122211()(),()nniiiiiinniiiixynxyxxyybaybxxnxxx)
所以43()1105PA. 故选取的2组数据恰好是不相邻2天数据的概率是53
3
(3)当x=10时,5ˆ103222y,|22-23|<2;
同样,当x=8时,5ˆ83172y,|17-16|<2.
所以,该研究所得到的线性回归方程是可靠的.
【点评】求回归直线的方程时,最好先计算好公式的基本量2211nniiiiixynxynxxyx、、、、、,再代入公
式求解.这样一是节省试卷的空间,另外是可以把握住得分点,千万不要一次性计算,如果一个地方出了错,
整个题目就一分都没有了.
【反馈检测1】经销商小王对其所经营的某一型号二手汽车的使用年数x(0<x≤10)与销售价格y(单
位:万元/辆)进行整理,得到如下的对应数据:
使用年数 2 4 6 8 10
售价 16 13 9.5 7 4.5
(Ⅰ)试求y关于x的回归直线方程;
(附:回归方程ybxa中,1221,niiiniixynxybaybxxnx
(Ⅱ)已知每辆该型号汽车的收购价格为20.051.7517.2wxx万元,根据(Ⅰ)中所求的回归方程,
预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大.
4
题型二 非线性回归模型的建立
解题步骤
①确定研究对象,明确哪个是解释变量,哪个是预报变量;
②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非
线性关系);
③由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用
反比例函数、指数函数、对数函数模型等);
④通过换元,将非线性回归方程模型转化为线性回归方程模型;
⑤按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
⑥消去新元,得到非线性回归方程;
⑦得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型
是否合适等.
【例2】在一次抽样调查测得样本的5个样本点,数值如下表:
x 0.25 0.5 1 2 4
y 16 12 5 2 1
试建立y与x的回归方程.
【解析】作出变量y与x之间的散点图如图所示:
5
由图可知变量y与x近似地呈反比例函数关系.设,kyx令1,tx则ykt,由y与x的数据表可得y
与t的数据表:
t 4 2 1 0.5 0.25
y 16 12 5 2 1
作出y与t的散点图如图所示:
【点评】(1)由y与x的散点图得到y与x不具备线性关系,近似地满足反比例函数kyx,所以不
能直接用最小二乘法求它们的回归方程. 怎么求呢?可以通过换元1,tx得到ykt,y与t近似满足线性
关系,可以利用最小二乘法求线性回归方程.(2)相比建立线性回归方程模型,建立非线性回归方程模型
多了两个步骤,即第四步通过换元,将非线性回归方程模型转化为线性回归方程模型,第六步去新元,得
到非线性回归方程。这个实际上,是数学中的转化的思想的具体运用.
6
【反馈检测2】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年
销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费xi和年销售量yi(i=1,2,3,..8)
数据作了初步处理,得到下面的散点图及一些统计量的值.
x
y
w
821()iixx 821()iiww 81()()iiixxyy 8
1()()iiiwwyy
46.6 563 6.8 289.8 1.6 1469 108.8
表中: 811,8iiiiwxww.
(Ⅰ)根据散点图判断,yabx与ycdx,哪一个适宜作为年销售量y关于年宣传费x的回
归方程类型(给出判断即可,不必说明理由);
(Ⅱ)根据(I)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x,y的关系为0.2zyx,根据(II)的结果回答下列问题:
(i)当年宣传费x=49时,年销售量及年利润的预报值时多少?
(ii)当年宣传费x为何值时,年利润的预报值最大?并求出最大值
高中数学常见题型解法归纳及反馈检测第69讲:
线性和非线性回归模型的建立参考答案
7
【反馈检测1答案】(I)ˆ1.4518.7yx;(II)预测当3x时,销售利润z取得最大值.
【反馈检测2答案】(Ⅰ)由散点图可以判断,ycdx适宜作为年销售量y关于年宣传费x的回归方
程类型;(Ⅱ)y关于x的回归方程为=100.6+68;(Ⅲ)(i)当x=49时,年销售量y的预报值y576.6,
年利润z的预报值z66.32;(ii)当x=46.24时,年利润的预报值最大.
【反馈检测2详细解析】(Ⅰ)由散点图可以判断,ycdx适宜作为年销售量y关于年宣传费x的回
归方程类型;
(Ⅱ)令wx,先建立y关于w的线性回归方程,由于108.6681.6d,
cydw
563﹣68×6.8=100.6,
所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68x,
(Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值y=100.6+6849=576.6,
年利润z的预报值z=576.6×0.2﹣49=66.32,
(ii)根据(Ⅱ)的结果可知,年利润z的预报值z=0.2(100.6+68x)﹣x=﹣x+13.6x+20.12,
当x=13.62=6.8,即x=46.24千元时,年利润的预报值最大.