(新)高中数学第三章统计案例1_3可线性化的回归分析知识导航北师大版选修2-3
高中数学 第三章 统计案例 1.3 可线性化的回归分析课件 北师大版选修23

解答
当堂训练
1.指数曲线y=3e-2x的图像为图中的
√
解析 ∵y=3e-2x,∴y>0,排除A、C.又x∈R,排除D.
1234
解析 答案
2.对于指数曲线y=aebx,令u=ln y,c=ln a,经过非线性化回归分析之
后,可以转化成的形式为
√A.u=c+bx
C.y=b+cx
B.u=b+cx D.y=c+bx
1234
解析 答案
规律与方法
1.对于具有非线性相关关系的两个变量,可以通过对变量进行变换, 转化为线性回归问题去解决. 2.建立回归模型的步骤 (1)确定研究对象,明确变量关系. (2)画出散点图,观察变量之间的关系. (3)由经验确定回归方程的类型. (4)按一定规则估计回归方程中的参数.
本课结束
解答
(2)利用所得的函数模型,预测x=10时y的值. 解 当 x=10 时,y=361.095-11.3=-7.605.
解答
反思与感悟
实际问题中非线性相关的函数模型的选取 (1)采集数据,画出散点图. (2)根据散点图中点的分布状态,选取所有可能的函数类型. (3)作变量代换,将函数转化为线性函数. (4)作出线性相关的散点图,或计算线性相关系数r,通过比较选定函数 模型. (5)求回归直线方程,并检查. (6)作出预报.
解析 对方程y=aebx两边同时取对数,然后将u=ln y,c=ln a代入,不 难得出u=c+bx.
1234
解析 答案
3.在一次试验中,当变量 x 的取值分别为 1,12,13,14时,变量 y 的值分别
为 2,3,4,5,则 y 与1x的回归方程为
√A.y=1x+1
B.y=2x+3
C.y=2x+1
高中数学 第三章 第三课时 可线性化的回归分析教案 北师大版选修2-3

江西省九江市实验中学高中数学 第三章 第三课时 可线性化的回归分析教案 北师大版选修2-3一、教学目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学方法:讨论交流,探析归纳四、教学过程:(一)、复习引入:1、给出例题:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程. /y 个 (学生描述步骤,教师演示)2、讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.(二)、新课探究:1. 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的关系如下:方程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:(1)、用回归方程探究非线性回归问题的方法、步骤.(2)、化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.(1)b y a x =+,令'y y =,1'x x =,则有''y a bx =+. (2)b y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+.(4)bx y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.(三)、巩固练习:为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(2)试求出预报变量对解释变量的回归方程。
高中数学第三章统计案例1.1回归分析1.2相关系数ppt课件北师大版选修2_3

19 解答
(2)画出散点图; 解 散点图如下:
2021/5/26
20 解答
(3)求纯获利y与每天销售件数x之间的回归方程.
7
7
解 因为 xiyi=3 487, x2i =280,
i=1
i=1
7
xiyi-7 x y
i=1
3 487-7×6×79.86
所以 b=
7
= 280-7×62 ≈4.75.
2021/5/26
8 答案
思考2
怎样通过相关系数刻画变量之间的线性相关关系?
答案 |r|值越接近1,变量之间的线性相关程度越高;|r|值越 接近0,变量之间的线性相关程度越低;当r=0时,两个变量线 性不相关.
2021/5/26
9 答案
梳理
(1)相关系数 r 的计算公式 r=
n
∑xiyi-n x y
=bx+a;
4
解 因为 xiyi=6×2+8×3+10×5+12×6=158,
i=1
6+8+10+12
2+3+5+6
x=
4
=9, y =
4
=4,
4
x2i =62+82+102+122=344,
i=1
所以 b=15384-4-4×4×9×924=2104=0.7,
a= y -b x =4-0.7×9=-2.3,
2021/5/26
22 解答
(2)求日销售量y对销售单价x的线性回归方程;
2021/5/26
24 解答
(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式, 并预测当销售单价x为多少元时,才能获得最大日销售利润. 解 依题意,有P=(161.5-3x)(x-30)=-3x2+251.5x-4 845 =-3(x-2561.5)2+25112.52-4 845. 所以当 x=2561.5≈42 时,P 有最大值,约为 426 元. 即预测当销售单价为42元时,能获得最大日销售利润.
(新)高中数学第三章统计案例1_1回归分析同步测控北师大版选修2-3

高中数学第三章统计案例 1.1 回归分析同步测控北师大版选修2-3我夯基,我达标1.对有线性相关关系的两个变量建立的回归直线方程y=a+bx中,回归系数b()A.可以小于0B.大于0C.能等于0D.只能小于0解析:b可能大于0,也可能小于0,但当b=0时,x、y不具有线性相关关系.答案:A2.设有一个回归方程为y=2-2.5x,则变量x增加一个单位时,则()A.y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位解析:斜率的估计值为-2.5,即x每增加1个单位时,y平均减少2.5个单位.答案:C3.工人月工资y(元)依劳动生产率x(千元)变化的回归方程y=50+80x,下列判断不正确的是()①当劳动生产率为1 000元时,工资为130元②劳动生产率提高1 000元,则工资提高80元③劳动生产率提高1 000元,则工资提高130元④当月工资为210元时,劳动生产率为2 000元A.①B.②C.③D.④答案:C4.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A.y=x+1B.y=x+2C.y=2x+1D.y=x-1解析:A、B、C、D四点共线,都在直线y=x+1上.答案:A5.已知x、y之间的数据如下表所示,则y与x之间的线性回归方程过点()A.(0,0)B.(x,0)C.(0,y)D.(x,y)解析:由a=y-b x,知y=a+b x,即回归直线y=a+bx一定过点(x,y).答案:D6.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其回归方程中的截距为()A.a=y-bxB.a=y-b xC.a=x-b yD.a=y+b x解析:a=y-b x.答案:B我综合,我发展7.为了考查两个变量x和y之间的线性关系,甲、乙两同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线方程分别为l1和l2,已知两人测验数据中,变量x 和y的数据的平均值都相等,且分别为s,t,则两条回归直线l1与l2的位置关系一定是________________.解析:∵l1与l2都过点(s,t),故l1与l2相交于点(s,t).答案:l1与l2相交于点(s,t)8.若施化肥量x与小麦产量y之间的回归直线方程为y=250+4x,当施化肥量为50 kg时,预计小麦产量为____________________.答案:450 kg我创新,我超越i123456789 x i 1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0 y i 4.8 5.77.08.310.912.413.113.615.3分析:作出散点图观察满足线性关系,列表代入求值.解:散点图如下图所示.由图知所有数据点接近直线排列,因此认为y对x有线性回归关系是成立的.根据已知数据序号x i y i x i y i x i2y i21 1.5 4.87.2 2.2523.042 1.8 5.710.26 3.2432.493 2.47.016.8 5.7649.04 3.08.3 24.99.068.895 3.510.938.1512.25118.816 3.912.448.3615.21153.767 4.413.1 57.6419.36171.618 4.813.665.2823.04184.969 5.015.376.525.0234.09∑=91i30.391.1 345.09115.11 1 036.65 ∴x=3.366,y=10.122 2,b=∑∑==--91229199i ii iixxyx yx=2366.3911.1151222.10366.39.345⨯-⨯⨯≈2.930 3,a=y -b x =0.258 8.∴所求的回归直线方程为 y=0.258 8+2.930 3x.10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个数.现观测得到(x,y )的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y 与x 之间存在线性相关关系,求y 与x 之间的回归直线方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少?(精确到1)分析:利用公式求出回归方程并解不等式. 解:设回归方程为y=a+bx , 则x =41614128+++=12.5,y =411985+++=8.25,∑=412i ix=660,∑=41i ii yx =438,b=70515.12466025.85.124438442412241=⨯-⨯⨯-=--∑∑==i i i iixx yx yx , a=y -b x =8.25-7051×12.5=-76, ∴所求回归方程为y=-76+7051x.(2)由y≤10,即-76+7051x≤10,得x≤51760≈15,即机器速度不得超过15转/秒.。
教育最新K122017_2018版高中数学第三章统计案例1.3可线性化的回归分析学案北师大版选修2_3

1.3 可线性化的回归分析学习目标 1.理解回归分析的基本思想.2.通过可线性化的回归分析,判断几种不同模型的拟合程度.知识点一 常见的可线性化的回归模型幂函数曲线____________,指数曲线____________. 倒指数曲线____________,对数曲线____________. 知识点二 可线性化的回归分析思考1 有些变量间的关系并不是线性相关关系,怎样确定回归模型?思考2 如果两个变量呈现非线性相关关系,怎样求出回归方程?梳理 在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,它们之间可能呈指数关系或对数关系等非线性关系.在某些情况下可以借助线性回归模型研究呈非线性关系的两个变量之间的关系.类型一 给定函数模型,求回归方程例1 在彩色显影中,由经验可知:形成染料光学密度y 与析出银的光学密度x 由公式y =A e bx(b <0)表示.现测得试验数据如下:试求y 对x 的回归方程.跟踪训练1 在试验中得到变量y 与x 的数据如下表:由经验知,y 与1x之间具有线性相关关系,试求y 与x 之间的回归曲线方程,当x 0=0.038时,预测y 0的值.类型二 选取函数模型,求回归方程 例2 下表所示是一组试验数据:(1)作出散点图,并猜测y 与x 之间的关系; (2)利用所得的函数模型,预测x =10时y 的值.反思与感悟 实际问题中非线性相关的函数模型的选取 (1)采集数据,画出散点图.(2)根据散点图中点的分布状态,选取所有可能的函数类型. (3)作变量代换,将函数转化为线性函数.(4)作出线性相关的散点图,或计算线性相关系数r ,通过比较选定函数模型. (5)求回归直线方程,并检查. (6)作出预报.跟踪训练2 对两个变量x ,y 取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下: 甲 y =0.1x +1,乙 y =-0.05x 2+0.35x +0.7,丙 y =-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.1.指数曲线y =3e-2x 的图像为图中的( )2.对于指数曲线y =a e bx,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( ) A .u =c +bx B .u =b +cx C .y =b +cxD .y =c +bx3.在一次试验中,当变量x 的取值分别为1,12,13,14时,变量y 的值分别为2,3,4,5,则y 与1x的回归方程为( )A .y =1x +1B .y =2x+3C .y =2x +1D .y =x -14.某地今年上半年患某种传染病的人数y (人)与月份x (月)之间满足函数关系,模型为y =a e bx ,确定这个函数解析式为________________.1.对于具有非线性相关关系的两个变量,可以通过对变量进行变换,转化为线性回归问题去解决.2.建立回归模型的步骤(1)确定研究对象,明确变量关系. (2)画出散点图,观察变量之间的关系. (3)由经验确定回归方程的类型. (4)按一定规则估计回归方程中的参数.答案精析问题导学 知识点一y =ax by =a e bxy =a e b xy =a +b ln x知识点二思考1 首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之间的关系.这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.思考2 可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程. 题型探究例1 解 由题意知,对于给定的公式y =A e b x(b <0)两边取自然对数,得ln y =ln A +b x,与线性回归方程相对照可以看出,只要取u =1x,v =ln y ,a =ln A ,就有v =a +bu .这是v 对u 的线性回归方程,对此我们再套用相关性检验,求回归系数b 和a .题目中所给的数据由变换u =1x,v =ln y ,变为如下表所示的数据.可求得b ≈-0.146,a ≈0.548, ∴v =0.548-0.146u .把u 和v 转换回来,可得ln y =0.548-0.146x.∴y =0.1460.548ex-=e0.548·0.146ex-≈1.730.146e x-,∴回归曲线方程为y =1.730.146ex-.跟踪训练1 解 令z =1x,则y =a +bz ,由已知数据制成下表:计算得z =30.373 9,y =43.120 0,∑5i =1z i y i =6 693.002 6,∑5i =1z 2i =5 107.859 8. ∴5z y =6 548.612 8,5z 2=4 612.869 0.于是有b =∑5i =1z i y i -5z y∑5i =1z 2i -5z2=6 693.002 6-6 548.612 85 107.859 8-4 612.869 0≈0.291 7.∴a =y -b z ≈34.26.∴y 与x 之间的回归曲线方程是y =34.26+0.291 7x.当x 0=0.038时,y 0≈41.94,即y 0的值约为41.94.例2 解 (1)散点图如图所示,从散点图可以看出y 与x 不具有线性相关关系.根据已有知识发现样本点分布在函数y =b x+a 的图像的周围,其中a ,b 为待定参数,令x ′=1x,y ′=y ,由已知数据制成下表:x ′=6,y ′=210.4,故∑5i =1x ′2i -5(x ′)2=40, ∑5i =1y ′2i -5(y ′)2=54 649.2, r =7 790-5×6×210.440×54 649.2≈0.999 7,由于r 非常接近于1,∴x ′与y ′具有很强的线性关系,计算知,b ≈36.95,a =210.4-36.95×6=-11.3,∴y ′=-11.3+36.95x ′,∴y 对x 的回归曲线方程为y =36.95x-11.3.(2)当x =10时,y =36.9510-11.3=-7.605.跟踪训练2 解 甲模型,当x =1时,y =1.1;当x =2时,y =1.2; 当x =3时,y =1.3;当x =4时,y =1.4. 乙模型,当x =1时,y =1;当x =2时,y =1.2; 当x =3时,y =1.3;当x =4时,y =1.3. 丙模型,当x =1时,y =1;当x =2时,y =1.2; 当x =3时,y =1.3;当x =4时,y =1.35.观察4组数据并对照知,丙的数学模型更接近于客观实际. 当堂训练 1.B 2.A 3.A 4.y =e3.910 3+0.090 5x解析 设u =ln y ,c =ln a ,得u =c +bx , 则u 与x 的数据关系如下表:由上表,得∑6i =1x i =21,∑6i =1u i =25.36,∑6i =1x 2i =91,∑6i =1u 2i =107.339, ∑6i =1x i u i =90.35,x =3.5,u =4.227,∴b =∑6i =1x i u i -6x u∑6i =1x 2i -6x 2=90.35-6×3.5×4.22791-6×3.52≈0.090 5. c =u -b x =4.227-0.090 5×3.5=3.910 3,∴y =e3.910 3+0.090 5x。
高中数学 第三章 统计案例教案 北师大版选修23

第三章统计案例§1回归分析1.1 回归分析(教师用书独具)●三维目标1.知识与技能(1)了解回归分析的基本思想,会对两个变量进行回归分析.(2)明确建立回归模型的基本步骤,并对具体问题进行回归分析.(3)会解决实际问题.2.过程与方法(1)通过实际问题去理解回归分析的必要性,明确回归分析的基本思想.(2)从散点图中的点的分布上,发现直接求回归直线方程存在明显不足,从中引导学生去发现解决问题的新思路——进行回归分析.3.情感、态度与价值观(1)培养学生用整体的观点和互相联系的观点,来分析问题.(2)进一步加强数学的应用意识,培养学生学好数学、用好数学的信心.(3)加强与现实生活中的联系,以科学的态度评价两个变量的相关关系.●重点难点重点:掌握回归分析的步骤、相关系数、建立回归模型的步骤;体会有些非线性模型通过变换,可以转化为线性回归模型;在解决实际问题的过程中寻找更好的建型方法.难点:求线性回归方程的系数a,b;相关系数;选择不同的模型建模.回归分析主要是研究两个变量间的关系,是在必修三的基础上学习,教材的1.1回归分析是复习必修三的内容,为了使建立回归方程有意义,提出了相关系数,这与回归直线中b的系数有关联,教师可通过实例,让学生了解相关系数的大小与线性相关的关系;在现实中又有一种非线性的相关性,如何解决引导学生转化为线性关系,主要通过数形结合思想、函数思想,使问题化归为线性关系,教学中可通过提醒、猜想、练习等方法,使学生掌握本节的重点内容.(教师用书独具)●教学建议建议本节课用3课时讲解完成.教学中通过组织学生自己动手操作计算、观察、分析、交流、讨论、归纳让他们在探究学习中经历知识形成的全过程,从而形成“自主探究、合作交流”的数学学习方法.教师在课堂上可以用计算机软件进行参数的估计、相关系数的计数,让学生掌握利用计算器进行线性回归方程的求解和评价.●教学流程第1课时以实际问题作为课题引入.⇒回顾建立回归直线方程的基本步骤.⇒通过实例巩固、体验线性回归直线方程的求法及应用.⇒第2课时提出新问题,如何用其他方法刻画变量之间的线性相关.⇒师生共同探究,得出相关系的概念及相关系数的大小与线性相关之间的关系.⇒通过例题,巩固验证相关系数刻画变量之间的线性相关的特点.⇒第3课时引导学生探究如果不是线性回归模型,如何估计参数,能否利用线性回归模型.⇒对数据进行分析变换后,对新数据建立线性模型.⇒转化为原来变量模型,得出结论,总结建模思想,补充拓展.⇒课堂小结并完成当堂双基达标,巩固本节所学知识.课标解读 1.通过实例掌握回归分析的基本思想方法.2.利用最小二乘法会求线性回归直线方程,并能用线性回归直线方程进行预报.变量之间的相关关系【问题导思】1.正方形的面积S 与其边长a 是什么关系?圆的周长l 与半径r 是什么关系? 【提示】 ∵S =a 2,l =2πr , ∴它们都是确定的函数关系.2.父亲的身高与儿子的身高之间有何关系?耕种深度与水稻产量之间有何关系? 【提示】 非确定关系.1.变量之间有一定的联系,但不能完全用函数来表达.如人的体重y 与身高x .一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是非确定性关系,因变量的取值具有一定的随机性.2.在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常把这种图叫作变量之间的散点图.线性回归方程【问题导思】1.确定线性回归方程,只需得出哪两个量?【提示】 确定线性回归直线方程,只需确定a ,b 两个量即可.2.在线性回归方程y =a +bx 中,当一次项系数b 为正数时,说明两个变量有何相关关系?在散点图上如何反映? 【提示】 说明两个变量正相关,在散点图上自左向右看这些点呈上升趋势.假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设线性回归方程为y =a +bx ,要使这n 个点与直线y =a +bx 的“距离”平方之和最小,即使得Q (a ,b )=(y 1-a -bx 1)2+(y 2-a -bx 2)2+…+(y n -a -bx n )2达到最小,a ,b 需满足b =∑nb =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x .由数据求线性回归方程已知x ,y 之间一组数据:x 0 1 2 3 y1357(1)分别计算:x 、y 、x 1y 1+…+x 4y 4,x 21+x 22+…+x 24; (2)求出线性回归方程y =bx +a .【思路探究】 可利用表格的数直接计算,然后把这些结果代入线性回归方程系数公式,分别求得a ,b ,再求出线性回归方程. 【自主解答】 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+…+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+…+x 24=02+12+22+32=14;(2)b =x 1y 1+x 2y 2+x 3y 3+x 4y 4-4x yx 21+x 22+x 23+x 24-4x 2=34-4×1.5×414-4×1.52=2;a =y -b x =4-2×1.5=1.故y =2x +1.答:(1)所求的值分别为:1.5,4,34,14; (2)所求的线性回归方程是:y =2x +1.求线性回归方程的步骤:(1)列表求出x ,y ,∑ni =1x 2i ,∑ni =1x i y i ;(2)利用公式b =∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x ,求出b ,a ;(3)写出线性回归方程.观察两相关量得如下数据:x -1 -2 -3 -4 -5 5 3 4 2 1 y-9-7-5-3-115379求两变量间的回归方程. 【解】 列表i 12345678910 x i-1-2-3-4-55342 1 y i-9-7-5-3-115379 x2i1491625259164 1 x i y i9141512551512149由此可得x=0,y=0,∑10i=1x2i=110,∑10i=1x i y i=110,b=∑10i=1x i y i-10x y∑10 i=1x2i-10x2=110-10×0110-10×0=1,a=y-b x=0,∴所求回归方程为y=x.求实际问题的回归方程某企业想通过做广告来提高自己的知名度,经预测可知本企业产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:x 24568y 3040605070(1)判断y与x是否具有线性相关关系;(2)求回归直线方程.【思路探究】先画出散点图,即可判断y与x是否具有相关关系,如果y与x具有相关关系可将有关数据代入公式求得回归直线方程.【自主解答】(1)散点图如图所示:根据散点图可知,所给的数据点都在一条直线的附近,所以y与x具有线性相关关系.(2)列出下表,并且科学地的进行有关计算.i 1234 5x i24568y i3040605070x i y i60160300300560x=5,y=50,∑5 i=1x2i=145,∑5i=1y2i=135 000,∑5i=1x i y i=1 380于是可得,b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=1 380-5×5×50145-5×52=6.5,a=y-b x=50-6.5×5=17.5,于是所求的回归直线方程是y=6.5x+17.5.对一级数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a、b的计算公式,算出a、b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:汞含量x 2 4 6 8 10 消光系数y64138205285360(1)作散点图;(2)如果y 与x 之间具有线性相关关系,求线性回归方程. 【解】 (1)散点图如图.(2)由散点图可知,y 与x 呈相关关系,设线性回归方程为:y =bx +a .经计算:得x =6,y =210.4,∑5i =1x 2i =220,∑5i =1x i y i =7 790.∴b =7 790-5×6×210.4220-5×62=36.95, a =210.4-36.95×6=-11.3.∴线性回归方程为y =36.95x -11.3.利用回归直线方程进行统计某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:x 35 40 45 50 y 56 41 28 11(1)画出散点图,并判断y 与x 是否具有线性相关关系; (2)求日销售量y 对销售单价x 的线性回归方程;(3)设经营此商品的日销售利润为P 元,根据(2)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.【思路探究】 两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值.【自主解答】 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)∵x =14×(35+40+45+50)=42.5,y =14×(56+41+28+11)=34,∑4i=1x i y i=35×56+40×41+45×28+50×11=5 410,∑4i=1x2i=352+402+452+502=7 350,∴b=∑4i=1x i y i-4x·y∑4 i=1x2i-4x2=5 410-4×42.5×347 350-4×42.52=-370125=-2.96.∴a=y-b x=34-(-2.96)×42.5=159.8.∴y=-2.96x+159.8.(3)依题意有P=(-2.96x+159.8)(x-30)=-2.96x2+248.6x-4 794,∴当x=248.62×2.96≈42时,P有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润.1.b=-2.96是斜率的估计值,说明单价每增加一个单位,日销售量就减少2.96. 2.借助于回归方程对实际问题的估计值是个近似值,不是一个准确值.假设关于某设备的使用年限x 和所支出的维修费y (万元)有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系. (1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少万元? 【解】 (1)列表如下:ix iy ix 2ix i y i1 2 2.2 4 4.4 2 3 3.8 9 11.4 3 4 5.5 16 22.0 4 5 6.5 25 32.5 5 6 7.0 36 42.0 ∑202590112.3由此可得:x =4,y =5.进而可以求得b =∑5i =1x i y i -5x y∑5i =1x 2i -5x2=1.23,a =y -b x =0.08.∴线性回归方程为y =0.08+1.23x .(2)当x =10时,y =0.08+1.23×10=12.38(万元),即估计使用10年时维修费用是12.38万元.数形结合思想在回归分析中的应用(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨标准煤)与相应的生产能耗y(吨标准煤)的几组对照数据.x 345 6y 2.534 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【思路点拨】(1)可直接由表格提供的点,列出散点图;(2)可利用线性回归方程中a,b公式直接求解;(3)直接用方程来估计所求值.【规范解答】(1)图形如图所示.3分(2)x =3+4+5+64=4.5;y =2.5+3+4+4.54=3.5;∑4i =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5.∑4i =1x 2i =32+42+52+62=86. 6分∴b =∑4i =1x i y i -4x ·y ∑4i =1x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7, 8分 a =y -b x =3.5-0.7×4.5=0.35. 9分∴y =0.7x +0.35. 10分 (3)现在生产100吨甲产品用煤y =0.7×100+0.35=70.35,∴降低90-70.35=19.65吨标准煤. 12分线性回归方程的应用(1)描述两变量间的依存关系;(2)利用回归方程可进行预测;(3)利用回归方程还可以进行统计控制.1.作回归分析要有实际意义.2.回归分析前,最好先做出散点图.3.应用回归分析预测时,最好先作出散点图.1.下列说法正确的是( )A.任何两个变量都具有相关关系B.球的体积与该球的半径具有相关关系C.农作物的产量与施化肥量之间是一种确定性的关系D.某商品的生产量与该商品的销售价格之间是一种非确定性的关系【解析】两个变量之间的关系有两种,即函数关系与相关关系,故A错误.B中球的体积与该球的半径是函数关系.C中农作物的产量与施化肥量之间不是严格的函数关系,但是具有相关关系,因而是非确定性的关系.D中商品的生产量还和市场需求有关,故商品的生产量与该商品的销售价格之间是非确定性的关系.故选D.【答案】 D2.一位母亲记录了儿子3岁~9岁的身高(数据略),由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归模型为y=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是( )A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm以下D.身高在145.83 cm左右【解析】x=10时,y=7.19×10+73.93=145.83,但这是预测值而不是精确值,所以只能选D.【答案】 D3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的线性回归方程为________.【解析】通过检验A,B,C,D四点共线,都在直线y=x+1上.【答案】y=x+14.已知一个回归直线方程为y=1.5x+45,x∈{1,7,5,13,19},求y.【解】由已知可知:x=1+7+5+13+195=9.又∵回归直线过点(x,y),∴y =1.5x +45,即y =1.5×9+45=58.5.一、选择题1.对具有线性相关关系的两个变量建立的线性回归方程y =a +bx 中,回归系数b ( ) A .可以小于0 B .只能大于0 C .可能等于0D .只能小于0【解析】 b 可能大于0,也可能小于0,但当b =0时,x ,y 不具有线性相关关系. 【答案】 A2.下列两个变量间的关系不是函数关系的是( ) A .正方体的棱长与体积 B .角的弧度数与它的正弦值C .单产为常数时,土地面积与粮食总产量D .日照时间与水稻亩产量【解析】 ∵A 、B 、C 都可以得出一个函数关系式,而D 不能写出确定的函数关系式,它只是一个不确定关系. 【答案】 D3.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.36万元 B .65.5万元 C .67.7万元D .72.0万元【解析】 x =4+2+3+54=3.5,y =49+26+39+544=42,∴a=y-b x=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B.【答案】 B4.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y)B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(x n,b n)中的一个点C.直线y=bx+a的斜率为∑ni=1x i y i-n x·y∑ni=1x2i-n x2D.直线y=bx+a的纵截距为y-b x【解析】回归直线可以不经过任何一个点.其中A:由a=y-b x代入回归直线方程y=bx+y-a x,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B5.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是( )A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A二、填空题6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1x i y i=1 481.b =1 481-6×72×7179-6×722≈-1.818 2,a =71-(-1.818 2)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】 由上表可得,y =-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元. 【答案】 1.818 28.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 【答案】 0.254 三、解答题9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x /年 3 5 6 7 9 推销金额y /万元23345(1)求年推销金额y 关于工作年限x 的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 【解】 (1)设所求的线性回归方程为y =bx +a ,则b =∑i =15x i -xy i -y∑i =15x i -x2=1020=0.5, a =y -b x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y =0.5x +0.4. (2)当x =11时,y =0.5x +0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个数.现观测得到(x ,y )的4组值为(8,5),(12,8),(14,9),(16,11).(1)假设y 与x 之间存在线性相关关系,求y 与x 之间的线性回归方程.(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】 (1)设回归方程为y =a +bx ,则x =8+12+14+164=12.5,y =5+8+9+114=8.25, ∑4i =1x 2i =660,∑4i =1x i y i =438,b =∑4i =1x i y i -4x y∑4i =1x 2i -4x2=438-4×12.5×8.25660-4×12.52≈0.73, a =y -b x =8.25-0.73×12.5=-0.875,所以所求回归方程为y =-0.875+0.73x .(2)由y ≤10,即-0.875+0.73x ≤10,得x ≤10.8750.73≈15,即机器速度不得超过15转/秒.11.高二(3)班学生每周用于数学学习的时间x (单位:小时)与数学成绩y (单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y92799789644783687159若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】 显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 x i 24 15 23 19 16 11 20 16 17 13 y i 927997896447 83687159 x i y i2 208 1 185 2 231 1 691 1 024 5171 660 1 088 1 207767∑10i =1x 2i=3 182,∑10i =1x i y i=13 578于是可得b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2=545.4154.4≈3.53,a=y-b x=74.9-3.53×17.4≈13.5.因此可求得回归直线方程为y=3.53x+13.5.当x=18时,y=3.53×18+13.5≈77.故该同学预计可得77分左右.(教师用书独具)在一段时间内,某种商品的价格x(万元)和需求量y(t)之间的一组数据如下表所示:价格x 1.4 1.6 1.82 2.2需求量y 121075 3(1)画出散点图;(2)求出y对x的回归直线方程;(3)如价格定为1.9万元,预测需求量大约是多少.(精确到0.01 t)【思路探究】先根据所给数据画出散点图,判断y与x是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识预测需求量.【自主解答】(1)散点图如图所示.(2)采用列表的方法计算a与回归系数b.序号x i y i x2i x i y i1 1.412 1.9616.82 1.610 2.56163 1.87 3.2412.64 25 4 105 2.2 3 4.84 6.6Σ9 37 16.6 62x=15×9=1.8,y=15×37=7.4,b=62-5×1.8×7.416.6-5×1.82=-11.5,a=7.4+11.5×1.8=28.1.所以y对x的回归直线方程为y=a+bx=28.1-11.5x.(3)当x=1.9时,y=28.1-11.5×1.9=6.25,所以价格定为1.9万元时,需求量大约是6.25 t.解答本类题目的关键首先应先通过散点图来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程,在此基础上,借助回归方程对实际问题进行预测.已知10只狗的血球体积x(单位:mm3)及红血球数y(单位:百万)的测量值如下:x 45424648423558403950y 6.53 6.309.257.50 6.99 5.909.49 6.20 6.557.72(1)画出散点图;(2)求出y对x的回归线性方程;(3)若血球体积为49 mm3,预测红血球数大约是多少?【解】(1)散点图如图(2)设线性回归方程为y =bx +a ,由表中数据代入公式,得b =∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.16,a =y -b x ≈0.12.所以所求线性回归方程为y =0.16x +0.12. (3)把x =49代入线性回归方程得:y =0.16×49+0.12≈7.96(百万),计算结果表明,当血球体积为49 mm 3时,红血球数大约为7.96百万.拓展阅读GDDS 和SDDS随着世界经济一体化的加快,各国间的交流与合作越来越频繁,为加强国际组织对各国经济运行状况的监督,国际社会在各领域纷纷建立了国际通行标准,其中国际货币基金组织(简称IMF)制定的数据公布通用系统(简称GDDS)和数据公布特殊标准(简称SDDS).GDDS 的主要内容和要求:在统计范围内,它将国民经济活动划分为5大经济部门,对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据.系统提出了五大部门综合框架和相关的数据类别和指标编制、公布的目标.选定的数据类别和指标中规定为主要部分.SDDS 将国民经济活动划分为4大经济部门.选定的数据类别分为:必须的、受鼓励的和“视相关程度”三类.必须的数据类别包括:综合统计框架、跟踪性数据、与部门有关的其他数据.IMF 为什么制定GDDS 和SDDS 呢?进入20世纪90年代以来,世界一些地区金融危机频繁爆发.1994年墨西哥的金融危机、1997年东南亚金融危机都导致国际金融市场剧烈动荡.两次金融危机给IMF 一个深刻的教训,也对其职能提出了挑战,在总结经验教训的基础上,IMF 认为,在新的国际经济、金融形势下,必须制定统一的数据发布标准,使各成员国按照统一程序提供全面、准确的经济金融信息,从而可以有效及时地对各国的经济进行正确的分析预测,从宏观上来作出调控,减少金融危机的发生和影响.1.2 相关系数课标解读 1.了解两个随机变量间的线性相关系数r ,并能利用公式求出相关系数r ;了解正相关、负相关、不相关的概念. 2.能利用相关系数r 判断两个随机变量间线性相关程度的大小,从而判断回归直线拟合的效果.相关系数【问题导思】1.有什么办法判断两个变量是否具有线性相关关系?【提示】 作出散点图,看这些点是否在某一直线的附近,计算线性相关系数. 2.线性相关系数与最小误差有何关系? 【提示】 Q (误差)=l yy (1-r 2).3.相关系数r 的绝对值的大小对相关性有何影响?【提示】 |r |越大,变量之间的相关程度越高;|r |越小,变量间线性相关程度越低;当r =0时,两个变量线性不相关.4.r 的正负对相关性的影响. 【提示】 r >0,b =l xyl xx>0两变量正相关; r <0,b =l xyl xx<0,两变量负相关.1.判断两个变量之间的线性相关关系的方法有: (1)计算线性相关系数r . (2)画散点图.2.假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r =l xyl xx l yy=∑ni=1x i-x y i-y∑ni=1x i-x2i=1ny i-y2=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y2相关系数及其应用维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度18202224262830(克/升)缩醛化度26.8628.3528.7528.8729.7530.0030.36(克分子%)求相关系数r.【思路探究】可直接利用相关系数r的公式直接计算.【自主解答】列表如下:i x i y i x2i x i y i y2i11826.86324483.48721.459 622028.35400567803.722 532228.75484632.5826.562 542428.87576692.88833.476 952629.75676773.5885.062 562830.0078484090073030.36900910.80921.729 6∑168202.94 4 144 4 900.16 5 892.013 6 x=24,y=28.99,r=∑7i=1x i y i-7x y∑7i=1x2i-7x2∑7i=1y2i-7y2=4 900.16-7×24×28.994 144-7×242×5 892.013 6-7×28.992≈0.94.当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.下列是小麦产量与施化肥量的一组观测数据:施化肥量15202530354045小麦产量320330360410460470480 判断施化肥量与水稻产量是否有相关关系.【解】i x i y i x2i y2i x i y i115320225102 400 4 800220330400108 900 6 600325360625129 6009 000430410900168 10012 300535460 1 225211 60016 100640470 1 600220 90018 800745480 2 025230 40021 600∑210 2 8307 000 1 171 90089 200∴r=∑i=17x i y i-7x y∑i=17x2i-7x2∑i=17y2i-7y2=4 300700×27 771.43≈0.975.由于r=0.975>0,因此施化肥量和水稻产量近似成线性正相关关系.线性回归分析的综合应用“阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近地区大学生人数的关系,随机抽取十个分店的样本,得到数据如下:店铺编号 区内大学生数(万人)季度销售额(万元)1 0.2 5.8 2 0.6 10.53 0.8 8.84 0.8 11.85 1.2 11.76 1.6 13.7 7 2 15.78 2 16.9 9 2.2 14.9 10 2.620.2(1)试对区内大学生人数与店铺的销售额的关系进行相关性检验;(2)试根据这些数据建立回归模型,然后再进一步根据回归方程预测一个区内大学生人数1万人店铺的季度销售额; (3)若店铺的季度销售额低于10万元则亏损,试求建店区内大学生人数至少约多少人?【思路探究】 先根据表中的数据作相关检验,然后判断是否具有相关关系,再根据所给的数据解出线性回归方程,最后进行预测. 【自主解答】 (1)根据数据我们对区内大学生人数x 与店铺季度销售额y 作相关检验.根据数据可知:x =110(0.2+0.6+…+2.6)=1.4;y =110(5.8+10.5+…+20.2)=13,∑10i =1x 2i -10x 2=5.68,∑10i =1x i y i -10x y =28.4,∑10i =1y 2i -10y 2=157.3,因此r =28.45.68×157.3≈0.95;|r |接近1,因此有把握认为区内大学生人数x 与店铺季度销售额y 具有线性相关关系,求y 对x 的回归直线方程有意义.(2)回归系数b =28.45.68=5,a =13-5×1.4=6.因此回归直线方程是y=bx+a=5x+6.当x=1时,y=5×1+6=11,即区内大学生人数1万元店铺的季度销售额约11万元.(3)由回归直线方程是y=5x+6.令y≥10,解得x≥0.8,所以当建店区内大学生人数至少8 000人时才适合建店.进行相关性检验主要有两种常用方法,一是作散点图,观察所给的数据点是否在一条直线的附近,作散点图的优点是既直观又方便,是解决相关性检验问题比较常用的方法;缺点是作图总是存在误差,有时很难判断这些点是不是分布在一条直线的附近.二是利用样本相关系数对其进行相关性检验,优点是判断准确,缺点是计算繁琐,但可以借助计算器进行处理.在我国某地的一个县城,近期发现了好几个癌症村.政府部门十分震惊,马上组成调查组调查病因,经调查发现致癌的罪魁祸首是水源中的金属砷,它们来自附近的几家化工厂,化工厂排出的废水中含有金属砷,废水污染了水源,人食用了这种水就会致癌.下面就是调查组对几个癌症村水源中的砷超标的倍数和患癌症的人数统计的数据:砷超标的倍数x 34 5.5 4.2 5.86 3.5患癌症人数y 15202824354434(1)画出表中数据的散点图; (2)求y 对x 的回归方程;(3)若一个村的水源中砷超标的倍数为7,试估计这个村的患癌症的人数. 【解】 (1)散点图如图所示:(2)观察散点图,可知x 、y 成线性相关关系. 计算得x =327,y =2007,根据求b 公式代入数据计算得b ≈6.065,a =2007-6.065×327≈0.846. 所以患癌症人数y 对水源中砷超标的倍数x 的回归直线方程为y =6.065x +0.846.(3)根据上面求得的回归直线方程,当水源中砷超标的倍数为7时,y =6.065×7+0.846=43.301. 即该村患癌症的人数约为43人.对误差的大小与变量相关关系的理解有误对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不正确的是( )A.由样本数据得到的回归方程y=bx+a必过样本点的中心(x,y)B.在回归分析中,误差Q越小,变量之间的线性相关程度越高C.相关系数r越小,说明变量之间的线性相关程度越小D.在散点图中,若n个点在一条直线上,说明变量之间的相关性强【错解】 B【错因分析】对误差Q与变量间的相关关系理解错误.【防范措施】正确理解回归方程、相关系数r、误差Q、散点图等概念是解决概念题的基础.【正解】∵误差Q越小,|r|越大,变量之间的线性相关程度越高,而相关系数r的范围为-1≤r≤1,∴C错误.【答案】 C1.相关系数是用来刻画两个变量相关关系的强与弱的.2.相关系数的计算公式r=∑ni=1x i-x y i-y∑ni=1x i-x2∑ni=1y i-y2=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y21.在对变量y和x进行线性相关检验时,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.9950.则变量y和x具有较高线性相关程度的是( )A.①和②B.①和④C.②和④D.③和④【解析】相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.【答案】 B2.对相关系数r,下列说法正确的是( )A.|r|越大,相关程度越大B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小【解析】由两个变量相关系数公式。
【数学】高中数学第三章统计案例1回归分析学案北师大版选修23

【关键字】数学§1回归分析(1)函数关系是一种确定性的关系,而相关关系是一种非确定性关系.返回分析是对具有相关关系的两个变量进行统计分析的常用方法.(2)线性返回直线方程y=a+bx中,b==,a=-b.预习交流1线性返回直线方程y=a+bx与一次函数y=a+kx有何区别?提示:一次函数y=a+kx是y与x的确定关系,给x一个值,y有唯一确定的值与之对应,而线性返回直线方程是y与x的相关关系的近似反映,两个数据x,y组成的点(x,y)可能适合线性返回直线方程,也可能不适合.2.相关系数假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r的计算公式为:r==.变量之间相关系数r的取值范围为[-1,1],|r|值越大,误差Q越小,变量之间的线性相关程度越高,|r|值越接近于0,Q越大,变量之间的线性相关程度越低.当r>0时,b >0,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关;当r<0时,b <0,一个变量增加,另一个变量有减少的趋势,称两个变量负相关;当r=0时,称两个变量线性不相关.预习交流2如何由样本的相关系数r=判定两变量的相关性?提示:当r>0时,表明两个变量正相关,当r<0时,表示两个变量负相关,r的绝对值越接近于1,表明两个变量线性相关性越强;r的绝对值越接近于0,表明两变量之间几乎不存在线性相关关系,通常当|r|>0.75时,认为两个变量有很强的线性相关关系.3.可线性化的返回分析通过变换先将非线性函数转化成线性函数,利用最小二乘法得到线性返回方程,再通过相应变换得到非线性返回方程.预习交流3如何将函数y=aebx转化为线性函数?提示:先对y=aebx两边取对数得ln y=ln a+bx.若记u=ln y,c=ln A.则u=c+bx,就把函数y=aebx转化成了线性函数u=c+bx.一、线性返回方程的求法(1)思路分析:求线性返回方程必须先对两个变量进行相关性判断,若两个变量存在较大的相关性,则可利用公式求线性返回方程的系数;若两个变量不具备相关关系,则求线性返回方程将变得毫无意义.解:(1)散点图如图.(2)由散点图可知,y与x呈相关关系,设线性返回方程为:y=bx+A.经计算,得=6,=210.4,x=220,xiyi=7 790.∴b==36.95,a=210.4-36.95×6=-11.3.∴线性返回方程为:y=36.95x-11.3.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性返回的方法求得返回直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是( ).A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合答案:A解析:由于返回直线y=bx+a恒过(,)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).作出散点图可直观地判断两个变量的相关关系.线性返回直线方程y=bx+a一定过样本中心(,).二、相关系数及相关性检验现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的思路分析:先利用相关系数计算公式r=计算出r,当|r|越接近于1时,两个变量越具有很强的线性关系.解:由题意得:=(120+108+…+99+108)=107.8,=(84+64+…+57+71)=68,2i=1202+1082+…+992+1082=116 584,2i=842+642+…+572+712=473 84,iyi=120×84+108×64+…+108×71=73 796,∴r=≈0.750 6.∵0.750 6接近于1,∴两次数学考试成绩有显著性线性相关关系.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短.必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从(2)如果y与x具有线性相关关系,求线性返回方程.(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?于是r=∑i=1x i y i-10x y(∑10i=1x2i-10x2)(∑10i=1y2i-10y2)≈0.990 6.∵0.990 6非常接近于1,∴y 与x 具有显著的线性相关关系.(2)设所求的线性回归方程为y =bx +a ,其中a ,b 的值使Q =∑10i =1(y i -bx i -a )2的值最小.b =∑10i =1x i y i -10x y∑10i =1x 2i -10x 2≈1.267,a =y -b x ≈-30.47,即所求的线性回归方程为y =1.267x -30.47.(3)当x =160时,y =1.267×160-30.47≈172,即大约冶炼172 min.如果两个变量不具备线性相关关系或者线性相关关系不显著,即使求出线性回归方程也无意义,用于估计和测量的结果也是不可信的.1.在下列各量与量之间的关系中是相关关系的是( ).①正方体的体积与棱长之间的关系;②一块农田的小麦的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的收入与支出之间的关系;⑤某家庭用水量与水费之间的关系.A .②③B .③④C .④⑤D .②③④ 答案:D解析:①⑤属于函数关系,②③④属于相关关系.2.在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数r 如下,其中拟合得最好的模型为( ).A .模型1的相关指数r 为0.75B .模型2的相关指数r 为0.90C .模型3的相关指数r 为0.25D .模型4的相关指数r 为0.55 答案:B解析:相关指数|r |的值越大,说明模型的拟合效果越好.3.对有线性相关关系的两个变量建立的回归直线方程y =a +bx 中,回归系数b ( ).A .可以小于0B .大于0C .能等于0D .只能小于0 答案:A解析:因为b =0时,则r =0,这时不具有线性相关关系,但b 可以大于0也可以小于0.4若y 与x ______万元.答案:10解析:由已知x =5,y =50,∑i =15x 2i =145,∑i =15y 2i =13 500,∑i =1nx i y i =1 380,∴b =1 380-5×5×50145-5×25=6.5. ∴a =y -b x =17.5.∴回归直线方程为y =6.5x +17.5.∴由y ≥82.5,即6.5x +17.5≥82.5,解得x ≥10.故广告费支出最少是10万元.5.有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生(1)(2)求出机床运转的速度x 与每小时生产的二级品数量y 的回归直线方程.(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?解:(1)散点图如下:(2)易求得x =12.5,y =8.25,∴回归直线的斜率b =∑i =1nx i y i -n x y∑i =1n x 2i -n x2=0.728 6,截距a =y -b x =-0.857 1.∴所求回归直线的方程为y =0.728 6x -0.857 1.(3)根据经验公式,要使y ≤10,只需0.728 6x -0.857 1≤10,解得x ≤14.901 3,即机床的运转速度不能超过14.901 3转/秒.此文档是由网络收集并进行重新排版整理.word 可编辑版本!。
高中数学第3章统计案例1回归分析课件北师大版选修2_3

[解] (1)散点图如图.
(2) x =15×(88+76+73+66+63)=73.2,
y =15×(78+65+71+64+61)=67.8.
5
∑xiyi=88×78+76×65+73×71+66×64+63×61=25 054.
i=1 5
∑x2i =882+762+732+662+632=27 174.
思考:在回归分析中,通过线性回归方程求出的函数值一定是实 数值吗?为什么?
[提示] 不一定是实数值,例如,人的体重与身高存在一定的线 性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食 情况,是否喜欢运动等.
2.相关系数
(1)相关系数 r 的计算
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),
可线性化的回归分析
[探究问题] 1.如何解答非线性回归问题? [提示] 非线性回归问题有时并不给出经验公式.这时我们可以 画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、 对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数, 然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到 解决.其一般步骤为:
2.已知 x 和 y 之间的一组数据,则下列四个函数中,模拟效果 最好的为哪一个?
x
1
2
3
y
3
5.99
12.01
①y=3×2x-1; ②y=log2x; ③y=4x; ④y=x2.
[提示] 观察散点图中样本点的分布规律可判断样本点分布在 曲线 y=3×2x-1 附近,所以模拟效果最好的为①.
【例 3】 某地区不同身高的未成年男性的体重平均值如下表:
第三章 统计案例
§1 回归分析 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.3可线性化的回归分析自主整理1.在具体问题中,我们首先应该作出原始数据(x,y)的________________,从_____________中看出数据的大致规律,再根据这个规律选择适当的参数进行拟合.2.对于非线性回归模型一般可转化为_________________,从而得到相应的回归方程. 高手笔记1.幂函数曲线y=ax b.作变换μ=lny,v=lnx c=lna,得线性函数μ=c+bv.2.指数曲线y=ae bx.作变换μ=lny,c=lna,得线性函数μ=c+bx. 3.倒指数曲线y=ae bx.作变换μ=lny,c=lna,v=x1,得线性函数μ=c+bv. 4.对数函数y=a+blnx.作变换v=lnx ,得线性函数y=a+bv. 名师解惑如何根据原始数据求拟合函数? 剖析:(1)可先由原始数据作散点图. (2)对于一些函数模型的图形要熟悉.如:①幂函数y=ax b型的图象为:②指数曲线y=ae bx(3)倒指数曲线y=ae bx(4)对数曲线y=a+blnx(3)由散点图找出拟合函数的类型. (4)将非线性函数转化为线性函数.(5)求出回归方程. 讲练互动【例1】某地今年上半年患某种传染病人数y 与月份x 之间满足函数关系模型为y=ae bx,确定这个函数解析式.分析:函数模型为指数型函数,可转化为线性函数,从而求出. 解:设μ=lny,c=lna ,则μ=c+bx.∑=61i xi =21,∑=61i iμ=25.359 5,∑=61i xi 2=91,∑=61i iμ2=107.334,∑=61i iix μ=90.341 3,x =3.5,μ=4.226 58,b=226126115.369122658.45.363413.9066⨯-⨯⨯-=--∑∑==i ii ixxx x μμ=558412.1=0.09, c=μ-b x =4.226 58-0.09×3.5=3.911 58,∴μ=3.911 58+0.09x.∴y=e 3.911 58·e 0.09x.绿色通道:基础模型为指数型,可两边取对数转化为线性函数关系,求出回归方程.. 变式训练1.某工厂今年第一季度生产某种产品的数量分别是1万件、1.2万件、1.3万件、1.37万件,为了估测以后每个月的产量,可用函数y=ae bx来模拟该产品的月产量y 与月份x 的关系,求模拟函数.∑=41i ix=10,∑=41i iμ=0.759 5,∑=41i ix2=30,∑=41i iμ2=0.201 2,∑=41i ixμi =2.411,x =2.5,μ=0.189 9,b=∑∑==⨯-⨯⨯-41224144iiiiixxxxμμ=25.24301899.05.24411.2⨯-⨯⨯-=551225.0=0.102 45,c=μ-b x=0.189 9-0.102 45×2.5=-0.066,∴μ=-0.066+0.102 45x.y=e-0.066·e0.102 45x.身高x/cm 60 70 80 90 100 110体重y/kg 6.13 7.90 9.99 12.15 15.02 17.50身高x/cm 120 130 140 150 160 170体重y/kg 20.92 26.86 31.11 38.85 47.25 55.05(1)画出散点图.(2)能否建立恰当的函数模型使它能比较近似地反映这个地区未成年男性体重y kg与身高x cm的函数关系?试写出这个函数模型的解析式.(3)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm,体重为78 kg的在校男生的体重是否正常?解:(1)作散点图.(2)从散点图可看出函数模型为y=ae bx型.设μ=lny,c=lna,则μ=c+bx.x 60 70 80 90 100 110 μ 1.813 2.067 2.301 6 2.497 2.709 4 2.862 x 120 130 140 150 160 170 μ 3.041 3.290 6 3.437 5 3.659 7 3.855 4 4.008 2 ∑=121ix i=1 380, ∑=121iμi=35.542 4, ∑=121ix i2=173 000, ∑=121ix iμi=4 369.249,x=115,μ=2.961 9,b==⨯-⨯⨯-=-⨯⨯-∑∑==22121212111512170009619.211512249.43691212xxxxiiiiiμμ14300873.281=0.0197,c=μ-b x=2.961 9-0.019 7×115=0.696 4,∴μ=0.696 4+0.019 7x,y=e0.6964·e0.019 7x.当x=175时,μ=4.143 9,∴y=eμ=e4.143 9=63.048.048.6378=1.237>1.2,此男子偏胖.绿色通道:根据给出的数据,画出散点图,选择散点图所符合的函数模型再转化为线性关系解答.变式训练温度x/℃21 23 25 27 29 32 35产卵个数y/个7 11 21 24 66 115 325 求y与x之间的回归方程.解:(1)画出散点图.两变量符合指数函数y=ae bx.x 21 23 25 27 29 32 35 μ 1.946 2.398 3.045 3.178 4.190 4.745 5.784 ∑=71iix=192,∑=71iiμ=25.286,∑=712iix=5 414,∑=71iixμi=733.741,x=27.428 6,μ=3.612 3.b=27122714286.27754146123.34286.277741.73377⨯-⨯⨯-=--∑∑==iiiiixxxxμμ=0.272,c=μ-b x=-3.843,∴μ=3.843+0.272x.y=e-3.843·e0.272x.同步测控我夯基,我达标1.设在海拔x m处的大气压强是y Pa,y与x之间的关系为y=ce kx,其中c、k为常量,如果某游客从大气压为1.01×105Pa的海平面地区,到了海拔为2 400 m、大气压为0.90×105 Pa的一个高原地区,则k与c的取值分别是( )解析:将⎩⎨⎧==2400,0yx和⎪⎩⎪⎨⎧⨯=⨯=551090.0,1001.1yx分别代入y=ce kx,得⎪⎩⎪⎨⎧⨯-=⨯=-.10805.4,1001.155kc答案:A2.我国1990—2000年的国内生产总值如下表所示.年份1990 1991 1992 1993 产值/亿元18 598.4 21 662.5 26651.9 34 560.5 年份1994 1995 1996 1997 产值/亿元46 670.0 57 494.9 66 850.5 73 142.7 年份1998 1999 2000产值/亿元76 967.1 80 422.8 89 404.0A.y=ae kxB.y=a+bxC.y=ax bD.y=ae xb解析:画出散点图观察,可用y=a+bx刻画国民生产总值发展变化的趋势.答案:Bx 1 2 3 4 5 6 7 8 9 10 y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3 A.y=2+13x B.y=2e x C.y=2e x1D.y=2+lnx解析:取x=1,2,…,10分别代入各解析式判断.答案:D4.指数曲线y=ae bx的图象为( )解析:∵y=a e bx,∴a>0时y>0,排除A、C,且x∈R,排除D,选B.答案:B5.倒指数曲线y=ae xb 的图象为( )解析:y=a xb e ,当a >0,b >0时,图象为A. 答案:A6.幂函数曲线y=x b,当b >1时的图象为( )解析:当b >1时,图象为A,当0<b <1时为B,当b <0时为C,当b=1时为D. 答案:A7.x 、y 满足 x 0.2 0.6 1.0 1.2 1.4 1.6 1.8 2.0 2.2 y0.040.3611.41.92.53.23.984.82则x 、y 之间符合函数模型____________________________.解析:画出散点图,形如y=x b,其中b=2.答案:y=x 2x -2 -1.5 -1 -0.5 0 0.5 1 y0.260.350.510.711.11.412.05解析:画出散点图,形如y=a·e bx,其中a=2,b=1.答案:y=e xln2我综合,我发展x 0.1 0.2 0.3 0.5 1 2 3 4 5 y2096420.940.650.510.45解析:画出散点图,形如y=xb,其中b=2. 答案:y=x2 x 0.4 0.5 1 2 y 0.082 0.135 0.367 8 0.607 x 5 10 20 30 y0.818 70.904 80.9510.967 5则x 、y 满足函数关系是____________________________.解析:画出散点图,当x 无限大时,y 逐渐接近于1,符合函数模型y=ae bx. 其中a=1,b=-1. 答案:y=xe1-天数x/天 1 2 3 4 5 6 繁殖个数y/个612254995190(1)作出y 关于x 的散点图. (2)写出y 关于x 的模拟函数. 解:(1)作散点图.(2)由散点图知x 、y 之间满足函数关系为y=ae bx. x 1 2 3 4 5 6 μ1.791 82.484 93.218 93.891 84.553 95.247 0∑=61i ix=21,∑=61i iμ=21.188 3,∑=61i ix2=91,∑=61i ixμi =86.237,x =3.5,μ=3.531 4,b=∑∑==--61226166i i i iixx x x μμ=25.36915314.35.36237.86⨯-⨯⨯-=5.170776.12=0.69, c=μ-b x =3.531 4-0.69×3.5=1.115 9, ∴c =1.115 9+0.69x.∴y=e 1.115 9·e 0.69x.12.我国1950—1959年人口数据资料如下表:若y 与t 之间满足y=ae 关系,求函数解析式;若按此增长趋势估计大约在哪一年我国人口达到14亿?解:设μ=lny,c=lna,则μ=c+bt.∑=101i it=45,∑=101i iμ=110.167 0,∑=1012i it=285,∑=101iitμi =497.593 6,t =4.5,μ=11.016 7,b=2101221015.4102850167.115.4105936.4971010⨯-⨯⨯-=--∑∑==i i i iitt t t μμ=5.828421.1=0.0223,c=μ-b t =11.016 7-0.022 3×4.5=10.916 4,∴μ=10.916 4+0.022 3t. y=e 10.916 4+0.022 3t.令y=140 000万,则10.916 4+0.022 3t=ln140 000=11.849 4, ∴t=41.838 5.即大约在1950年后的第42年(即1992年)我国人口达到14亿,由此看来,计划生育是我国的基本国策.我创新,我超越13.在平炉炼钢中,由于矿石与炉气中的氧气作用,铁水的总含量不断下降.现测得含碳量求回归方程.分析:画出散点图观察样本点分布在一条指数函数曲线y=ae bx的周围,再应用换元转化为线性回归问题求解.则∑=111i it=66,∑=111i iz=6876,∑=1112i it=400.4,∑=111i izt i =32.778 2,t =6,z =0.619 6,b=211121111111tt zt tz i i i i i ∑∑==--=26114.4006196.06117782.32⨯-⨯⨯-=4.41178.8-=-1.845,c=z -b t =11.689, ∴z=-1.845t+11.689.∴y=e -1.845 t+11.689.。