2018高中数学第1章统计案例1.2回归分析课件苏教版
苏教版高三数学选修1-2电子课本课件【全册】

0002页 0056页 0108页 0161页 0201页 0251页 0298页
第一章统计案例 1.2回归分析 2.1合情推理与演绎推理 第三章数系的扩充与复数的引入 3.2复数的四则运算 第四章 框图 4.2结构图
第一章统计案例
苏教版高三数学选修1-2电子课本 源自件【全册】2.1合情推理与演绎推理
苏教版高三数学选修1-2电子课本 课件【全册】
2.2直接证明与间接证明
苏教版高三数学选修1-2电子课本 课件【全册】
第三章数系的扩充与复数的引 入
苏教版高三数学选修1-2电子课本 课件【全册】
3.1数系的扩充
苏教版高三数学选修1-2电子课本 课件【全册】
3.2复数的四则运算
苏教版高三数学选修1-2电子课本 课件【全册】
3.3复数的几何意义
苏教版高三数学选修1-2电子课本 课件【全册】
第四章 框图
苏教版高三数学选修1-2电子课本 课件【全册】
4.1流程图
苏教版高三数学选修1-2电子课本 课件【全册】
1.1独立性检验
苏教版高三数学选修1-2电子课本 课件【全册】
1.2回归分析
苏教版高三数学选修1-2电子课本 课件【全册】
第二章推理与证明
苏教版高三数学选修1-2电子课本 课件【全册】
2018年高中数学第1章统计案例1.2回归分析学案苏教版选修1_2

回归分析.线性回归模型()线性回归模型=++ε,其中+是确定性函数,ε称为随机误差.()随机误差产生的原因主要有以下几种:①所用的确定性函数不恰当引起误差;②忽略了某种因素的影响;③存在观测误差.()在线性回归方程=+中=错误!=错误!,=-(其中=,=).其中,,分别为,的估计值,称为回归截距,称为回归系数,称为回归值..相关系数()计算两个随机变量间线性相关系数的公式)-(,\(-))))-(,\(-)))=()具有如下性质:①≤;②越接近于,,的线性相关程度越强;③越接近于,,的线性相关程度越弱..对相关系数进行显著性检验的基本步骤()提出统计假设:变量,不具有线性相关关系;()如果以的把握作出判断,那么可以根据-=与-在教材附录中查出一个的临界值(其中-=称为检验水平);()计算样本相关系数;()作出统计推断:若>,则否定,表明有的把握认为与之间具有线性相关关系;若≤,则没有理由拒绝原来的假设,即就目前数据而言,没有充分理由认为与之间有线性相关关系.我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次函数关系时,我们所求出的函数关系式=+就是回归直线方程.求回归直线方程的一般方法是借助于工作软件求出回归直线方程,也可以利用计算器计算出,再由=-求出,写出回归直线方程=+.计算时应注意:()求时,利用公式=-)),\(=)\()-(,\(-))),先求出=(++…+),=(++…+),=++…+,=++…+.再由=-求出的值,并写出回归直线方程.()线性回归方程中的截距和斜率都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.()回归直线方程=+中的表示增加个单位时,的变化量为,而表示不随的变化而变化的部分.()可以利用回归直线方程=+求在取某一个值时的估计值.[例] 假设关于某设备的使用年限(年)和所支出的维修费用(万元)有如下的统计资料:若由数据可知,对呈线性相关关系.()求线性回归方程;()估计使用年限为年时,维修费用是多少?[思路点拨] 由于题目条件已经指明对呈线性相关关系,所以可直接利用公式求与,然后求出线性回归方程,最后把代入,估计维修费用.[精解详析] ()列表如下:。
2017_18版高中数学第一章统计案例1.2回归分析一学案

1.2 回归分析(一)明目标、知重点 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.回归直线方程在回归直线方程y ^=a ^+b ^x 中,b ^=∑ni =1x i -xy i -y∑n i =1x i -x 2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y-b ^x .其中x =1n ∑ni =1x i ,y =1n∑n i =1y i . (x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数(1)对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数r =∑n i =1 x i -xy i -y∑n i =1x i -x2∑n i =1y i -y2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.当|r |>r 0.05时,表明有95%的把握认为两个变量之间有线性相关关系.[情境导学]“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关? 探究点一 回归直线方程思考1 两个变量之间的关系分几类? 答 分两类:①函数关系,②相关关系.函数关系是一种确定性关系,而相关关系是一种非确定性关系. 上面所提的“名师”与“高徒”之间的关系就是相关关系.思考2 什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 思考3 对具有线性相关关系的两个变量进行回归分析有哪几个步骤? 答 基本步骤为画散点图,求回归直线方程,用回归直线方程进行预报. 例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg4857505464614359. 解 (1)画散点图选取身高为自变量x ,体重为因变量y ,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y =bx +a 来近似刻画它们之间的关系.(2)建立回归方程由计算器可得b ^=0.849,a ^=-85.712.于是得到回归直线方程为y ^=0.849x -85.712. (3)预报和决策当x =172时,y ^=0.849×172-85.712=60.316(kg). 即一名身高为172 cm 的女大学生的体重预报值为60.316 kg. 反思与感悟 在使用回归直线方程进行预报时要注意: (1)回归直线方程只适用于我们所研究的样本的总体; (2)我们所建立的回归直线方程一般都有时间性; (3)样本取值的范围会影响回归直线方程的适用范围;(4)不能期望回归直线方程得到的预报值就是预报变量的精确值.跟踪训练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356(1)请画出上表数据的散点图((2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力. 解 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4, ∑ni =1x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中回归直线方程,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.探究点二 相关性检验思考1 给出n 对数据,按照公式求出的回归直线方程,是否一定能反映这组成对数据的变化规律?答 如果数据散点图中的点都大致分布在这条直线附近,这条直线就能反映这组成对数据的变化规律,否则求出的方程没有实际意义. 思考2 怎样定量确定两个变量的相关关系?答 可以通过计算相关系数r 来确定,若|r |>r 0.05,可以有95%的把握认为两个变量具有线性相关关系;若|r |≤r 0.05,则没有理由认为两个变量具有线性相关关系,此时寻找回归直线方程毫无意义.例2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:甲醛浓度(g/L) 18 20 22 24 26 28 30 缩醛化度(克分子%) 26.8628.3528.7528.8729.7530.0030.36(1)画散点图; (2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 解 (1)散点图如下图:(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算a ^,b ^.ix iy ix i 2x i y i1 18 26.86 324 483.482 20 28.35 400 5673 22 28.75 484 632.5 4 24 28.87 576 692.88 5 26 29.75 676 773.5 6 28 30.00 784 8407 30 30.36 900 910.80 ∑168202.944 1444 900.16x =1687=24,y =202.947, b ^ =∑7i =1x i y i -7x y ∑7i =1x i 2-7x 2=4 900.16-7×24×202.9474 144-7×242≈0.264 3, a ^=y -b ^x =202.947-0.264 3×24≈22.648, ∴回归直线方程为y ^=22.648+0.264 3x .(3)∑7i =1y i 2≈5 892,r =∑7i =1x i y i -7x y∑7i =1x i 2-7x2∑7i =1y i 2-7y2=4 900.16-7×24×202.9474 144-7×242×[5 892-7×⎝ ⎛⎭⎪⎫202.9472]≈0.96.∵r =0.96>r 0.05=0.754.∴有95%的把握认为“甲醛浓度与缩醛化度有关系”,求得的回归直线方程有意义. 反思与感悟 根据已知数据求得回归直线方程后,可以利用相关系数和临界值r 0.05比较,进行相关性检验.跟踪训练2 为了研究3月下旬的平均气温(x )与4月20日前棉花害虫化蛹高峰日(y )的关系,某地区观察了2007年至2012年的情况,得到了下面的数据:年份2007 2008 2009 2010 2011 2012 x (℃) 24.4 29.6 32.9 28.7 30.3 28.9 y (日)19611018(1)对变量x 、y 进行相关性检验;(2)据气象预测,该地区在2013年3月下旬平均气温为27℃,试估计2013年4月化蛹高峰日为哪天.解 由已知条件可得下表:i 1 2 3 4 5 6 x i 24.4 29.6 32.9 28.7 30.3 28.9 y i19611018x ≈29.13,y =7.5,∑i =16x i 2=5 130.92,∑i =16y i 2=563,∑i =16x i y i =1 222.6(1)r =∑i =16x i y i -6x y∑i =16x i 2-6x2∑i =16y i 2-6y2≈-0.934 1.查表知:r 0.05=0.811.由|r |>r 0.05,可知变量y 和x 存在线性相关关系.(2)b ^=1 222.6-6×29.13×7.55 130.92-6×29.132≈-2.23, a ^=y -b ^x ≈72.46.所以回归直线方程为y ^=-2.23x +72.46.当x =27时,y ^=-2.23×27+72.46≈12.据此,可估计该地区2013年4月12日为化蛹高峰日.1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量 答案 C2.对变量y 和x 进行相关性检验,已知n 为数据的对数,r 是相关系数,且已知①n =3,r =0.995 0;②n =7,r =0.953 3;③n =15,r =0.301 2;④n =17,r =0.499 1.则变量y 和x 具有线性相关关系的是( )A.①和②B.①和③C.②和④D.③和④答案 C解析 ①n =3时,r 0.05=0.997,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.②n =7时,r 0.05=0.754,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系.③n =15时,r 0.05=0.514,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.④n =17时,r 0.05=0.482,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系.所以②和④满足题意.3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -200 答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意,故选A.4.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元. 答案 0.2540.254x+1+0.321-(0.254x+0.321)=0.254.解析由题意知[][呈重点、现规律]1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.2.通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.。
【教育课件】苏教版选修1-2高中数学第1章《统计案例》ppt复习课件.ppt

解 (1)散点图如图:
5
(2)由已知可得 x =5, y =50,x2i =145,
i=1 5
xiyi=1 380,
i=1
5
xiyi-5 x y
i=1
则b^ =
5
x2i -5 x 2
i=1
=1 318405--55××55×2 50=6.5,a^= y -b^ x =50-6.5×5=17.5,于是所
本章归纳整合
知识网络
要点归纳
1.独立性检验
(1)给出2×2列联表时,直接利用公式,查表判断;若没有给出2×2列联表, 应先根据样本数据列出2×2列联表,再利用公式进行计算并判断,一般要 求2×2列联表中的a、b、c、d的值均不小于5.
(2)在独立性检验中,两个变量是否有关,在多大程度上有关,是一种统计 关系,不能认为是因果关系.由于抽样的随机性,用χ2进行独立性检验时, 样本容量n越大,估计越准确.
^
^
a= y -b x =20.771-12.541×0.543≈13.961,
∴电阻 y 关于含碳量 x 之间的线性回归方程是
^
y=12.541x+13.961.
单击此处进入 解读高考
2005年11月7日7时33分
网络构建
专题归纳
解读高考
10
50
80
试说明:在这三种心理障碍中哪一种与性别关系最大?
总 计 25
20
65
110
解 对于三种心理障碍分别有 χ21,χ22与 χ23,则由表中数据可得: χ21=110×30×5×806×0-252×5×85202≈0.863; χ22=110×30×108×0×702-0×209×0 102≈6.366; χ23=110×30×158×0×306-5×154×5 502≈1.410. 所以没有充分的理由认为焦虑与性别有关,有 95%的把握认为说 谎与性别有关,没有充分的理由说明懒惰与性别有关.
2018高中数学人教A版选修1-2课件:第一章 统计案例 本章整合

综合应用 专题1 专题2 专题3 专题4
2.回归分析的方法:回归模型法. 基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变 量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的 关系; (3)由散点图确定回归方程的大致类型; (4)按一定规则估计回归方程中的参数; (5)得出结果后,可通过残差分析或利用R2来检查模型的拟合效果, 从而得到最佳模型.
综合应用 专题1 专题2 专题3 专题4
编号 残差e 编号 残差e
^ ^
1 0.36 6 -0.04
2 -0.32 7 0.28
3 0 8 -0.4
4 -0.68 9 -0.08
5 0.64 10 0.24
综合应用 专题1 专题2 专题3 专题4
(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.
^ ^
^
^ ^
^ ^
������=1 ������
∑ ������������ ������������ -������������ ������
������=1
������
∑
2 ������2 ������ -������������
, ������ = ������ − ������ ������, 其中������, ������为样本平均值.
^
^
综合应用 专题1 专题2 专题3 专题4
解:(1)由题意知 n=10, ������ =
������
1 ������ ∑ ������ ������ ������ =1
2
������ =
80 10
= 8, y =
1 n ∑ ������ ������ n i=1
2018_2019学年高中数学第一章统计案例1.2回归分析学案苏教版

1.2 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.知识点一 线性回归模型思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:请问如何表示年推销金额y 与工作年限x 之间的相关关系?y 关于x 的线性回归方程是什么? 答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示两变量之间的相关关系.设所求的线性回归方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.梳理 线性回归模型 (1)随机误差具有线性相关关系的两个变量的取值x ,y ,y 的值不能由x 完全确定,可将x ,y 之间的关系表示为y =a +bx +ε,其中a +bx 是确定性函数,ε称为随机误差. (2)随机误差产生的主要原因①所用的确定性函数不恰当引起的误差. ②忽略了某些因素的影响. ③存在观测误差.(3)线性回归模型中a ,b 值的求法y =a +bx +ε称为线性回归模型.a ,b 的估计值为a ^,b ^,则⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n (x )2,a ^=y -b ^x .(4)回归直线和线性回归方程直线y ^=a ^+b ^x 称为回归直线,此直线方程即为线性回归方程,a ^称为回归截距,b ^称为回归系数,y ^称为回归值. 知识点二 样本相关系数r具有相关关系的两个变量的线性回归方程为y ^=b ^x +a ^.思考1 变量y ^与真实值y 一样吗? 答案 不一定.思考2 变量y ^与真实值y 之间误差大了好还是小了好? 答案 越小越好.梳理 样本相关系数r 及其性质(1)r =∑i =1nx i y i -n x y(∑i =1nx 2i -n (x )2)(∑i =1ny 2i -n (y )2).(2)r 具有以下性质: ①|r |≤1.②|r |越接近于1,x ,y 的线性相关程度越强. ③|r |越接近于0,x ,y 的线性相关程度越弱.知识点三 对相关系数r 进行显著性检验的基本步骤 1.提出统计假设H 0:变量x ,y 不具有线性相关关系.2.如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n -2在教材附录1中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平). 3.计算样本相关系数r .4.作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.1.求线性回归方程前可以不进行相关性检验.( × )2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ ) 3.利用线性回归方程求出的值是准确值.( ×)类型一 求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.⎝ ⎛⎭⎪⎪⎫相关公式:b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n (x )2,a ^=y -b ^x 考点 线性回归方程 题点 求线性回归方程 解 (1)如图:(2)∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系.②计算:x ,y ,∑i =1nx 2i ,∑i =1nx i y i .③代入公式求出y ^=b ^x +a ^中参数b ^,a ^的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义. 跟踪训练1 某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y 对数学成绩x 的线性回归方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25054.∑i =15x 2i =882+762+732+662+632=27174. 所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5(x )2=25054-5×73.2×67.827174-5×73.22≈0.625. a ^=y -b ^x ≈67.8-0.625×73.2=22.05.所以y 对x 的线性回归方程是y ^=0.625x +22.05.(3)当x =96时,y ^=0.625×96+22.05≈82,即可以预测他的物理成绩约是82. 类型二 线性回归分析例2 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x )与入学后第一次考试的数学成绩(y )如下表:请问:这10名学生的两次数学成绩是否具有线性关系? 考点 题点解 x =110(120+108+…+99+108)=107.8, y =110(84+64+…+57+71)=68.∑i =110x 2i =1202+1082+…+992+1082=116584. ∑i =110y 2i =842+642+…+572+712=47384. ∑i =110x i y i =120×84+108×64+…+99×57+108×71=73796.所以相关系数为r =73796-10×107.8×68(116584-10×107.82)(47384-10×682)≈0.751. 由检验水平0.05及n -2=8, 在附录1中查得r 0.05=0.632. 因为0.751>0.632,由此可看出这10名学生的两次数学成绩具有较强的线性相关关系. 反思与感悟 相关关系的两种判定方法 (1)利用散点图判定(2)利用相关系数判定计算r ―→结合r 的值与相关性检验临界值表中的值进行比较判断跟踪训练2 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转的速度而变化,下表为抽样试验的结果:对变量y 与x 进行线性相关性检验. 考点 题点解 由题中数据可得x =12.5,y =8.25,∑i =14x i y i =438,4x y =412.5,∑i =14x 2i =660,∑i =14y 2i =291, 所以r =∑i =14x i y i -4x y(∑i =14x 2i -4(x )2)(∑i =14y 2i -4(y )2)=438-412.5(660-625)×(291-272.25)=25.5656.25≈0.995. 由检验水平0.05及n -2=2,在教材附录1中查得r 0.05=0.950,因为r >r 0.05,所以y 与x 具有线性相关关系. 类型三 非线性回归分析 例3 下表为收集到的一组数据:(1)作出x 与y 的散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系;(3)利用所得模型,估计当x =40时y 的值. 考点 非线性回归分析 题点 非线性回归分析解 (1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y =c 1e c 2x 的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程,数据可以转化为x =17(21+23+…+32+35)=27.429,z =17(1.946+2.398+…+4.745+5.784)=3.612,∑i =17x i z i =733.741,∑i =17x 2i =5414. 求得线性回归方程为z ^=0.273x -3.876,∴y ^=e0.273x -3.876.(3)当x =40时,y ^=e 0.273x -3.876≈1146.反思与感悟 非线性回归问题的处理方法 (1)指数型函数y =e bx +a①函数y =ebx +a的图象②处理方法:两边取对数,得ln y =lnebx +a,即ln y =bx +a .令z =ln y ,把原始数据(x ,y )转化为(x ,z ),再根据线性回归模型的方法求出a ,b . (2)对数型函数y =b ln x +a ①函数y =b ln x +a 的图象:②处理方法:设x ′=ln x ,原方程可化为y =bx ′+a , 再根据线性回归模型的方法求出a ,b . (3)y =bx 2+a 型处理方法:设x ′=x 2,原方程可化为y =bx ′+a ,再根据线性回归模型的方法求出a ,b . 跟踪训练3已知某种食品每千克的生产成本y (元)与生产该食品的重量x (千克)有关,经生产统计得到以下数据:通过以上数据,判断该食品的生产成本y (元)与生产的重量x (千克)的倒数1x之间是否具有线性相关关系.若有,求出y 关于1x的回归方程,并估计一下生产该食品500千克时每千克的生产成本约是多少.(精确到0.01) 考点 非线性回归分析 题点 非线性回归分析解 设u =1x,通过已知数据得到y 与u 的相应数据为根据上述数据可求得相关系数r =∑i =110u i ·y i -10u ·y(∑i =110u 2i -10·(u )2)(∑i =110y 2i -10·(y )2)≈0.9998,于是有很大的把握认为y 与1x具有线性相关关系.而b ^=∑i =110u i ·y i -10u ·y∑i =110u 2i -10(u )2≈8.973,a ^=y -b ^·u ≈1.126,于是y 与1x 的回归方程为y ^=8.973x+1.126.当x =500时,y ^=8.973500+1.126≈1.14.所以估计生产该食品500千克时每千克的生产成本约是1.14元.1.设有一个线性回归方程y ^=2-1.5x ,当变量x 增加1个单位时,y 平均________个单位. 考点 线性回归分析 题点 线性回归方程的应用 答案 减少1.5解析 由回归方程中两个变量之间的关系可以得到.2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是________.(填序号)考点 回归分析题点 建立回归模型的基本步骤 答案 ①③解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型. 3.某厂节能降耗技术改造后,在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据如表:根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,则上表中的t =________.考点 线性回归分析 题点 线性回归方程的应用 答案 34.下表是x 和y 之间的一组数据,则y 关于x 的回归直线必过点________.考点 线性回归方程 题点 样本点中心的应用答案 (2.5,4)解析 回归直线必过样本点中心(x ,y ),即(2.5,4). 5.已知x ,y 之间的一组数据如下表:(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出回归方程. 考点 线性回归方程 题点 求线性回归方程解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1,故y ^=2x +1.回归分析的步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.(2)画出确定好的因变量关于自变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y ^=b ^x +a ^). (4)按一定规则估计回归方程中的参数.一、填空题1.根据如下样本数据:得到的回归方程为y ^=b ^x +a ^,则a ^,b ^与0的大小关系是________. 考点 线性回归分析 题点 线性回归方程的应用答案 a ^>0,b ^<0 解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 线性相关,线性回归方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量约为________万盒. 考点 线性回归方程 题点 样本点中心的应用 答案 8.1解析 回归直线一定过样本点中心.由已知数据,可得x =3,y =6,代入回归方程,可得a ^=y -0.7x =3.9,即回归方程为y ^=0.7x +3.9.把x =6代入,可得y ^=8.1,所以6月份的产量约为8.1万盒.3.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 与x 的线性回归方程是________________. 考点 线性回归方程题点 求线性回归方程答案 y ^=2.62x +11.47解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x·y∑i =18x 2i -8(x )2=1849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47. 4.已知x ,y 的取值如下表:从所得的散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=________. 考点 题点 答案 2.6解析 ∵x =2,y =4.5.又回归直线恒过定点(x ,y ),代入得a ^=2.6.5.从某大学随机选取8名女大学生,其身高x (cm)和体重y (kg)的线性回归方程为y ^=0.849x -85.712,则身高172cm 的女大学生,由线性回归方程可以估计其体重为________kg. 考点 题点 答案 60.316解析 y ^=0.849×172-85.712=60.316. 6.有下列关系:①曲线上的点与该点的坐标之间的关系; ②苹果的产量与气候之间的关系;③森林中的同一种树木,其断面直径与高度之间的关系; ④学生与其学号之间的关系.其中有相关关系的是________.(填序号) 考点 题点 答案 ②③解析 由相关关系定义分析.7.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型估计广告费用为6万元时的销售额为____________万元. 考点 题点 答案 65.5解析 样本点中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以线性回归方程是y ^=9.4x +9.1,把x =6代入,得y ^=65.5.8.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________. 考点 线性相关系数题点 线性相关系数的概念及计算 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上且直线斜率大于零时,相关系数为1.9.对于回归分析,有下列叙述:①在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定; ②线性相关系数可以是正的或是负的;③回归分析中,如果r 2=1或r =±1,说明x 与y 之间完全线性相关; ④样本相关系数r ∈(-∞,+∞). 其说法正确的序号是________.考点 题点 答案 ①②③解析 由回归模型及其性质易知①②③是正确的.相关系数的取值范围应为|r |≤1,所以④是错误的.10.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围.令z =ln y ,求得线性回归方程为z ^=0.25x -2.58,则该模型的回归方程为________. 考点 非线性回归分析 题点 非线性回归分析 答案 y =e0.25x -2.58解析 因为z ^=0.25x -2.58,z =ln y ,所以y ^=e0.25x -2.58.11.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)的对比结果如下:则从表中数据分析,________回归方程更好.(即与实际数据更贴近) 考点 两个模型拟合效果的比较 题点 两个模型拟合效果的比较 答案 甲解析 可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为3240=45,而乙回归方程的数据准确率为4060=23.显然甲的准确率高些,因此甲回归方程好些. 二、解答题12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n (x )2,a ^=y -b ^x ) 考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =14x i y i -4x y∑i =14x 2i -4(x )2=0.7,所以a ^=y -b ^x =1.05.所以y ^=0.7x +1.05. 回归直线如第(1)问图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.13.为了研究某种细菌随时间x 的变化繁殖个数y 的变化情况,收集数据如下:(1)(2)求y 与x 之间的回归方程. 考点 非线性回归分析 题点 非线性回归分析 解 (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数曲线y =c 1e c 2x 的周围,于是令z =ln y ,则所以z ^=0.69x +1.115,则有y ^=e 0.69x +1.115.三、探究与拓展14.已知x ,y 的取值如下表:从散点图分析y 与x 具有线性相关关系,且回归方程为y ^=1.02x +a ^,则a ^=________. 考点 题点 答案 0.92解析 由题意得x =4,y =5,又(x ,y )在直线y ^=1.02x +a ^上,所以a ^=5-4×1.02=0.92.15.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为已知∑i =15x i y i =62,∑i =15x 2i =16.6.(1)画出散点图;(2)求出y 对x 的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01t) 考点 题点解 (1)散点图如图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑i =15x i y i =62,∑i =15x 2i =16.6, 所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5(x )2=62-5×1.8×7.416.6-5×1.82=-11.5,a ^=y -b ^x =7.4+11.5×1.8=28.1,故y 对x 的线性回归方程为y ^=-11.5x +28.1.(3)y ^=28.1-11.5×1.9=6.25(t).故价格定为1.9万元,预测需求量大约为6.25 t.。
2017_2018学年高中数学第一章统计案例1.2回归分析课件新人教B版选修1_2

r=
∑( ������ ������ - ������ ) ( ������ ������ - ������ )
2 ∑( ������ ������ - ������ ) ∑( ������ ������ - ������ )2
=
∑������ ������ ������ ������ -������������ ������
答案:A
【做一做1-2】 设有一个回归直线方程为 y = 3-5x,则当变量x增 加1个单位时( ) A.y平均增加3个单位 B.y平均减少5个单位 C.y平均增加5个单位 D.y平均减少3个单位 解析:因为-5是斜率的估计值,说明x每增加1个单位时,y平均减少 5个单位. 答案:B
^
2.样本相关系数
������ =
������
∑
2 2 ������ ������ -������������
, 其统计学的意义是:x 每增加(或减
^ ^
^
少 )一个单位 ,y 平均改变 b 个单位. a = ������ − b ������ , 它的意义是y 不受 x 变化影响的部分 . (2)回归直线方程的求法及步骤 :借助计算器进行运算求出系数
= 0 .56, a = ������ − b ������ = 997 .4.
^ ^ ^
^
^
解析: b = ������=1 5
∑ ������ ������ ������ ������ -5������ ������
������ =1
5
∑
2 2 ������ ������ -5������
故 y 对 x 的回归直线方程为 y = 0.56x+997.4.
^ ������ 2 计算 ∑ ������������, ∑ ������������ , ∑ ������������ , ∑ ������������������������ ; ②计算 ������ ������ =1 ������ =1 ������ =1 ������ =1 ^ ^
苏教版选修1-2高中数学1.2《回归分析》ppt课件

线性相关关系
想一想:回归分析中,利用回归直线求出的函数值是真 实值吗?为什么?
提示 不一定是真实值,利用回归直线方程求出的值, 在很多时候是个预报值,与真实值之间可能有差异, 因为真实值还受到其他因素的影响.
名师点睛 1.回归分析
(1)回归分析是对具有相关关系的两个变量进行统计分析的一 种方法,若两个变量不具有相关关系,则分析没有意义. (2)线性回归模型 y=bx+a+ε 与一次函数的不同之处是增加了 随机误差项 ε,最小二乘估计a^ 和b^ 就是对未知参数 a、b 的最好 估计,它与真实值 a 和 b 之间也存在着误差.因变量 y 由自变 量 x 和随机误差共同确定,即自变量 x 只解释部分 y 的变化. (3)线性回归方程y^=a^ +b^ x,一定过( x , y ),可利用该直线方 程对 y 的值做出估计.
[思路探索] 用公式求出b^,a^,得直线方程.
10
解 因为 x =71,xi2=50 520, y =72.3,
i=1
10
xiyi=51 467,
i=1
所以,b^=51 540675-201-0×107×1×71722.3≈1.218 2. a^=72.3-1.218 2×71=-14.192 2, 线性回归方程是:y^=1.218 2x-14.192 2.
(2)如果有,求出 y 对 x 的线性回归方程y^=a^+b^x; (3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多为 10 个,则机器的运转速度应控制在什么范围内?
审题指导 本题综合考查线性回归分析的基本思想及步骤.
【解题流程】 计算相关系数r → 判断变量是否相关
→ 求线性回归直线 → 作出估计
助威旗 10 20 30 40 50 60 70 80 90 100
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要点一 线性相关的判断 例1 某校高三(1)班的学生每周用于数学学习的时间x(单位: h)与数学平均成绩y(单位:分)之间有表格所示的数据.
x 24 15 23 19 16 11 20 16 17 13
y 92 79 97 89 64 47 83 68 71 59
i=1
n
n
xi- x 2· yi- y 2
i=1
i=1
n
xiyi-n x y
i=1
=
;
n
n
x2i -n x 2· y2i -n y 2
i=1
i=1
(4)作出统计推断:若 |r|>r0.05 ,则否定H0,表明有 95% 的 把握认为x与y之间具有 线性相关关系 ;若|r|≤r0.05,则没有
n
n
xi-x yi-y xiyi-n x y
i=1
b^=
n
xi-x 2
i=1
=
称为回归系数,y^称为回归值.
n
x2i -n x 2
i=1
i=1
(2)将y=a+bx+ε称为线性回归模型,其中a+bx是确定性函
数,ε称为 随机误差 .
2.相关系数r的性质 (1)|r|≤1 ; (2)|r|越接近于1,x,y的线性相关程度越 强 ; (3)|r|越接近于0,x,y的线性相关程度越 弱 .
3.显著性检验 (1)提出统计假设H0:变量x,y 不具有线性相关关系 ; (2)如果以95%的把握作出判断,可以根据1-0.95=0.05与 n-2在附录2中查出一个r的 临界值r0.05(其中1-0.95=0.05称 为 检验水平 );
(3)计算样本 相关系数 r=
n
xi- x yi- y
5
xiyi=88×78+76×65+73×71+66×64+63×61=25 054.
i=1
5
x2i =882+762+732+662+632=27 174.
i=1
5
xiyi-5 x y
i=1
25 054-5×73.2×67.8
所以b^=
5
= 27 174-5×73.22 ≈0.625.
x2i -5 x 2
2.回归分析中,利用线性回归方程求出的函数值一定是 真实值吗? 答 不一定是真实值,利用线性回归方程求的值,在很 多时候是个预报值,例如,人的体重与身高存在一定的 线性关系,但体重除了受身高的影响外,还受其他因素 的影响,如饮食,是否喜欢运动等.
[预习导引] 1.线性回归方程
(1)对于 n 对观测数据(xi,yi)(i=1,2,3,…,n),直线方程y^=a^+b^x 称为这 n 对数据的线性回归方程.其中a^=y -b^ x 称为回归截距,
学生编号 学科编号 数学成绩(x) 物理成绩(y)
1
2
3
4
5
A
B
C
D
E
88 76 73 66 63
78 65 71 64 61
(1)画出散点图; 解 散点图如图.
(2)求物理成绩y对数学成绩x的线性回归方程; 解 x =15×(88+76+73+66+63)=73.2,
y =15×(78+65+71+64+61)=67.8.
(1)画出散点图; 解 根据表中的数据,画散点图,如图
从散点图看,数学成绩与学习时间线性相关.
(2)作相关性检验;
解 由已知数据求得
10
x =17.4, y =74.9, x2i =3 182,
i=1
10
10
y2i =58 375, xiyi=13 578,
i=1
i=1
所以相关系数 r=
10
xiyi-10 x y
x/人
2
4
5
8
y/元
20
30
50
50
70
(1)利用相关系数r判断y与x是否线性相关;
解 由表中数据,利用科学计算器计算得:
5
xiyi-5 x y
i=1
r=
≈0.975.
5
5
x2i -5 x 2 y2i -5 y 2
i=1
i=1
因为r>r0.05=0.878, 所以y与x之间具有线性相关关系.
(2)根据上表提供的数据,求出y关于x的线性回归方程. 解 根据以上数据可得,
5
xiyi-5 x y
i=1
b^=
=8.5,
5
x2i -5 x 2
i=1
∴a^= y -b^ x =44-8.5×5=1.5, ∴所求的线性回归方程为y^=1.5+8.5x.
要点二 求线性回归方程 例2 某班5名学生的数学和物理成绩如下表:
i=1
a^= y -b^ x ≈67.8-0.625×73.2=22.05. 所以 y 对 x 的线性回归方程是y^=0.625x+22.05.
(3)一名学生的数学成绩是96,试预测他的物理成绩. 解 x=96,则y^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.
规律方法 (1)散点图是定义在具有相关关系的两个变量基 础上的,对于性质不明确的两组数据,可先作散点图,在 图上看它们有无关系,关系的密切程度,然后再进行相关 回归分析. (2)求线性回归方程,首先应注意到,只有在散点图大致呈 线性时,求出的线性回归方程才有实际意义,否则,求出 的线性回归方程毫无意义.
故预计该同学数学成绩可得 77 分左右.
规律方法 判断变量的相关性通常有两种方式:一是散点 图;二是相关系数r.前者只能粗略的说明变量间具有相关 性,而后者从定量的角度分析变量相关性的强弱.
跟踪演练1 暑期社会实践中,小闲所在的小组调查了某地 家庭人口数x与每天对生活必需品的消费y的情况,得到的数 据如下表:
i=1
≈0.920.
10
10
x2i -10 x 2 yi2-10 y 2
i=1
i=1
而n=10时,r0.05=0.632, 所以|r|>r0.05, 所以有95%的把握认为数学成绩与学习时间之间具有线 性相关关系.
(3)若某同学每周用于数学学习的时间为18 h,试预测其数 学成绩. 解 用科学计算器计算, 可得线性回归方程为y^=3.53x+13.44. 当 x=18 时,y^=3.53×18+13.44≈77,
1.2 回归分析
[学习目标] 1.会建立线性回归模型分析两个变量间的相关关系. 2.能通过相关系数判断两个变量间的线性相关程度. 3.了解回归分析的基本思想和初步应用.
1 预习导学 2 课堂讲义 3 当堂检测
挑战自我,点点落实 重点难点,个个击破 当堂训练,体验成功
[知识链接] 1.什么叫回归分析? 答 回归分析是对具有相关关系的两个变量进行统计分析 的一种方法.