高中数学人教A版选修2-3优化练习:第三章 3.1 回归分析的基本思想及其初步应用 含解析

合集下载

【优选整合】高中数学人教A版 选修2-3 3.1.1回归分析的基本思想及其初步应用 测试(学生版)

【优选整合】高中数学人教A版 选修2-3 3.1.1回归分析的基本思想及其初步应用 测试(学生版)

3.1回归分析的基本思想及其初步应用(检测学生版)时间:40分钟 总分:60分班级: 姓名:一、 选择题(共6小题,每题5分,共30分)1.在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程; ④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x ,y 具有线性相关的结论,则在下列操作顺序中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好. 其中正确命题的个数是( ) A .0 B .1 C .2D .33.下图是根据变量x ,y 的观测数据(x i ,y i )(i =1,2,…,10)得到的散点图,由这些散点图可以判断变量x ,y 具有相关关系的图是( )A .①②B .①④C .②③D .③④4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A .y ^=0.4x +2.3B .y ^=2x -2.4 C .y ^=-2x +9.5 D .y ^=-0.3x +4.45.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:由表中数据,得线性回归方程y =-2x +a .当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72D .706.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( ) A .11.4万元 B .11.8万元 C .12.0万元D .12.2万元二、填空题(共2小题,每题5分,共10分)7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.8.下列说法正确的命题是________(填序号).①回归直线过样本点的中心(x ,y );②线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. 三、解答题(共2小题,共20分)9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得b ^=6.5, (1)求y 与x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.。

人教版A版高中数学选修2-3:3.1 回归分析的基本思想及其初步应用

人教版A版高中数学选修2-3:3.1 回归分析的基本思想及其初步应用
50 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39
假设线性回归方程为 :yˆ bˆx aˆ
由计算器得:线性回归方程为
yˆ 19.87x 463.73
线性模型
7
Q(aˆ,bˆ) ( yi yˆi ) 2 19818.9
残差
i1
yˆ 19.87x 463.73 100
就转换为z=bx+a
21
23
25
27
29
32
35
z=lgy
0.85 1.04 1.32 1.38 1.82 2.06 2.51
产卵数y/个
7
11
21
24
66
115 325
7
7
x 27.42 z 1.569 xi zi 318.58
xi2 5414
i 1
i 1
由计算器得:
zˆ关于x的线性回归方程为 zˆ 0.118x 1.665 ,
线性回归分析
其回归直线方程 y bx a 的截距和斜
率的最小二乘法估计公式:
n
n
y bˆ =
(xi - x)(yi - y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
2.残差eˆ
残差平方和越
对于样本点(xi,yi)的随机误差 小精确度越高
学习目标
1、了解回归模型的选择,进一步理解非线性 模型通过变换转化为线性回归模型的方法;
2、会用残差及相关系数分析回归模型, 体会不同模型拟合数据的效果;

人教版高中数学选修2-3第三章3.1回归分析的基本思想及其初步应用

人教版高中数学选修2-3第三章3.1回归分析的基本思想及其初步应用

导入新课在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为:画散点图求回归直线方程用直线方程进行预报提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习对具有相关关系的两个变量进行统计分析的一种常用方法——回归分析.1.1回归分析的基本思想及其初步应用教学目标知识目标通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.了解回归模型和函数模型的区别.任何模型只能近似描述实际问题.了解残差分析和指标R2的含义.能力目标具有初步应用回归分析的能力.情感目标通过对回归分析的基本思想的学习,能够在现实生活中应用此思想.教学重难点(1)了解线性回归模型与函数模型的差异;(2)了解判断刻画模型拟合效果的方法-相关指数和残差分析.解释残差变量的含义,了解偏差平方和分解的思想.探究对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),我们知道回归直线y=bx+a 的斜率和截距的最小二乘估计分别为ˆˆˆn i i i=1n 2i i=1(x -x)(y -y)b =,(x-x)a=y -bx,∑∑其中n ni ii=1i=111x=x,y=y,(x,y) n n∑∑称为样本点的中心,你能推导出这两个计算公式吗?回归直线过样本点的中心从已经学过的知识我们知道,斜距和斜率分别是使aˆb ˆˆi i i i Q(α,β)=y -y=y -(βx +α)取最小时的值.由于α,β∑n 2i i i=1Q(α,β)=[y -βx -(y -βx)+(y -βx)-α]n 2i i i i i=12{[y -βx -(y -βx)]+2[y -βx -(y -βx)][(y -βx)-α]+[(y -βx)-α]}⨯=∑ni i i=1ni i i=1[y -βx -(y -βx)](y -βx -α) =(y -βx -α)[y -βx -(y -βx)]∑∑注意到n ni i i=1i=1=(y -βx -α)[y -βx -n(y -βx)]∑∑=(y -βx-α)[ny -n βx-n(y -βx)]=0,n n 2i i i i i=1i=12=[y -βx -(y -βx)]+2[y -βx -(y -βx)](y -βx-α)+n(y -βx-α),∑∑继续∑n22i i i=1Q(α,β)=[y -βx -(y -βx)]+n(y -βx -α),因此∑∑∑22nn n22i i i i i=1i=1i=1=β(x -x)-2β(x -x)(y -y)+(y -y)+n(y -βx-α)⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦∑∑∑∑∑∑2nn22i i i i n2i=1i=1i nn 22i=1i i i=1i=12ni i=1(x -x)(y -y)[(x -x)(y -y)]=n(y -βx -α)+(x -x)β--(x -x)(x -x) +(y -y)继续在上式中,后两项和无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0,即有∑∑nii i=1n2ii=1(x-x)(y -y)β=(x-x)这正是我们所要推导的公式.α,β例题1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.解答第一步:画散点图020406080150155160165170175180身高/cm体重/k g第二步:求回归方程第三步:代值计算探究身高为172c m的女大学生的体重一定是60.316kg 吗?如果不是,其原因是什么?计算器得:故线性回归方程:当x=172时,0.849.b-85.712,a==ˆˆ85.712.-0.849x y=ˆˆy0.849172-85.712 60.316(kg)=⨯=020406080150155160165170175180身高/cm体重/k g显然,身高172cm 的女大学生的体重不一定是60.316kg ,但一般可以认为她的体重在60.316kg 左右,下图中的样本点和回归直线的相互位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回归模型y=bx+a+e来表示,这里a和b为模型的未知参数,e 是y与bx+a之间的误差.通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)=σ2>0,这样线性回归的完整表达式为y=bx+a+eE(e)=0,D(e)=σ2.注意存在误差的原因(1)随机误差,其大小取决于随机误差的方差. 在线性回归模型中,随机误差e 的方差 2越小,用bx+a 预报真实值y 的精度越高.(2)和为斜率和截距的估计值,它们与真实值a 和b 之间也存在误差.b ˆa ˆ要牢记!探究在线性回归模型中,e 是用bx+a 预报真实值y 的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?在实际应用中,我们用回归方程a ˆxb ˆyˆ+=中的估计bx+a. 由于随机误差e=y-(bx+a),所以是e 的估计值. 对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )yˆy ˆ-y eˆ=而言,它们的随机误差为e i =y i -bx i -a ,i=1,2,…,n ,其估计值为n,1,,2,...,i a ˆx b ˆy y ˆy e ˆi i i i =--=-=i eˆ称为相应于点(x i ,y i )的残差(residual).要牢记!思考如何发现数据中的错误?如何衡量模型的拟合效果?(1)可以利用残差图来分析残差特性;(2)可以利用.ˆˆnn22i i i2i =1i =1nn 22i i i =1i =1(y -y )(y -y)R =1-=(y -y)(y -y)∑∑∑∑来刻画回归的效果.何为残差图?残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.编号12345671020304050607080-10-20-30-40-50-6090100要牢记!对R 2的理解(1)在含有一个解释变量的线性模型中,R 2恰好等于相关系数r 的平方.(2)对于已经获取的样本数据,R 2表达式中的为确定的数.因此R 2越大,意味着残差平方和越小,即模型的拟合效果越好;反之,越差.∑=n1i 2i )y -(y ∑=n1i 2i)y -(y要牢记!用身高预报体重时,需要注意以下问题(1)回归方程只适用于我们所研究的样本总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常,若有异常,检查数据是否有误,或模型是否合适等.要牢记!为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型和试比较哪一个模型拟合的效果更好.例题2关于X 与Y 有如下数据:x 24568y3040605070ˆy=6.5x +17.5ˆy =7x +17分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.ˆ∑∑52i i 2i=1152ii=1(y -y )155R =1-=1-=0.8451000(y-y)22R =1-ˆ∑∑52i i i=152i i=1(y -y )180=1-=0.821000(y -y),84.5%>82%,所以甲选用的模型拟合效果较好.解答课堂小结1.数学知识(1)建立回归模型及残差图分析的基本步骤;(2)不同模型拟合效果的比较方法;(3)相关指数和残差的分析.2. 数学思想数形结合的思想,化归思想及整体思想.3.数学方法数形结合法,转化法,换元法.高考链接1. (2007年浙江)某校有学生2000人,其中高三学生500人,为了了解学生身体素质情况,采用按年级分层抽样的方法,从该学生中抽取一个200人的样本,则样本中高三学生的人数为_________.解析:本题考查抽样的方法. 由已知抽样比200/2000=1/10,故样本中高三学生数为500*(1/10)=50.2.(2007年广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y 2.534 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法y=bx+a .求出y关于x的线性回归方程ˆˆ(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解析:(1)如下图01234567012345产量能耗66.54.5645342.53(2)y x in1i i =⨯+⨯+⨯+⨯=∑= 4.546543x =+++= 3.544.5432.5y =+++=866543i2222n1i 2x =+++=∑=ˆ266.5-4 4.5 3.566.5-63b ===0.786-4 4.586-81⨯⨯⨯ˆˆa=Y-bX =3.5-0.7 4.5=0.35⨯故线性回归方程为y=0.7x+0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35.课堂练习1.选择(1)下列说法中正确的有:()C①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(由函数关系),在散点图上各个点均在一条直线上A. ①②B. ②③C. ①③D. ①②③解析:若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确. r<0,表示两个变量负相关,x增大时,y也相应减小,故②错误. |r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.(2)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合A效果最好的模型是()A.模型Ⅰ的相关系数r为0.98B.模型Ⅱ的相关系数r为0.80C.模型Ⅲ的相关系数r为0.50D.模型Ⅳ的相关系数r为0.25解析:根据相关系数的定义和计算公式可知,|r|≦1,且|r|越接近于1,相关程度越大,拟合效果越好;|r|越接近于0,相关程度越小,拟合效果越弱.(3)对有线性相关关系的两个变量建立的回归直线方程中,回归系数()A.可以小于0 B.小于0 C.能等于0 D.只能等于0a xb y ˆˆˆ+=b ˆ解析: 时,得r=0,这时不具有线性相关性,但能大于0,也能小于0.ˆb0=ˆbA2.解答题(1)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y),数据如下:学生号12345678910 x12010811710410311010410599108 y84648468696869465771试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系?查表得自由度为10-2=8相应的相关关系临界值由知,两次数学考试成绩有显著性的线性相关关系.∑==101i 2i116584x∑==101i 2i47384y107.8x =68y =73796yx 101i ii∑==易得则相关系数为解答227379610107.868r 0.7506(11658410107.8)(473841068)-⨯⨯=≈-⨯-⨯0.05r 0.6021 =0.05r r >(2)观察两相关量得如下数据:x-1-2-3-4-553421 y-9-7-5-3-115379求两变量间的回归方程.i 12345678910x i -1-2-3-4-553421y i -9-7-5-3-115379x i y i 9141512551512149解答列表:∑∑∑10101022ii iii=1i=1i=1x =0,y =0,=110,=330,=110.y y xx∑∑10i i i=11022i i=1-10x y 110-100b ===1110-100-10y x x x ⨯⨯⨯a =y -bx =0-b 0=0⨯ˆy=x .所求回归直线方程为习题解答1. 画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.2. 分析残差可以帮助我们解决以下几个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错;(2)分析残差图可以发现模型选择是否合适.3.(1)解释变量和预报变量的关系是线性函数关系;(2)R2=1.。

高中数学人教A版选修2-3练习:3.1 回归分析的基本思想及其初步应用 pdf版含解析

高中数学人教A版选修2-3练习:3.1 回归分析的基本思想及其初步应用 pdf版含解析

32 4
40
行判断,甲回归方程的数据准确率为40=5,而乙回归方程的数据准确率为60=
2 3.显然甲的准确率高些,因此甲回归方程好些.
【答案】 甲
8.如果某地的财政收入 x 与支出 y 满足线性回归方程 y=bx+a+e(单位:
亿元),其中 b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为 10 亿元,则
C.y=c+bx D.y=b+cx 【解析】 由 y=aebx 得 ln y=ln(aebx),∴ln y=ln a+ ln ebx,
∴ln y=ln a+bx,∴U=c+bx.故选 A. 【答案】 A
5.为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的身高数据如
表所示:
父亲身高 x(cm) 174 176 176 176 178
(2)由散点图看出样本点分布在一条指数函数 y=c1ec2x 的周围,于是令 z=ln y,则
x1
2
3
4
5
6
z 1.79 2.48 3.22 3.89 4.55 5.25
^z
^y
由计算器算得, =0.69x+1.112,则有 =e0.69x+1.112.
[能力提升]
1.(2016·青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如
-x -y 【解析】 回归直线一定过样本点的中心( , ),故 C 正确. 【答案】 C 2.甲、乙、丙、丁四位同学在建立变量 x,y 的回归模型时,分别选择了 4 种不同模型,计算可得它们的相关指数 R2 分别如下表:
甲乙丙丁 R2 0.98 0.78 0.50 0.85 哪位同学建立的回归模型拟合效果最好?( ) A.甲 B.乙 C.丙 D.丁 【解析】 相关指数 R2 越大,表示回归模型的拟合效果越好. 【答案】 A 3.对变量 x,y 进行回归分析时,依据得到的 4 个不同的回归模型画出残 差图,则下列模型拟合精度最高的是( )

高中数学人教A版选修2-3第三章:3.1回归分析的基本思想及其初步应用 课件

高中数学人教A版选修2-3第三章:3.1回归分析的基本思想及其初步应用 课件

从散点图可以看到,样本点散布在某一条直线的 附近,而不是一条直线上,所以不能用一次函数 y=bx+a来描述它们之间的关系。
这时我们用下面的线性回归模型来描述身高和体
重的关系:y=bx+a+e
其中a和b为模型的未知参数,
e是y与 yˆ 之间的误差,通常e称为随机误差。
产生随机误差e的原因是什么?
(1)所用确定性函数模拟不恰当; (2)忽略了某些因素的影响; (3)观测误差,如使用的测量工具不同等。
4.线性回归模型y=bx+a+e中, 把自变量x称为解释变量, 把因变量y称为预报变量。
^
^
5.残差: ei yi yi
n
^
6.残差平方和:
( yi yi )2
i 1
n
7.总偏差平方和: ( yi y)2
i 1
n
^
( yi y)2
8.相关指数:R2
1
i 1 n
( yi y)2
新课讲解
例 从某大学中随机选出8名女大学生,其 身高和体重数据如下表:
编号 1 2 3 4 5 6 7 8 身高 165 165 157 170 175 165 155 170 体重 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的 回归方程,并预报一名身高为172cm的女 大学生的体重。
三、回归直线方程:最小二乘法
1、所求回归直线方程为 yˆ = bˆ x + aˆ ,其中:
n
n
y bˆ =
(xi - x)(yi - y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1

高中数学人教A版选修2-3优化练习:第三章 3.1 回归分析的基本思想及其初步应用 Word版含解析

高中数学人教A版选修2-3优化练习:第三章 3.1 回归分析的基本思想及其初步应用 Word版含解析

[课时作业] [A 组 基础巩固]1.下列各关系中是相关关系的是 ( )①路程与时间、速度的关系;②加速度与力的关系;③产品成本与产量的关系;④圆周长与圆面积的关系;⑤广告费支出与销售额的关系. A .①②④ B .①③⑤ C .③⑤D .③④⑤解析:①②④都是确定的函数关系. 答案:C2.下列关于残差的叙述正确的是( ) A .残差就是随机误差 B .残差就是方差 C .残差都是正数D .残差可用来判断模型拟合的效果 解析:由残差的相关知识可知D 正确. 答案:D3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那么下列说法中不正确的是( ) A .直线y ^=b ^x +a ^必经过点(x -,y -)B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y ^=b ^x +a ^的斜率为1ni =∑x i y i -n x - y- 1n i =∑x 2i -n x2D .直线y ^=b ^x +a ^的纵截距为y -b ^x解析:由用最小二乘法求回归直线方程的公式可知,A ,C ,D 都正确,B 不正确,回归直线可以不经过样本数据中的任何一个点.故应选B. 答案:B4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4解析:由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 答案:A5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y ^=0.577x -0.448(x 为人的年龄,y (单位:%)为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A .年龄为37岁的人体内脂肪含量都为20.90%B .年龄为37岁的人体内脂肪含量为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D .年龄为37岁的大部分的人体内脂肪含量为31.50%解析:当x =37时,y ^=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%. 答案:C6.如图是x 和y 的样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:经计算,去掉D (3, 10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大. 答案:D (3,10)7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x +1)+0.321]-[0.254x +0.321]=0.254. 答案:0.2548.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:月平均气温x (℃) 17 13 8 2 月销售量y (件)24334055由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________. 解析:由表格得(x ,y )为(10,38),又(x ,y )在回归直线y ^=b ^x +a ^上,且b ^≈-2, ∴38=-2×10+a ^,a ^=58,所以y ^=-2x +58,当x =6时,y ^=-2×6+58=46. 答案:469.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如表:温度(x ) 0 10 20 50 70 溶解度(y )66.776.085.0112.3128.0由资料看y 与解析:x =30,y =66.7+76.0+85.0+112.3+128.05=93.6.b ^=51i =∑x i y i -5x -y- 51i =∑x 2i -5x2=17 035-14 0407 900-4 500=2 9953 400≈0.880 9. a ^=y -b ^x =93.6-0.880 9×30=67.173. 故回归方程为y ^=0.880 9x +67.173.10.某地10户家庭的年收入和年饮食支出的统计资料如下表: 年收入x /万元 24466677810年饮食支出y/万元0.91.41.62.02.11.91.82.12.22.3(2)如果某家庭年收入为9万元,预测其年饮食支出.解析:由题意知,年收入x 为解释变量,年饮食支出y 为预报变量,作散点图如下图所示:从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系. (2)x =6,y =1.83,∑i =110x 2i =406,∑i =110y 2i =35.13,∑i =110x i y i =117.7,b ^≈0.172,a ^=y -b ^x =0.798,从而得到回归直线方程为y ^=0.172x +0.798. 当x =9时,y ^=0.172×9+0.798=2.346(万元).[B 组 能力提升]1.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2如表:A .甲B .乙C .丙D .丁解析:相关指数R 2越大,表示回归模型的拟合效果越好. 答案:A2.在一次试验中,测得(x ,y )的四组值分别是(1,2),(2,3),(3,4),(4,5),则y 与x 间的回归方程为( ) A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1D.y ^=x -1解析:易知变量y 与x 具有线性相关关系,且b ^=1,x =2.5,y =3.5,∴a ^=3.5-1×2.5=1,故可得出线性回归方程为y ^=x +1. 答案:A3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________. 解析:由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08. 答案:y ^=1.23x +0.084.某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y =b x +a 中的b ≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.(已知回归系数b ^=∑i =1nx i y i-n x y∑i =1nx 2i -n x2,a ^=y -b ^x )解析:根据表格中的数据可求得x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40.∴a ^=y -b ^x =40-(-2)×10=60,∴y ^=-2x +60, 当x =-5时,y ^=-2×(-5)+60=70. 答案:705.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如表对应数据:x 10 15 17 20 25 28 32 y11.31.822.62.73.3(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解析:(1)散点图如图:(2)列表,并利用科学计算器进行有关计算.i 1 2 3 4 5 6 7 x i 10 15 17 20 25 28 32 y i11.31.822.62.73.3x =21,y =2.1∑i =17x 2i =3 447,∑i =17y 2i =34.87,∑i =17x i y i =346.3于是b ^=346.3-7×21×2.13 447-7×212≈0.104.a ^=2.1-0.104×21=-0.084, 因此回归直线方程为y ^=0.104x -0.084.(3)当x =24时,y =0.104×24-0.084=2.412(千万元).6.为探究某弹簧悬挂物体的质量x (单位:g)对弹簧长度y (单位:cm)的影响,分别将6个不同质量的物体悬挂在弹簧下,并测量弹簧的长度,数据如表所示(弹簧的质量忽略不计):x/g 5 10 15 20 25 30 y /cm7.258.128.959.9010.911.8(1)(2)根据散点图判断是否可以用线性回归模型进行拟合,如果可以,求y 与x 之间的回归直线方程;(3)求R 2,并对拟合效果做出评价. 解析:(1)散点图如图所示:(2)由于样本点分布在一条直线附近,所以可以用线性回归模型进行拟合.计算可得x =17.5,y ≈9.487,从而b ^=∑i =16(x i -x )(y i -y )∑i =16(x i -x )2≈0.183,a ^=y -b ^x ≈6.285.因此,y 与x 之间的回归直线方程为y ^=0.183x +6. 285. (3)因为∑i =16(y i -y ^i )2=0.013 175,∑i =16(y i -y )2=14.678 33,所以R 2=1-∑i =16(y i -y ^i )2∑i =16(y i -y )2≈0.999.由于R 2非常接近于1,因此拟合效果较好.。

高中数学人教A版选修2-3第三章3.1回归分析的基本思想及其初步应用 课件(共46张PPT)

高中数学人教A版选修2-3第三章3.1回归分析的基本思想及其初步应用 课件(共46张PPT)

现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
(3)预报一名身高为172cm的女大学生的体重?
【解】列出下表
编号i 1
23 4
5
6
7
8
身高xi 165 165 157 170 175 165 155 170
体重yi 48 57 50 54 64 61 43 59
xiyi 7920 9405 7850 9180 11200 10065 6665 10030
-1.0 -0.75 -0.25 0 0.25 0.5 1.0
r
负相关程度增加 正相关程度增加
6、用相关指数R2来刻画拟合效果
n
n
( yi yi )2
(yi y)2
R2
1
i 1 n
i1 n
[0,1]
残差平 方和
( yi y)2
( yi y)2
总偏差
i 1
i 1
平方和
1、R2 1,说明回归方程拟合的越好; R20,说明回归方程拟合的越差。
型来拟合
z ax b e
(2) ②用模型y c3 x2 c4来拟合,令t x2, 则y c3t c4,
列出变换后数据表并画出y与t 的散点图:
t 441 529 625 729 841 1024 1225
y 7 11 21 24 66 115 325
环境等因素; 3、身高 y 的观测误差。

【原创】人教A版选修2-3:第三章 3.1 回归分析的基本思想及其初步应用

【原创】人教A版选修2-3:第三章  3.1  回归分析的基本思想及其初步应用

首页
上一页
下一页
末页
结束
题点二:非线性回归分析 2.为了研究某种细菌随时间 x 变化繁殖个数 y 的变化,收集数据
如下 时间 x/天 1 2 3 4 5 6 繁殖个数 y 6 12 25 49 95 190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的 散点图; (2)求 y 与 x 之间的回归方程.
在 y 轴上.
(× )
(3)R2 越小, 线性回归模型的拟合效果越好.
(× )
首页
上一页
下一页
末页
结束
2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________. 答案:正相关
3.在残差分析中, 残差图的纵坐标为________. 答案:残差
首页
上一页
下一页
末页
结束
首页
上一页
下一页
末页
结束
预习课本 P80~89,思考并完成以下问题
1.什么是回归分析?
2.什么是线性回归模型?
3.求线性回归方程的步骤是什么?
首页
上一页
下一页
末页
结束
[新知初探]
1.回归分析 (1)回归分析 回归分析是对具有 相关关系 的两个变量进行统计分析的一 种常用方法.
首页
上一页
下一页
首页
上一页
下一页
末页
结束
用已知向量表示未知向量 题点一:线性回归分析 1.为研究质量 x(单位:g)对弹簧长度 y(单位:cm)的影响,
对不同质量的 6 个物体进行测量,数据如表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[课时作业] [A 组 基础巩固]1.下列各关系中是相关关系的是 ( )①路程与时间、速度的关系;②加速度与力的关系;③产品成本与产量的关系;④圆周长与圆面积的关系;⑤广告费支出与销售额的关系. A .①②④ B .①③⑤ C .③⑤D .③④⑤解析:①②④都是确定的函数关系. 答案:C2.下列关于残差的叙述正确的是( ) A .残差就是随机误差 B .残差就是方差 C .残差都是正数D .残差可用来判断模型拟合的效果 解析:由残差的相关知识可知D 正确. 答案:D3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那么下列说法中不正确的是( ) A .直线y ^=b ^x +a ^必经过点(x -,y -)B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y ^=b ^x +a ^的斜率为1ni =∑x i y i -n x - y-1ni =∑x 2i -nx2D .直线y ^=b ^x +a ^的纵截距为y -b ^x解析:由用最小二乘法求回归直线方程的公式可知,A ,C ,D 都正确,B 不正确,回归直线可以不经过样本数据中的任何一个点.故应选B. 答案:B4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4解析:由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 答案:A5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y ^=0.577x -0.448(x 为人的年龄,y (单位:%)为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A .年龄为37岁的人体内脂肪含量都为20.90%B .年龄为37岁的人体内脂肪含量为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D .年龄为37岁的大部分的人体内脂肪含量为31.50%解析:当x =37时,y ^=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%. 答案:C6.如图是x 和y 的样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:经计算,去掉D (3, 10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大. 答案:D (3,10)7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x +1)+0.321]-[0.254x +0.321]=0.254. 答案:0.2548.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________. 解析:由表格得(x ,y )为(10,38),又(x ,y )在回归直线y ^=b ^x +a ^上,且b ^≈-2, ∴38=-2×10+a ^,a ^=58,所以y ^=-2x +58,当x =6时,y ^=-2×6+58=46. 答案:469.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如表:由资料看y 与解析:x =30,y =66.7+76.0+85.0+112.3+128.05=93.6.b ^=51i =∑x i y i -5x -y-51i =∑x 2i -5x2=17 035-14 0407 900-4 500=2 9953 400≈0.880 9. a ^=y -b ^x =93.6-0.880 9×30=67.173. 故回归方程为y ^=0.880 9x +67.173.10.某地10户家庭的年收入和年饮食支出的统计资料如下表:(2)如果某家庭年收入为9万元,预测其年饮食支出.解析:由题意知,年收入x 为解释变量,年饮食支出y 为预报变量,作散点图如下图所示:从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系. (2)x =6,y =1.83,∑i =110x 2i =406,∑i =110y 2i =35.13,∑i =110x i y i =117.7,b ^≈0.172,a ^=y -b ^x =0.798,从而得到回归直线方程为y ^=0.172x +0.798. 当x =9时,y ^=0.172×9+0.798=2.346(万元).[B 组 能力提升]1.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2如表:A .甲B .乙C .丙D .丁解析:相关指数R 2越大,表示回归模型的拟合效果越好. 答案:A2.在一次试验中,测得(x ,y )的四组值分别是(1,2),(2,3),(3,4),(4,5),则y 与x 间的回归方程为( ) A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1D.y ^=x -1解析:易知变量y 与x 具有线性相关关系,且b ^=1,x =2.5,y =3.5,∴a ^=3.5-1×2.5=1,故可得出线性回归方程为y ^=x +1. 答案:A3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________. 解析:由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08. 答案:y ^=1.23x +0.084.某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y =b x +a 中的b ≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.(已知回归系数b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^=y -b ^x )解析:根据表格中的数据可求得x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40.∴a ^=y -b ^x =40-(-2)×10=60,∴y ^=-2x +60, 当x =-5时,y ^=-2×(-5)+60=70. 答案:705.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如表对应数据:(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解析:(1)散点图如图:(2)列表,并利用科学计算器进行有关计算.于是b ^=346.3-7×21×2.13 447-7×212≈0.104.a ^=2.1-0.104×21=-0.084, 因此回归直线方程为y ^=0.104x -0.084.(3)当x =24时,y =0.104×24-0.084=2.412(千万元).6.为探究某弹簧悬挂物体的质量x (单位:g)对弹簧长度y (单位:cm)的影响,分别将6个不同质量的物体悬挂在弹簧下,并测量弹簧的长度,数据如表所示(弹簧的质量忽略不计):(1)(2)根据散点图判断是否可以用线性回归模型进行拟合,如果可以,求y 与x 之间的回归直线方程;(3)求R 2,并对拟合效果做出评价. 解析:(1)散点图如图所示:(2)由于样本点分布在一条直线附近,所以可以用线性回归模型进行拟合.计算可得x =17.5,y ≈9.487,从而b ^=∑i =16(x i -x )(y i -y )∑i =16(x i -x )2≈0.183,a ^=y -b ^x ≈6.285.因此,y 与x 之间的回归直线方程为y ^=0.183x +6. 285. (3)因为∑i =16(y i -y ^i )2=0.013 175,∑i =16(y i -y )2=14.678 33,所以R 2=1-∑i =16(y i -y ^i )2∑i =16(y i -y )2≈0.999.由于R 2非常接近于1,因此拟合效果较好.。

相关文档
最新文档