人教版高中数学必修三 第二章 统计变量间的相关关系错例分析
人教A版高中数学必修3《第二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》_1

《相关关系的强与弱》教学设计---彭凤海 课题 《相关关系的强与弱》 教学对象 课时 第一课时 一、教材分析 本节课是人教版数学必修3 第二章 2.3变量间的相关关系“阅读与思考”部分的“相关关系的强与弱”的内容。在前面教学中里,我组织同学们完成了“2.3变量间的相关关系”主体内容的学习,让他们初步体验和了解变量之间的相关关系,通过学习散点图、回归直线及其方程,对变量之间的相关关系有了初步的定性的了解。本节课从量的角度进一步研究两个变量之间的相关关系的强与弱,引出协方差和相关系数。
二、教学目标 1.从量的角度去分析两个变量之间的线性相关关系的强与弱; 2.结合均值和方差理解相关系数能够表示相关关系强与弱的合理性; 3.通过自主探究,得到相关系数的范围,并结合散点图理解相关系数的取值与相关强度之间的对应关系; 4.在探究过程中,学生有了感性的判断和理性的思考,有利于训练他们的数学思维,开阔他们的视野。
三、教学重点和难点 重点:协方差与相关系数的理解 难点:相关系数及其取值范围的推导
四、教学策略选择与设计 本节课我采用讲授法和引导发现式的教学方法,并利用多媒体辅助教学。通过教师在教学过程中的点拨,让学生动手操作、主动思考来达到对知识的发现和接受.
五、教学过程
教学 环节 教学内容 教学活动 设计意图 教师活动 学生活动 问 题 引 入
1.有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。 2.在散点图中,从整体上点的分布看,大致在一条直线附近,我们就称物理成绩和数学成绩这两个变量之间具有线性相关关系,这条直线叫做回归直线。我们可以利用线性关系来进行预测。 1.利用物理成绩和数学成绩之间的这种线性关系来进行预测的准确度有多高?即物理成绩与数学成绩的相关关系的程度有多大?这是要去考虑的一个问题。 2.书写板书课题名称:相关关系的强与弱 1.回顾之前所学:相关关系,散点图,回归直线。 1.从学生学过的知识出发,引出本节课学习的必要性,在课前激发学生对本节课的兴趣,引起他们的重视。 新 课 讲 解
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3

2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)

总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
高中数学人教A版必修3 2.3.1-2.3-2 变量之间的相关关系 两个变量的线性相关 课件(44张)

第二章 统 计
1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是
() A.正相关 C.无相关
B.负相关 D.不确定
解析:选 B.烟吸得越多,则健康程度越差.
栏目 导引
第二章 统 计
2.关于回归直线方程^y=^a+^bx 的叙述正确的是( )
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
栏目 导引
第二章 统 计
(3)最小二乘法 求回归直线方程^y =^b x+^a 时,使得样本数据的点到回归直线 的_距__离__的__平__方__和__最小的方法叫做最小二乘法.
其中^b是回归方程的_斜__率__,^a是回归方程在 y 轴上的截距.
栏目 导引
第二章 统 计
1.散点图的作用 散点图形象地反映了各对数据的密切程度.根据散点图中点的 分布趋势分析两个变量之间的关系,可直观地判断并得出结 论.
(2)①散点图如图所示.
第二章 统 计
②由图可知,各点散布在从左下角到右上角的区域内,因此, 腐蚀深度与腐蚀时间成正相关,即腐蚀时间越长,腐蚀深度越 深.
栏目 导引
第二章 统 计
③从散点图可以看出,这些点大致分布在一条直线的附近,因 此,两变量成线性相关关系.利用计算器求得回归 方程为^y=0.304x+5.344. ④由③知,当腐蚀时间为 100 s 时,^y=0.304×100+5.344= 35.744(μm),即此时腐蚀深度约是 35.744 μm.
^a=-y -^b-x =11.47, 因此回归直线方程为^y =11.47+2.62x.
栏目 导引
第二章 统 计
探究点 3 线性回归方程的应用
(1)某单位为了解用电量 y(度)与气温 x(℃)之间的关系,
高中数学 第二章 统计 2.3 变量间的相关关系课件 新人教A版必修3

(839 分)
a= y -b x =3.5-0.7×4.5=0.35,(9 分) 故线性回归方程为 y=0.7x+0.35.(10 分) (3)根据回归方程预测,现在生产 100 吨产品消耗的标准煤的数量为 0.7×100 +0.35=70.35,(11 分) 故耗能约降低了 90-70.35=19.65(吨标准煤).③(12 分)
(2)利用回归方程,可以预测并对总体进行估计,如回归方程为∧y=b∧x+a∧,当 x=x0 时的估计值 y0=b∧x0+a∧.
32
[变式训练]
3.某企业的某种产品每日产量与单位成本数据如下:
月份
123456
每日产量 x/千件 2 3 4 3 4 5
单位成本 y(元/件) 73 72 71 73 69 68
x 3 45 6 y 2.5 3 4 4.5
36
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 y= bx+a; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.试根据(2)求出 的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准 煤?
下表是某地搜集到的新房屋的销售价格 y(单位:万元)和房屋的面积
x(单位:m2)的数据:
x 115 110 80 135 105
(1)求回归方程;
y 44.8 41.6 38.4 49.2 42
(2)根据(1)的结果估计当房屋面积为 150 m2 时的销售价格.
[思路探究] (1)利用公式求出线性回归方程的系数a∧、b∧可得回归方程;(2)当
x0123
y1357 则 y 与 x 的线性回归方程∧y=b∧x+a∧必过点( )
2017-2018学年高中数学必修三教材用书:第二章 统计 2

2.3变量间的相关关系[提出问题](1)吸烟可导致肺癌.(2)下表是某小卖部6天卖出热茶的杯数与当天气温的对比表.(3)y=x2+5(x问题1:吸烟一定可以导致肺癌吗?吸烟与患肺癌有关吗?提示:吸烟不一定患肺癌,但它们有一定的关系.问题2:小卖部中卖出的热茶杯数与当天气温有关吗?两者之间是如何变化的?提示:两者间有关系.随着气温的降低卖出的热茶杯数增加.问题3:y=x2+5(x∈R)中,x,y间是什么关系?提示:y与x间是函数关系,是一种确定关系.[导入新知]相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.[化解疑难]两个变量间的关系分类两个变量间的关系分为三类:一类是确定性的函数关系,如正方形边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,如某位同学的“物理成绩”与“数学成绩”之间的关系;再一类是不相关,即两变量没有任何关系.[提出问题]下表是某地搜集到的新房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:问题1:以x提示:如图所示:问题2:房屋的销售价格与房屋的面积有关系吗?提示:有关系.问题3:怎样描述房屋的销售价格与房屋的面积之间的变化关系?提示:大体上来看,面积越大,售价越高.但不是正比例函数关系.[导入新知]1.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.2.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[化解疑难]对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就越短.[提出问题]问题:在“知识点二”的问题中,能否估计出房屋面积为120 m2时的销售价格?如何估计?提示:能.根据散点图作出一条直线,求出直线方程,即可预测.[导入新知]回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线;(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ); ②设所求回归方程为,其中a ^,b ^是待定参数;③由最小二乘法得其中:b ^是回归方程的斜率,a ^是截距. [化解疑难]回归直线方程与直线方程的区别线性回归直线方程中y 的上方加记号“^ ”是与实际值y 相区别,因为线性回归方程中“y ^”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,y ^的值只是比较接近,但存在一定的误差,即y =y ^+e (其中e 为随机变量),预测值y ^与实际值y 的接近程度由随机变量e 的标准差决定.[例1] (1)) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.②判断y与x是否具有线性相关关系.[解](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.(2)①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x有线性相关关系.[答案](1)②④[类题通法]两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是______(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.答案:①④[例2] 某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)(2)若销售额和利润额具有相关关系,计算利润额y 对销售额x 的回归直线方程. [解] (1)散点图如下:(2)数据如下表:可以求得b ^=0.5,a ^=0.4, 线性回归方程为y ^=0.5x +0.4. [类题通法]求线性回归方程的步骤(1)计算平均数x ,y ; (2)计算x i 与y i 的积,求∑i =1nx i y i ;(3)计算∑i =1nx 2i ;(4)将结果代入公式b ^=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x2,求b ^;(5)用a ^=y -b ^x ,求a ^; (6)写出回归方程. [活学活用]1.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A.y ^=x -1 B.y ^=x +1 C.y ^=88+12xD.y ^=176 解析:选C 由题意得 x =174+176+176+176+1785=176(cm),y =175+175+176+177+1775=176(cm),由于(x ,y )一定满足线性回归方程,经验证知选C. 2.已知变量x ,y 有如下对应数据:(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示:(2)x =1+2+3+44=52,y =1+3+4+54=134,∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝⎛⎭⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.[例3] 零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:(1)如果y (2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制在什么范围内?[解] (1)由题意,可得x =12.5,y =8.25,∑i =14x i y i =438,∑i =14x 2i =660,则b ^=438-4×12.5×8.25660-4×12.52≈0.728 6,a ^=y -b ^x =-0.857 5.所以回归直线的方程为y ^=0.728 6x -0.857 5. (2)要使y ≤10,则0.728 6x -0.857 5≤10, 解得x ≤14.90.所以机器的转速应该控制在15转/秒以下. [类题通法]回归分析的三个步骤(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义;(2)求回归直线方程,其关键是正确地求得a ^,b ^; (3)根据直线方程进行预测. [活学活用](全国乙卷)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a^=y -b ^t .解:(1)由折线图中数据和附注中参考数据得 t =4,∑i =17(t i -t )2=28,∑i =17(y i -y )2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得 b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.6.线性相关关系的判断及回归方程的应用[典例] 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (单位:吨)与相应的生产能耗y (单位:吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?[解题流程][规范解答]x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, i =1nx 2i =32+42+52+62=86,∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35, 故线性回归方程为y ^=0.7x +0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能约减少了90-70.35=19.65(吨)标准煤.[类题通法]解答回归分析问题的四个注意点 (1)先用散点图确定是否线性相关; (2)准确计算回归方程中的各个系数; (3)回归直线必过样本中心;(4)利用回归直线方程求出的值只是估计值,会与实际值有一定的误差. [活学活用]某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?(以下数据供选择:∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487)解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.[随堂即时演练]1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ^=-10x +200 B .y ^=10x +200 C.y ^=-10x -200D .y ^=10x -200解析:选A ∵商品销售量y (件)与销售价格x (元/件)负相关,∴b <0,排除B ,D.又∵x =0时,y >0,∴选A.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80 kg 代入回归方程可得其预测值 y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.__________________. 解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50).设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+b ^, 即b ^=17.5,∴回归直线方程为y ^=6.5x +17.5. 答案:y ^=6.5x +17.55.2015年元旦前夕,某市统计局统计了该市2014年10户家庭的年收入和年饮食支出的统计资料如下表:(1)如果已知y 与x 是线性相关的,求回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解:(1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81, ∴y ^=0.17x +0.81.∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.[课时达标检测]一、选择题1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤答案:C2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④答案:D3.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预测广告费用为6万元时的销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元答案:B4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案:D5.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0 D .只能小于0答案:C 二、填空题6.正常情况下,年龄在18岁到38岁之间的人,体重y (单位:kg)对身高x (单位:cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg左右.解析:用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).答案:69.967.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单元:万元)和年教育支出y (单位:万元).调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程为y ^=0.15x +0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.答案:0.158.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x (单位:小时)与当天投篮的命中率:小李这56号打6小时篮球的投篮命中率为________.解析:小李这5天的平均投篮命中率y =15(0.4+0.5+0.6+0.6+0.4)=0.5,x =3,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=0.2+0+0+0.1+(-0.2)(-2)2+(-1)2+0+12+22=0.01,a ^=y -b ^x =0.47,∴线性回归方程为y ^=0.01x +0.47, 则当x =6时,y =0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53. 答案:0.5 0.53三、解答题9.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数为5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x ,(1)若两艘船的吨位相差1 000,求船员平均相差人数; (2)估计吨位最大的船和最小的船的船员人数. 解:(1)设两艘船的吨位分别为x 1,x 2则 y ^1-y ^2=9.5+0.006 2x 1-(9.5+0.006 2x 2) =0.006 2×1 000≈6, 即船员平均相差6人.(2)当x =192时,y ^=9.5+0.006 2×192≈11, 当x =3 246时,y ^=9.5+0.006 2×3 246≈30. 即估计吨位最大和最小的船的船员数分别为30和11.10.某工厂对某种产品的产量与成本进行资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.解:(1)散点图如下:(2)设成本y 与产量x 的线性回归方程为y ^=b ^x +a ^, x =2+3+5+64=4,y =7+8+9+124=9.b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=1110=1.1, a ^=y -b ^x =9-1.1×4=4.6. 所以,回归方程为y ^=1.1x +4.6.(3)当x =8时,y ^=1.1×8+4.6=8.8+4.6=13.4,即产量为8千件时,成本约为13.4万元.。
2014高中数学 2.3 变量间的相关关系课件(2)新人教A版必修3
诱思探究1
一组样本数据的平均数是样本数据的中心,那 么散点图中样本点的中心如何确定?它一定是散点 图中的点吗?
脂肪含量
40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
样本点的中心的 坐标为样本数据 的平均数; 它不一定是散点 图中的点。
n
i
nx y nx
2
ˆx ˆ y b a
( x x)
x
i 1
2
i
2 ˆ Q ( y y ) i i 为最小,这样就得到了 时,总体偏差 i 1
回归方程,这种求回归方程的方法叫做最小二乘 ˆx a 法.回归方程 y ˆ b ˆ ˆ 分别表示回归方程的斜率,截距。 中,a ˆ, b
40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
在直角坐标系中,任何一条直线都有相应的方程, 回归直线的方程称为回归方程.对一组具有线性相关 关系的样本数据,如果能够求出它的回归方程,那么 我们就可以比较具体、清楚地了解两个相关变量的内 在联系,并根据回归方程对总体进行估计.
1 1 (5 0 36) 169 15.367 11 11
xi (5)2 02 362 4335
2 i 1
11
11
x y
i 1 i
11
i
5 156 0 150 36 54 14828
i i
ˆ b
x y 11x y
温故知新
一.变量之间的相关关系: 1.变量间相关关系的定义:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间的关系,叫 做相关关系. 2.相关关系与函数关系的异同点: (1)相同点:两者均是指两个变量间的关系。 (2)不同点:①函数关系是一种确定的关系;相关关系 是一种非确定的关系. 函数关系是两个非随机变量的 关系,而相关关系是非随机变量与随机变量间的关系. ②函数关系是一种因果关系,而相关关系不一定是因果 关系,也可能是伴随关系.
人教B版高中数学必修三《第二章 统计 2.3 变量的相关性 2.3.1 变量间的相关关系》_2
《变量间的相关关系》一、教材分析学生情况分析:学生已经具备了对样本数据进行初步分析的能力,且掌握了一定的计算机基础,主要是电子表格的使用。
教材地位和作用:变量间的相关关系是高中新教材人教A版必修3第二章2.3节的内容, 本节课主要探讨如何利用线性回归思想对实际问题进行分析与预测。
为以后更好地研究选修2-3第三章3.2节回归分析思想的应用奠定基础。
结合教材特点及学情,特制定三维教学目标如下:二、教学目标1、知识与技能:利用散点图判断线性相关关系,了解最小二乘法的思想及2回归方程系数公式的推导过程,利用电子表格求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解2 、过程与方法:①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。
②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。
3、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。
利用计算机让学生动手操作,合作交流激发学生的学习兴趣。
三、教学重点、难点重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
四、教学媒体设计本节课涉及大量数据计算及分析,用传统方法很难突破,故我主要采用电子表格和几何画板,通过学生动手操作、教师动画演示、师生合作交流来突出重点、突破难点。
学生学习效果有明显提高。
五、教学设计(具体如下表)(一)、创设情境导入新课1、相关关系的理解师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。
生活中的任何两个变量之间是不是只有确定关系呢?让学生举例,教师总结如:生:不是。
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共28张PPT)
EXCEL
回归直线与散点图各点的位置应是:整体上最接近 下面列举了四种可能性,你认为可行吗? 图(1)表示每一点到直线的垂直距离之和最短,图(2) 表示每一点到直线的“偏差”之和最短,图(3)表示 经过点最多的直线,图(4)表示上下点的个数“大概” 一样多的直线.
体现了数学思想方法:转化与化归思想
最小二乘法
问题就归结为:
当 a, b 取什么值时 Q 最小.
Q ( y1 bx1 a)2 (y2 bx2 a)2 ( yn bxn a)2
运算不方便
n
求 (yi yˆi )2的最小值 i1
避免相互抵消
n
求 yi yˆi 的最小值 i1
各点与直线 的整体偏差
【展示交流】
探究三 寻找回归直线(定量) (1)回归直线一定过样本点的中心吗?为什么? (2)为什么要找回归直线?找到这条直线是否说
明年龄与脂肪含量是函数关系? (3)假如我45岁,我的脂肪含量大约是多少?是
表中的27.5吗? (4)如何具体求出这个回归直线的方程呢?回归
直线与散点图中各点的位置应具有怎样的关系?
人体内脂肪含量与年龄之间是相关关系
在一定年龄段内,随着年龄的增长,人体内的脂肪 含量会增加,但人体内的脂肪含量还与饮食习惯、体 育锻炼等有关,可能还与个人的先天体质有关。
人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_3
相关关系的强与弱学情分析:高一学生已经学习了前一节变量间的相关关系,但是总让学生有种感觉,画完散点图就求线性回归方程。
但是实际上不是这样,这里面的道理学生不明,总会让很多同学产生疑问,而数学学习很重要一点就是教会学生严谨、完整地思考并解决问题,所以本阅读材料的学习非常能激起学生的学习欲望,也能彻底清除学生学习的困惑点,符合学生的最近发展区理论,满足了学生思维发展的需要.教学目标:1、理解先观察散点图再求线性回归方程的原因2、了解相关关系的强与弱与散点图及回归方程的关系教学重难点:重点:用相关系数公式进行计算难点:相关系数如何刻画两变量间的相关关系强与弱教学用具:计算器、直尺教学过程一、复习1、相关关系、正负相关、样本中心等概念复习2、在散点图中,我们发现其散点散点大都分布在某一条直线线附近。
则我们把类似的相关关系叫做线性相关关系。
求线性回归方程的一般步骤:第一步:画散点图;第二步:列表计算;第三步:代入公式;第四步:写出回归方程.二、提出问题:为什么要“先观察散点图再求线性回归方程”?三、新知学习1、两个变量的相关关系的强弱用什么来衡量?计算公式是什么?相关系数2、下面4个图的相关关系和图形的散点分布有什么关系?四、典例分析例:测得某国家10对父子身高(单位,英寸)如下:(1)求相关系数r 的值;(2)如果y 与x 之间具有线性相关关系,求回归直线方程;()()n i i x x y y r --=∑n i ix y nxy r -=∑五、小结1、如何探讨生活中两个变量相关关系?2、计算相关系数的价值何在?六、拓展作业你能试着对自己身边的某个问题,确定两个变量,通过收集数据,计算相关系数,然后分析一下能否用线性回归模型来拟合它们间的关系吗?。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1页 共2页
变量间的相关关系错例分析
变量间的相关关系在现实生活中有很多的例子,它是进行回归分析的基础,初学变量间
的相关关系很容易出现这样或那样的错误,下面举例说明。
一、变量关系与函数关系混淆
例1、下列两变量中具有相关关系的是( )
(A)正方体的体积与边长;(B)匀速行驶的车辆的行驶距离与时间;
(C)人的身高与体重; (D)人的身高与视力
错解:选(A)或(B)。
分析:函数关系的两个变量之间是一种确定的关系,而相关关系的两个变量之间是一种
不确定的关系,因此,不能把相关系等同于函数关系。本例中,(A)和(B)都是函数关系,
(D)则无相关关系。
正解:选(C)。
二、相关关系不一定有因果关系
例2、下列各关系中,不属于相关关系的是( )
(A)名师出高徒 (B)球的表面积与体积 (C)家庭的支出与收入 (D)人的年龄与体
重
错解:选(A)。
分析:函数关系是一种因果关系,但相关关系不一定是因果关系。有名的老师能教出高
明的徒弟,通常情况下,高水平的老师有很大的趋势教出高水平的学生,但是,高水平的老
师所教的学生不一定都是高水平的,也就是说,他们之间没有困果关系的,但有相关关系。
正解:选(B),球的表面积与体积之间是函数关系。
三、回归方程中a、b位置混淆
例3、已知回归方程yˆ=1.5x-15,则( )
(A)y=1.5x-15 (B)15是回归系数a (C)1.5是回归系数a (D)x=10时,y
=0
错解:选(C)。
分析:回归直线方程为yˆ=bx+a,其中b是回归系数,而一次函数的习惯写法为y=
ax+b,错解把它们混淆了。对回归方程yˆ=bx+a有a=y-bx,即y=bx+a。
正解:选(A)。
例4、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次
试验,测得的数据如下:
零件数(x/个) 10 20 30 40 50 60 70 80 90 100
加工时间(y/分) 62 68 75 81 89 95 102 108 115 122
如果y与x是线性相关的,求回归直线方程。
错解:列出下表:
i 1 2 3 4 5 6 7 8 9 10
xi 10 20 30 40 50 60 70 80 90 100
yi 62 68 75 81 89 95 102 108 115 122
用计算器求得:x=55,y=91.7,
第2页 共2页
b=101221011010iiiiixxyxyx=25510385007.91551055950≈0.668
a=y-bx=91.7-0.668×55=54.96
即所求的回直线方程为:yˆ=54.96x+0.668。
分析:错解求出a、b后,把回归直线方程公式中yˆ=bx+a的a、b位置互换了。
正解:求a、b的方法与前面解法一样,最后所求的回直线方程为:yˆ=0.668x+54.96。