高中数学复习课(一)统计案例教案(含解析)北师大版选修12
高中数学北师大版选修1-2第一章《统计案例》(章末小结)精品学案

第一章章末小结1.回归分析(1)回归分析步骤:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预测.(2)线性回归模型:y=bx+a,其中= x i,= y i,2.相关系数样本相关系数:对于变量y与x的一组观测值,把r==叫作变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度,|r|≤1.当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.|r|越接近1,相关程度越大;|r|越接近0,相关程度越小.3.条件概率与相互独立事件(1)条件概率的定义设A,B为两个事件,且P(A)>0,称P(B|A)= 为在事件A发生的条件下,事件B发生的条件概率.(2)条件概率相关性质①0≤P(B|A)≤1.②若P(B)≠0,则P(AB)=P(B)P(A|B);若P(A)≠0,则P(AB)=P(A)P(B|A).(3)相互独立事件的定义设A,B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立.事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫作相互独立事件.(4)相互独立事件的性质如果事件A与B相互独立,那么A与,与B,与也都是相互独立的.(5)如果一系列的事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1·A2·…·A n)=P(A1)·P(A2)·…·P(A n).4.χ2的计算公式及其特点(1)根据2×2列联表与构造的随机变量χ2= (其中n=a+b+c+d是样本容量)来计算χ2的值.(2)当数据量较大时,统计学中已有明确的结论,随机事件χ2≥x0发生的概率如下:当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;当χ2>2.706时,有90%的把握判定变量A、B有关联;当χ2>3.841时,有95%的把握判定变量A、B有关联;当χ2>6.635时,有99%的把握判定变量A、B有关联.由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误.利用χ2进行独立性检验,可以对推断正确的概率做出估计,样本容量n越大,估计越准确.题型1:线性回归方程已知关于某设备的使用年数x和支出的维修费用y(万元),由资料统计得5组数据(x i,y i)(i=1,2,3,4,5),由资料知y与x线性相关,并且由统计的五组数据得平均值分别为=4,=5.4,若用5组数据得到的线性回归方程y=bx+a去估计使用8年的维修费用比使用7年的维修费用多1.1万元.(1)求回归直线方程;(2)估计使用年数为10年时,维修费用约是多少.【解析】(1)因为直线y=bx+a经过定点(,),又=4,=5.4,所以5.4=4b+a,又8b+a-(7b+a)=1.1,解得b=1.1,a=1,所以回归方程为y=1.1x+1.(2)将x=10代入线性回归方程得y=12.所以,估计使用年数为10年时,维修费用约是12万元.【小结】回归方程一定过中心点(,).本题运用方程的思想,采用待定系数法求解.线性回归方程类似于一次函数的解析式,故有问题可类比一次函数,将问题转化为求函数值.题型2:线性回归模型问题一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,:(1)求变量y与x的相关系数,并对其相关性做出判断;(2)如果y与x有线性相关关系,求回归直线方程;(3)若在实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?【方法指导】(1(2(3【解析】(1)=12.5,=8.25,x i y i=438,4 =412.5,=660,=291,所以r===≈≈0.9954.所以y与x有很强的线性相关关系.(2)由(1)可求得b=0.7286,a=-0.8571,所以y=0.7286x-0.8571.(3)要使y≤10,得0.7286x-0.8571≤10,所以x≤14.901.所以机器的转速应控制在14.901转/秒以下.【小结】若能从散点图直观地判断相关关系,就利用散点图进行判断;若散点图不明显时,我们就要根据相关系数r进行判断.在求回归直线方程时学会合理进行运算很关键,为准确运算,可先列表求出相关数据,然后求解.题型3:非线性相关问题:检测每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系.如有,求出y对x的回归方程.【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再代回u=,就得到了y对x的回归曲线方程.【解析】:经计算得r=0.9998,从而认为u与y之间具有线性相关关系,由公式得a=1.125,b=8.973,所以y=1.125+8.973u.最后代入u=,可得y=1.125+.【小结】在某些情况下可以借助于线性回归模型,研究呈现非线性相关关系的两个变量之间的关系,分析哪个模型拟合效果更好.题型4:相互独立事件的概率甲、乙两人都进行一次射击,如果两人击中目标的概率都是0.8,两人之间相互没有影响.计算:(1)两人都击中目标的概率;(2)恰有一人击中目标的概率;(3)至少有一人击中目标的概率.【方法指导】(1(2(3【解析】设“甲击中目标”记为事件A,“乙击中目标”记为事件B,A与B相互独立.(1)两人各射击一次都击中目标即为事件AB,由事件A与B相互独立,得P(AB)=P(A)P(B)=0.8×0.8=0.64;(2)P(A+B)=P(A)+P(B)=P(A)P()+P()·P(B)=0.8×0.2+0.2×0.8=0.32;(3)P()=P()P()=(1-P(A))·(1-P(B))=(1-0.8)×(1-0.8)=0.04,1-P()=1-0.04=0.96.【小结】把一个复杂的事件拆分成几个互斥或者相互独立的事件,是解决较为复杂概率问题的根本方法.题型5:独立性检验模型为了考察某种药物预防疾病的效果,任选105只动物做试验,其中55只服用此种药,50只未服用此种药,之后发现服药的55只中有10只患病,未服药的50只动物中有20只患病,请判断此种药物是否有效.【解析】根据公式:χ2=≈6.1>3.841.所以我们有95%以上的把握判断该药物有效.【小结】在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论可能犯错误,这是数学中的统计思维与确定性思维的不同之处,但我们可以利用统计分析的结果去预测实际问题的结果.用独立性检验的方法准确地判断两个变量的关联性,但要注意其一般步骤及准确计算.1.(2014年·湖北卷)得到的回归方程为=bx+a,则().A.a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<0【解析】作出散点图如下:观察图像可知,回归直线=bx+a的斜率b<0,当x=0时,y=a>0.故a>0,b<0.【答案】B2.(2014年·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是().表1表2表3表4A.成绩B.视力C.智商D.阅读量【解析】A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.∵<<<,∴与性别有关联的可能性最大的变量是阅读量.【答案】D一、选择题1.设某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着().A.高度相关B.中度相关C.弱度相关D.极弱相关【答案】A2.设有回归直线方程y=2-1.5x,当变量x增加1个单位时().A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位【解析】设变量x增加1个单位后y变为y',则y'=2-1.5(x+1)=2-1.5x-1.5=y-1.5.【答案】C3.已知对一组观测值(x i,y i)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为().A.y=0.51x+6.6475B.y=6.6475x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【答案】A4.若事件M、N相互独立,则下列三个结论:①M与相互独立;②N与相互独立;③与相互独立.其中正确的个数为().A.0B.1C.2D.3【解析】由两个事件相互独立的概念可以判定.【答案】D5.某学校开展研究性学习活动,:对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是().A.y=2x-2B.y=()xC.y=log2xD.y=(x2-1)【解析】将给定的点代入比较即可.【答案】D6.下面是一个2×2列联表:则表中a+b+c+d等于().A.125B.128C.133D.147【解析】∵a+21=73,∴a=52,又由b+46=73+27,知b=54.∵c+d=27,∴a+b+c+d=133.【答案】C7.在研究变量x和y的线性相关性时,甲、乙二人分别做了研究,利用最小二乘法得到线性回归方程l1和l2,两人计算的相同,也相同,下列说法正确的是().A.l1与l2重合B.l1与l2一定平行C.l1与l2相交于点(,)D.无法判断l1和l2是否相交【解析】回归直线方程过点(,).【答案】C8.设有一个回归方程y=3-3.5x,若变量x增加一个单位,则().A.y平均增加3.5个单位B.y平均增加3个单位C.y平均减少3.5个单位D.y平均减少3个单位【解析】x的系数为-3.5,所以减少.【答案】C9.某市通过随机询问100,得到如下的2×2列联表:得到的正确结论是().A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【解析】χ2=≈3.030,因为χ2>2.706,所以说有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.【答案】C10.某道路的A、B、C三处都设有交通灯,这三盏灯在一分钟内开放绿灯的时间分别为25秒、35秒、45秒,某辆车在这条路上行驶时,三处都不停车的概率是().A.B.C.D.【解析】××=.【答案】A二、填空题11.有下列关系:(1)人的年龄与他(她)的身高之间的关系;(2)圆的体积与半径之间的关系;(3)直线上的点与该点的坐标之间的关系.其中有相关关系的是(填写你认为正确的序号).【答案】(1)12.从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为.【答案】正相关13.对四对变量y与x进行相关性检验,已知n是观测值的组数,r是相关系数.且已知:(1)n=7,r=0.9533;(2)n=15,r=0.3012;(3)n=17,r=0.4991;(4)n=3,r=0.9950.则变量y与x的线性关系很强的是.【解析】统计学中常用相关系数r来衡量两个变量之间线性关系的强弱,|r|≤1,|r|越接近于1,则y与x的线性关系越强.【答案】(1)(4)14.已知随机事件A的概率P(A)=0.5,事件B的概率P(B)=0.6,事件AB的概率P(AB)=0.4,则条件概率P(B|A)=.【解析】P(B|A)===0.8.【答案】0.815.幂函数曲线y=ax b,作变换u=ln y,v=ln x,c=ln a,得线性函数.【解析】将u=ln y,v=ln x,c=ln a代入y=ax b,消去x、y得u=c+bv.【答案】u=c+bv三、解答题16.因冰雪灾害,某柑橘基地果树严重受损,为此有关专家提出一种拯救果树的方案,该方案需分两年实施且相互独立.该方案预计第一年可以使柑橘产量恢复到灾前的1.0、0.9、0.8的概率分别为0.2、0.4、0.4;第二年可以使柑橘产量为第一年产量的1.5倍、1.25倍、1.0倍的概率分别是0.3、0.3、0.4.(1)求两年后柑橘产量恰好达到灾前产量的概率;(2)求两年后柑橘产量超过灾前产量的概率.【解析】(1)令A表示两年后柑橘产量恰好达到灾前产量这一事件,则P(A)=0.2×0.4+0.4×0.3=0.2.(2)令B表示两年后柑橘产量超过灾前产量这一事件,则P(B)=0.2×0.6+0.4×0.6+0.4×0.3=0.48.17.某工厂积极响应节能减排的号召,经过技术改造后,降低了能源消耗,下表提供了该厂记录的某种产品的产量x(吨):根据相关性检验,这组样本数据具有线性相关关系.(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(2)已知该厂技改前100吨此种产品的生产能耗为90吨.试根据求出的线性回归方程,预测生产100吨此产品的生产能耗比技改前降低多少吨?【解析】(1)==4.5,==3.5,=86,x i y i=66.5,b===0.7,a=-b=3.5-0.7×4.5=0.35.故线性回归方程为y=0.7x+0.35.(2)根据回归方程预测生产100吨产品消耗的能耗约为0.7×100+0.35=70.35.故耗能减少了90-70.35=19.65吨.18.企业为了研究员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,其中积极支持企业改革的调查者中,工作积极的有54人,工作一般的有32人,而不太赞成企业改革的调查者中,工作积极的有40人,工作一般的有63人.(1)根据以上的数据建立一个2×2列联表;(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?【解析】(1)(2)由公式得χ2=≈10.759,因为10.759>6.635,所以有99%以上的把握说抽样员工对待企业改革的态度与工作积极性是有关的,也可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的. 19.(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;(2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量.【解析】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,对预处理后的数据,容易算得=0,=3.2,b==6.5,a=-b=3.2.由上述计算结果,知所求回归直线方程为:y-257=b(x-2010)+a=6.5(x-2010)+3.2,即y=6.5x-12804.8.(2)利用回归直线方程,可预测2016年的粮食需求量约为6.5×(2016-2010)+260.2=6.5×6+260.2=299.2万吨.20.某市工薪阶层关于“延迟退休年龄”的态度进行调查,随机抽调了50人,他们月收入的频数(1)由以上统计数据填下面2×2列联表并问分析“月收入以5000为分界点”对“延迟退休年(2)若参加此次调查的人中,有9人为公务员,现在要从这9人中,随机选出2人统计调查结果,其中a、b恰为统计局工作人员,求两人至少有1人入选的概率.【解析】(1)2×2χ2=≈6.27>3.841.所以有95%以上的把握认为“月收入以5000为分界点”对“延迟退休年龄”的态度有差异.(2)设9人分别为a,b,c,d,e,f,g,h,k,则选出的2人所有可能的情况为:ab,ac,ad,ae,af,ag,ah,ak;bc,bd,be,bf,bg,bh,bk;cd,ce,cf,cg,ch,ck;de,df,dg,dh,dk; ef,eg,eh,ek;fg,fh,fk;gh,gk;hk.共36种,其中a、b至少有1人入选的情况有15种,∴a、b两人至少有1人入选的概率为P==.21.某种电路开关闭合后,会出现红灯或绿灯闪动.已知开关第一次闭合后,出现红灯和绿灯的概率都是,从开关第二次闭合起,若前一次出现红灯,则下一次出现红灯的概率是,出现绿灯的概率是;若前一次出现绿灯,则下一次出现红灯的概率是,出现绿灯的概率是.(1)第二次闭合后出现红灯的概率是多少?(2)前三次发光中,出现一次红灯、两次绿灯的概率是多少?【解析】(1)概率P1=P(红红)+P(绿红)=×+×=.(2)概率P2=P(红绿绿)+P(绿红绿)+P(绿绿红)=××+××+××=.。
高中数学(北师大版,选修12):第一章++统计案例(课件+同步练习+章末归纳总结+综合检测,9份)1

第一章 §1 第1课时一、选择题1.下列结论不正确的是( ) A .函数关系是一种确定性关系 B .相关关系是一种非确定性关系C .回归分析是具有函数关系的两个变量进行统计分析的一种方法D .回归分析是具有相关关系的两个变量进行统计分析的一种方法 [答案] C[解析] 回归分析是具有相关关系的两个变量进行统计分析的一种方法,而不是具有函数关系的两个变量进行统计分析的一种方法,故选C.2.对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u 、v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 [答案] C[解析] 观察图像易知选项C 正确.3.下列变量之间的关系不是相关关系的是( )A .已知二次函数y =ax 2+bx +c ,其中a 、c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4acB .光照时间和果树亩产量C .降雪量和交通事故发生D .每亩用肥料量和粮食亩产量 [答案] A4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ^=-10x +200B .y ^=10x +200C.y ^=-10x -200 D .y ^=10x -200[答案] A[解析] 本题主要考查变量的相关性.由负相关的定义排除B ,D ,由x =1时,y >0排除C.5.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要________h .( )A .6.5B .5.5C .3.5D .0.5[答案] A[解析] 将x =600代入回归方程即得A. 6.对于相关关系r ,下列说法正确的是( ) A .|r |越大,相关程度越小 B .|r |越小,相关程度越大C .|r |越大,相关程度越小,|r |越小,相关程度越大D .|r |≤1且|r |越接近于1,相关程度越大,|r |越接近于0,相关程度越小 [答案] D[解析] |r |≤1,当|r |越接近于1,误差越小,变量之间的线性相关程度越高;|r |越接近于0,误差越大,变量之间的线性相关程度越低,故选D .二、填空题7.回归分析是处理变量之间________关系的一种数量统计方法. [答案] 相关[解析] 回归分析是处理变量之间相关关系的一种数量统计方法. 8.已知x 、y 的取值如下表:若x 、y 具有线性相关关系,且回归直线方程为y =0.95x +a ,则a 的值为________. [答案] 2.6[解析] 由已知得x -=2,y -=4.5,而回归方程过点(x -,y -),则4.5=0.95×2+a , ∴a =2.6.9.某市居民2010~2014年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.,r ≈0.97,正相关.三、解答题10.(2013·沈阳联考)某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:(1)(2)求年推销金额y 关于工作年限x 的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额. [答案] (1)散点图略 (2)y ^=0.5x +0.4 (3)5.9万元 [解析] (1)依题意,画出散点图如图所示,(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为y ^=b ^x +a ^.则b ^=∑i =15(x i -x -)(y i -y -)∑i =15(x i -x -)2=1020=0.5,a ^=y --b ^x -=0.4, ∴年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4. (3)由(2)可知,当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9(万元).∴可以估计第6名推销员的年销售金额为5.9万元.一、选择题11.对于回归分析,下列说法错误的是( )A .在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的C .回归分析中,如果r =±1,说明x 与y 之间完全线性相关D .样本相关系数r ∈(-1,1) [答案] D[解析] ∵相关系数|r |≤1,∴D 错.12.某产品的广告费用x 与销售额y 的统计数据如下表根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元[答案] B[解析] 此题必须明确回归直线方程过定点(x ,y ).易求得x =3.5,y =42,则将(3.5,42)代入y ^=b ^x +a ^中得:42=9.4×3.5+a ^,即a ^=9.1,则y =9.4x +9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.13.(2012·湖南文,5)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg [答案] D[解析] 本题考查线性回归方程.D 项中身高为170cm 时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.14.假设学生在初一和初二的数学成绩是线性相关的,若10个学生初一和初二的数学期末考试分数如下(分别为x ,y ):A .y =1.218 2x +14.192B .y =1.218 2+14.192x C .y =1.218 2-14.192x D .y =1.218 2x -14.192[答案] D[解析] 由表中数据可得x =71,y =72.3,因为回归直线一定经过点(x ,y ),经验证只有D 满足条件.二、填空题15.已知两个变量x 和y 之间有线性相关性,5次试验的观测数据如下表:那么变量y 关于x [答案] y ^=0.575x -14.9[解析] 根据公式计算可得b ^=0.575,a ^=-14.9,所以回归直线方程是y ^=0.575x -14.9. 三、解答题16.某5名学生的数学成绩和化学成绩如下表:(1)画出散点图;(2)如果x 、y 呈线性相关关系,求y 对x 的线性回归方程. [答案] (1)散点图略 (2)y ^=22.05+0.625x . [解析] (1)散点图如图:(2)x =73.2,y=67.8,∑i =15x 2i =27 174,∑i =15y 2i =23 167,∑i =15x i y i =25 054,∴b ^=25 054-5×73.2×67.827 174-5×73.22≈0.625,a ^=y -b ^x =22.05,所求回归方程为y ^,\s\up6(^))=22.05+0.625x .17.(2012·福建文,18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[答案] (1)y ^=-20x +250 (2)8.25[解析] (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1000 =-20(x -334)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定价为8.25元时,工厂可获得最大利润.。
北师大选修(1-2)第一章《统计案例》word教案

选修1-2 第一章 统计案例[课标研读][课标要求]了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)假设检验:了解假设检验的基本思想、方法及其简单应用. (3)聚类分析:了解聚类分析的基本思想、方法及其简单应用. (4)回归分析:了解回归的基本思想、方法及其简单应用.[命题展望]本章所涉及到的知识点均要进行大量的数据计算,而这些计算如果仅仅靠笔算往往是比较困难的,需要借助于计算机或计算器。
其实在新课标中提到“……应鼓励学生使用计算器、计算机等现代技术手段来处理数据……”,而我们目前的高考还不允许使用计算器,所以本章的更看重统计思想。
考虑到本章内容是新增内容,在高考中应该有所体现,但在高考试题中不会出现过于繁琐的计算题,相信会出现一道填空试题或填空题,出现解答题的可能性较小,即使出现,所涉及的计算应该不会很繁琐。
本章的疑点是用这种方法检验可靠吗?实际上这种方法仍然是用样本估计总体,由于抽样的随机性,结果并不唯一,所以用部分推断全体,推断可能正确,也有可能错误。
但我们只要科学合理地去抽样,那么犯错误的可能性就很小了。
如卡方检验中,若26.635χ>,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。
第一讲 回归分析的基本思想及其初步应用[知识梳理][知识盘点]1.相关关系是一种非确定的关系, 是对具有相关关系的两个变量进行统计分析的一种方法。
2.线性回是模型y bx a e =++(e 为 ),因变量y 的值是自变量x 和随机误差e 共同确定的,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为 ,因变量y 称为 。
3.模型中的参数a 和b 用 估计,其计算公式如下:121()()ˆ()niii nii x x y y bx x ==--=-∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,1nii y y ==∑(,)x y称为,回归直线一定经过样本中心点。
高中数学 第一章 统计案例(4课时)北师大版选修12

【金学案】2015年春高中数学第一章统计案例(4课时)北师大版选修1-2知识点新课程标准的要求层次要求领域目标要求回归分析的基本思想及其初步应用通过典型案例的探究,进一步了解回归的基本思想、方法及初步应用在《数学》(必修3)概率统计的基础上,通过典型案例进一步介绍回归分析的基本思想、方法及其初步应用;通过典型案例介绍独立性检验的基本思想、方法及其初步应用,认识统计方法在决策中的作用独立性检验的基本思想及其初步应用在具体情境中,了解条件概率和两个事件相互独立的概念.通过典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用1.在学习回归分析内容时,应首先回顾必修课程中的相关内容,复习如何画散点图,如何利用最小二乘法求线性回归方程,并关注本章内容和必修课程中相关内容的区别与联系.认识和体会进行相关性检验的必要性,了解如何求线性相关系数r,并能对两个随机变量进行回归分析.在此基础上,会将非线性回归问题转化为线性回归问题来解决.2.通过具体实例,了解独立性检验的基本思想,能够根据实际问题列出列联表,求出χ2的值,并能根据求得的值判断两个变量是否相关.3.带着如下问题阅读教材:(1)为什么要引入线性相关系数?(2)如何将非线性回归问题转化为线性回归模型?(3)独立性检验的基本思想、方法是什么?(4)哪种类型的数据可以进行独立性检验?哪种类型的数据可以进行回归分析?第1课时回归分析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(x i,y i)(i=1,2,…,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于0时,表明两个变量之间越不存在线性相关关系.问题4:线性回归分析的步骤对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(x n,y n).(1)画散点图:看散点图是否呈条状分布.(2)求回归直线方程(最小二乘法):b=, =x i,=y i,其中(,)为样本中心点,回归直线方程必经过样本中心点(,),得a= -b ;(3)得出相关结论:回归直线方程为y=a+bx ,利用回归直线方程进行预测.“一只蝴蝶在巴西扇动翅膀,有可能会在美国的德克萨斯州引起一场龙卷风.”这就是洛伦兹1979年12月在华盛顿的“美国科学促进会”上的一次演讲中提出的“蝴蝶效应”.这次演讲给人们留下了极其深刻的印象.从此以后,所谓“蝴蝶效应”之说就不胫而走,名声远扬.“蝴蝶效应”之所以令人着迷、令人激动、发人深省,不但在于其大胆的想象力和迷人的美学色彩,而且在于其深刻的科学内涵和内在的哲学魅力.1.下列关系不属于相关关系的是().A.父母的身高与子女的身高B.人的身高与体重C.居民的收入与消费D.正方体的表面积和体积【解析】相关关系是一种非确定性关系,而D项是确定的关系,为函数关系,故选D.【答案】D2.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有().A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反【解析】因为b与r的分母均为正,且分子相同,所以b与r同号.【答案】A3.某医院用光电比色检验尿汞时,得到尿汞含量x(毫克/升)与消化系数y的一组数据如下表:尿汞含量x 2 4 6 8 10消化系数y64 138 205 285 260若x与y具有线性相关关系,则回归直线方程是.【解析】利用公式b==26.95,a=-b=28.7,从而回归直线方程为y=26.95x+28.7.【答案】y=26.95x+28.74.某10名同学的数学、物理、语文成绩如下表:数学136 125 122 87 108 113 111 70 94 74物理107 91 92 76 93 85 82 78 78 73语文86 114 104 109 100 106 112 104 95 99试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么规律?【解析】可求出物理成绩与数学成绩的相关系数r≈0.87,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数|r|≈0.092很接近0,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩可能好也可能差,它们之间的关系不大.相关关系的判断与分析有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是(填写你认为正确的序号).【方法指导】根据相关关系的概念进行判断.【解析】序号关系理由①相关关系人的年龄和他(她)的财富有一定的关系,一般中年人财富多,年轻人少,少儿基本没有②函数关系曲线上的点与其坐标一一对应,是确定的③相关关系气候能影响苹果的产量④相关关系同一种树木,其断面直径和高度之间有一定的关系,但不确定⑤对应关系确定的一一对应关系【答案】①③④【小结】相关关系是一种非确定性关系,是指两个变量之间有关系,但是两者之间的关系还受其他因素的影响,只是影响大小的问题.回归直线过样本中心点(,)的性质的应用观察两个相关变量的如下数据:x-1 -2 -3 -4 -5 5 4 3 2 1y-0.9 -2 -3.1 -3.9 -5.1 5 4.1 2.9 2.1 0.9则两个变量间的回归直线方程为().A.y=0.5x-1B.y=xC.y=2x+0.3D.y=x+1【方法指导】根据回归直线方程y=a+bx经过样本中心点(,)可计算出结果.【解析】∵=0,=0,回归直线方程经过样本中心点(,),代入所给选项中检验,可知,只有y=x符合条件.【答案】B先判定相关性,再求回归直线方程某种图书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x 1 2 3 5 10 20 30 50 100 200y 10.155.524.082.852.111.621.411.31.211.15检验每册书的成本费y与印刷册数的倒数之间是否有线性相关关系?如果有,求出y对x的回归方程.【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再回代u=,就得到了y对x的回归曲线方程.【解析】将上表数据列表分析如下:i 1 2 3 4 5 6 7 8 9 10x i 1 2 3 5 10 20 30 50 100 200 421y i 10.155.52 4.08 2.852.111.621.411.31.21 1.15 31.4 1 4 9 25 100 400 9002501000400053939 103.0330.4716.658.124.452.621.991.691.46 1.32 171.8x i y i 10.1511.0412.2414.2521.132.442.365 121 230 559.48∴=42.1,=1772.41,=3.14,n=10,10=1321.94,可以求得r=0.9998,由r=0.9998,因此变量y 与之间具有较强的线性相关关系.∵b====-0.02,∴a=-b=3.14-(-0.02)×42.1=3.98. ∴y 与x 的回归方程为y=3.98-0.02x.[问题]当x=1时,由回归方程得y=3.96,而实际上y=10.15,为什么有这么大的偏差?上述回归方程是y 与x 的回归方程吗?[结论]因为y 与之间具有较强的线性相关关系,而y 与x 之间没有明显的线性相关关系,故应先通过变量变换(即换元),令u=,并通过对u 与y 作相关性检验,求出y 对u 的回归直线方程,最后再回代u=,得到y 对x 的回归方程.于是正确解如下:首先作变量变换,令u=,则题目所给数据变成如下表所示的数据:u i 1 0.5 0.33 0.2 0.10.05 0.03 0.02 0.01 0.005y i 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.211.15可以求得r ≈0.9998,因此变量y 与u 之间具有较强的线性相关关系,并且b ≈8.973,a=-b ≈1.125,最后回代u=可得y=+1.125.因此y 与x 的回归方程为y=+1.125.【小结】本题中y 与x 之间不具有线性相关关系,因而是非线性回归分析问题,对此类回归分析问题,应先求线性相关系数r ,利用r 来判断两个变量之间是否具有线性相关关系.当|r|越接近1时,认为线性相关关系越强,可以求回归直线方程,并可用求得的回归直线方程来预测变量的取值;当|r|越接近0时,认为两个变量之间线性相关关系越不显著,这时求回归直线方程没有多大的实际价值,要采用变量变换(即换元法)转化为线性回归问题求解.由施肥量x 与水稻产量y 试验数据的关系,画出散点图,并指明相关性.施化肥量x15 20 25 30 35 40 45水稻产量y330 345 365 405 445 450 455【解析】散点图为:通过图像可知是正相关.已知x 、y 的取值如表所示,若从散点图分析,y 与x 线性相关,且y=0.95x+a ,求a 的值.x 0 1 2 3 4 y 2.2 4.3 4.8 4.8 6.7【解析】由表中数据得=2,=4.56,由于线性回归方程一定经过样本中心点(,),即(2,4.56),在回归直线方程y=bx+a中,代入点(2,4.56)得a=-b=4.56-0.95×2=2.66.10名同学在高一和高二的数学成绩如下表:x74 71 72 68 76 73 67 70 65 74y76 75 71 70 76 79 65 77 62 72其中x为高一数学成绩,y为高二数学成绩.(1)y与x是否具有相关关系;(2)如果y与x具有相关关系,求回归直线方程.【解析】(1)由已知表格中的数据,利用计算器进行计算得=71,=72.3,x i y i=51467,=50520,=52541.则r==≈0.78.即认为x与y之间具有线性相关关系.(2)y与x具有线性相关关系,设回归直线方程为y=a+bx,则b==≈1.22,a=-b=72.3-1.22×71=-14.32,所以y关于x的回归直线方程为y=1.22x-14.32.1.对相关系数r,下列说法正确的是().A.r越大,两变量的线性相关程度越大B.r越小,两变量的线性相关程度越大C.|r|越大,两变量的线性相关程度越大;|r|越小,两变量的线性相关程度越小D.|r|≤1,且|r|越接近1,两变量的线性相关程度越大;|r|越接近0,两变量的线性相关程度越小【解析】由两个变量的相关系数公式r=可知,相关程度的强弱与|r|和1的接近程度有关,|r|越接近1,两变量的线性相关程度越大,|r|越接近0,两变量的线性相关程度越小.【答案】D2.工人月工资y(元)关于劳动生产率x(千元)的回归方程为y=650+80x,下列说法正确的个数是().①劳动生产率为1000元,工资约为730元;②劳动生产率提高1000元,则工资约提高80元;③劳动生产率提高1000元,则工资约提高730元;④当月工资为810元,劳动生产率约为2000元.A.1B.2C.3D.4【解析】①②④正确,注意单位的一致性,故选C.【答案】C3.若预报体重y(kg)和身高x(cm)之间的线性回归方程为y=0.849x-85.712,如果要找到体重为41.638 kg的人,(填“一定”或“不一定”)在身高为150 cm的人群中.【解析】体重不仅受身高的影响,还受其他因素的影响.【答案】不一定4.某个体服装店经营某种服装,一周内获纯利润y(元)与该周每天销售这种服装的件数x之间的一组数据如下:x 3 4 5 6 7 8 9y66 69 73 81 89 90 91已知=280,=45309,x i y i=3487.(1)求,;(2)一周内获纯利润y与该周每天销售件数x之间是否线性相关?如果线性相关,求出回归直线方程.【解析】(1)=(3+4+5+6+7+8+9)=6,=(66+69+73+81+89+90+91)≈79.86.(2)根据已知=280,=45309,x i y i=3487,得相关系数r=≈0.973.所以纯利润y与每天销售件数x之间具有显著的线性相关关系.利用已知数据可求得回归直线方程为y=4.746x+51.386.(2013年·湖南卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;③y与x正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是().A.①②B.②③C.③④D.①④【解析】由正相关、负相关的性质可知在①中,斜率为2.347>0,不可能负相关;在④中,斜率为-4.326<0,不可能正相关,故①④一定不正确.选D.【答案】D1.下列两个变量之间的关系是相关关系的是().A.圆的面积与半径B.球的体积与半径C.角度与它的正弦值D.一个考生的数学成绩与物理成绩【解析】由题意知A表示圆的面积与半径之间的关系S=πr2;B表示球的体积与半径之间的关系V=πr2;C表示角度与它的正弦值y=sin α,以上所说的都是确定的函数关系,相关关系不是确定性的关系,故选D.【答案】D2.在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(x i,y i),其中i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,那么在下列操作顺序中正确的是().A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①【解析】根据线性回归分析思想可知,两个变量x,y进行线性回归分析时,应先收集数据(x i,y i),然后绘制散点图,再求相关系数和线性回归方程,最后对所求的回归方程作出解释,因此选D.【答案】D3.如图所示有5组数据,去掉后,剩下的4组数据的线性相关性更强.【解析】根据散点图判定两变量的线性相关性,样本数据点越集中在某一直线附近,这两变量的线性相关性越强,显然去掉D(3,10)后,其余各点更能集中在某一直线附近,即线性相关性更强.【答案】D(3,10)4.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:x 1.081.121.191.281.361.481.591.681.81.871.982.07y 2.252.372.42.552.642.752.923.033.143.263.363.5(1)画出散点图;(2)检验相关系数r的显著性水平;(3)求月总成本y与月产量x之间的回归直线方程.【解析】i 1 2 3 4 5 6 7 8 9 10 11 12x i1.08 1.121.191.281.361.481.591.681.81.871.982.07y i2.25 2.372.42.552.642.752.923.033.143.263.363.5x i y i 2.432.6542.8563.2643.5904.074.6435.0905.6526.0966.6537.245=,=,=29.808,=99.2081,x i y i=54.243(1)画出散点图,如图所示.(2)r==≈0.99,这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在显著的线性相关关系.(3)设回归直线方程y=bx+a,利用计算a,b,得b≈1.215, a=-b≈0.974,即回归直线方程为y=1.215x+0.974.5.设一个回归方程为y=3-5x,当变量x增加一个单位时().A.y平均增加3个单位B.y平均减小5个单位C.y平均增加5个单位D.y平均减小3个单位【解析】-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.【答案】B6.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其回归方程的截距为().A.a=y+bxB.a=+bC.a=y-bxD.a=-b【解析】回归直线方程中的截距即为a,由公式=b+a得a=-b,故选D.【答案】D7.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为y=0.8x+4.6,则成年人受过9年或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)【解析】一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右.【答案】大于08.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:使用年限2 3 4 5 6x维修费用2.23.8 5.5 6.5 7.0y若由资料知y对x呈线性相关关系.试求:(1)线性回归方程y=bx+a的回归系数a,b;(2)估计使用年限为10年时的维修费用.【解析】(1)制表如下:i 1 2 3 4 5 合计x i 2 3 4 5 6 20y i2.2 3.8 5.5 6.5 7.0 25x i y i4.4 11.4 22.0 32.5 42.0 112.34 9 16 25 36 90=4,=5,=90,x i y i=112.3于是b===1.23,a=-b=5-1.23×4=0.08.(2)由(1)知回归直线方程为y=1.23x+0.08,当x=10时,y=1.23×10+0.08=12.3+0.08=12.38,即估计使用10年时的维修费用是12.38万元.9.若y与x之间的一组数据如下:x0 1 2 3 4y 1 3 5 5 6则拟合这5对数据的回归直线一定经过的点是.【解析】根据回归直线y=bx+a一定过样本中心点(,),且==2,==4,知点(2,4)一定在回归直线上.【答案】(2,4)10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:产量x(千费用y(千件) 元) 40 150 42 140 48 160 55 170 65 150产量x(千件) 费用y(千元)79 16288 185100 165120 190140 185完成下列要求:(1)计算x与y的相关系数;(2)这两个变量之间是否线性相关?若线性相关,求回归直线方程y=bx+a.【解析】(1)制表如下:i x i y i x i y i1 40 150 1600 22500 60002 42 140 1764 19600 58803 48 160 2304 25600 76804 55 170 3025 28900 93505 65 150 4225 22500 97506 79 162 6241 26244 127987 88 185 7744 34225 162808 100 165 10000 27225 165009 120 190 14400 36100 2280010 140 185 19600 34225 25900合计777 1657 70903 277119 132938==77.7,==165.7,=70903,=277119,x i y i=132938r=≈0.808.即x与y的相关系数r≈0.808.(2)因为r较接近1,所以x与y之间具有很强的线性相关关系.则b=≈0.398,a=165.7-×77.7b≈134.8,所以回归直线方程为y=0.398x+134.8.第2课时回归分析的应用1.根据线性回归方程,对相关结论进行预测.2.理解从散点图进行非线性回归分析的意义,掌握如何将非线性回归问题转化为线性回归问题的方法.3.了解在解决实际问题的过程中寻找更好的模型的方法.重点:根据线性回归方程,对相关结论进行预测,探究非线性模型通过变换转化为线性回归模型的方法.难点:了解常用函数的图像特点,选择不同的模型建模,并通过相关指数对不同的模型进行比较.有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?要回答这个问题,我们先来一起学习本节的知识吧!问题1:相关系数的概念及相关系数r的性质相关系数r用来描述线性相关关系的强弱,且样本相关系数r===.r有如下性质:(1)|r|≤1;(2)|r|越接近于1,误差Q越小,x,y的线性相关程度越强;(3)|r|越接近于0,误差Q越大,x,y的线性相关程度越弱;(4)当r>0时,称两个变量正相关;当r<0时,称两个变量负相关;当r=0时,称两个变量线性不相关.问题2:在回归分析中,通过模型计算预测变量的值时,应注意的问题.(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预测值就是预测变量的精确值.问题3:几种能转化为线性回归模型的非线性回归模型(1)幂函数曲线y=ax b作变换u=ln y,v=ln x,c=ln a,得线性函数u=c+bv .(2)指数曲线y=a e bx作变换u=ln y,c=ln a,得线性函数u=c+bx .(3)倒指数曲线y=a作变换u=ln y,c=ln a,v=,得线性函数u=c+bv .(4)对数曲线y=a+b ln x作变换u=y,v=ln x,得线性函数u=a+bv .问题4:非线性回归问题进行回归分析的方法(1)若问题中已给出经验公式,这时可以将解释变量进行交换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量交换,将问题化为线性回归分析问题来解决.从以下几个方面认识相关关系:(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以使我们处理更为广泛的数学应用问题,还可以使我们对函数关系的认识上升到一个新的高度.一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预测、资料补充等方面有着广泛的应用.1.下列两个变量之间的关系不是函数关系的是().A.角度和它的余弦值B.正方形的边长和面积C.正n边形的边数和各内角度数之和D.人的年龄和身高【解析】函数关系就是一种变量之间的确定性的关系,A,B,C三项都是函数关系,它们的函数表达式分别为f(θ)=cos θ,g(a)=a2,h(n)=nπ-2π.D项不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.【答案】D2.为了表示n个点与相应直线在整体上接近程度,我们常用()表示.A.(y i-y)B.(y i-)C.(y i-y)2D.(y i-)2【解析】由回归直线方程y=a+bx,可知y为一个量的估计量,而y i为它的实际值,在最小二乘法中[y i-(a+bx)]2,即(y i-y)2,故选C.【答案】C3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为.【解析】因为A,B,C,D四点都在直线y=x+1上,故填y=x+1.【答案】y=x+14.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)估计最小的船的船员数和最大的船的船员数.【解析】(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,即船员平均相差6人.(2)9.1+0.006×192=10.252,估计最小的船的船员数为10.9.1+0.006×3246=28.576,估计最大的船的船员数为28.利用公式,确定回归直线方程某5名学生的数学和化学成绩如下表:学生A B C D E学科数学成绩(x) 88 76 73 66 63化学成绩(y) 78 65 71 64 61(1)画出散点图;(2)求化学成绩(y)对数学成绩(x)的回归直线方程.【方法指导】熟记公式,根据表格计算公式中所需的各种数据.【解析】(1)散点图(略).(2)=73.2,=67.8,x i y i=25054,=27174,所以b==≈0.625.a=-b=67.8-0.625×73.2=22.05.所以y对x的回归直线方程为y=0.625x+22.05.【小结】利用公式求解时应注意以下几点:①求b时应先求出,,x i y i,,再由a=-b求a的值,并写出回归直线方程.②线性回归方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预测结果的偏差.③回归直线方程y=a+bx中的b表示x增加1个单位时y的变化量为b,而a是不随x的变化而变化的量.④可以利用回归直线方程y=a+bx预测在x取某一个值时,y的估计值.根据回归直线方程,对结果进行分析或预测从某大学中随机选取 8 名女大学生,其身高和体重数据如下表:编号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据女大学生的身高预测体重的回归方程,并预测一名身高为 172 cm 的女大学生的体重.【方法指导】可以计算出r≈0.798.这表明体重与身高有较强的线性相关关系,从而可以建立身高和体重的线性回归方程,根据身高和体重的线性回归方程,由身高预测体重.【解析】由于问题中要求根据身高预测体重,因此选取身高为自变量x ,体重为因变量y.作出散点图(如图).从图中可以看出,样本点呈条状分布,身高和体重有较强的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系,根据公式,可以得到b≈0.848,a≈-85.712.于是得到回归方程y=0.848x-85.712.因此,对于身高172 cm 的女大学生,由回归方程可以预测其体重为y=0.848×172-85.712=60.144 kg.【小结】解析中b=0.848是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.848 kg,这表明体重与身高具有正的线性相关关系.尽管身高172 cm的女大学生的体重不一定是60.144 kg,但一般可以认为她的体重接近60.144 kg.可线性化的非线性回归问题一只红铃虫的产卵数y和温度x之间的7组观测数据列于下表:温度x/℃21 23 25 27 29 32 35产卵数y/7 11 21 24 66 115 325个试建立y与x之间的回归方程,并预测温度为28 ℃时产卵数目.【方法指导】作出散点图(或根据已知的散点图)分析欲采用较为恰当的拟合曲线,用换元法转化成线性关系再进行回归分析.【解析】选择变量,画散点图.在散点图中,根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=c1的周围,其中c1和c2是待定参数.即问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1 ,b=c2)的周围.这样,就可以利用线性回归模型来建立y 和x之间的非线性回归方程了.由已知表的数据可以得到变换后的样本数据表(下表):x21 23 25 27 29 32 35z1.946 3.398 3.045 3.178 4.190 4.745 5.784下图给出了表中数据的散点图.从图中可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中的数据得到线性回归方程z=0.242x-2.884.相关系数r≈0.953.因此红铃虫的产卵数对温度的非线性回归方程为y=e0.242x-2.884.当x=28 ℃时,y≈49.预测当气温为28 ℃时,产卵数为49个.综上所述,在本题中指数函数模型比一元线性模型、二次函数模型有更好的拟合效果.【小结】对于给定的样本点(x1,y1),(x2,y2),…,(x n,y n),其中a和b都是未知参数.应先根据散点图或利用相关系数r判断两变量间是否存在线性相关关系,若两变量线性相关性显著,采用例1的方法进行线性回归分析;若两变量线性相关性不显著,则可采用例2的方法和步骤进行拟合效果分析.。
高中数学 第一章 统计案例教案 北师大版选修12

第一章统计案例§1回归分析1.1 回归分析1.2 相关系数1.3 可线性化的回归分析(教师用书独具)●三维目标1.知识与技能(1)通过对典型案例的探究,了解回归的基本思想、方法及初步应用.(2)了解相关系数r的含义,会根据两个随机变量的线性相关系数判断它们之间的线性相关程度.(3)能将非线性回归问题转化为线性回归问题来解决.2.过程与方法在分析和探讨变量之间的线性关系的过程中,体会统计推理由直观到严谨的过程,进一步了解统计推理的基本方法和基本思想,发展统计思维能力.3.情感、态度与价值观通过对两个随机变量进行回归分析,并根据回归方程对数据进行预测,认识和体会统计推理及其方法在解决实际问题中的作用,感受数学与生活的密切联系.●重点难点重点:(1)回归分析的基本思想和方法.(2)判断两个随机变量是否线性相关.难点:(1)对两个随机变量是否线性相关进行判断.(2)求线性回归方程.本节的教学,要通过具体问题的解决,引导学生复习回顾利用最小二乘法求变量之间的线性回归方程的方法,以及如何根据线性回归方程,对数据进行估计.教学中,要通过引导学生探究,明确在求线性回归方程时,要对变量是否线性相关作出判断的必要性以及判断方法.判断方法有两种:散点图法—定性判断,相关系数法—定量判断.(教师用书独具)●教学建议1.通过学生熟悉的实际问题引入课题,为学习创设情境,拉近数学与现实的距离,激发学生的求知欲,调动学生主动参与的积极性.2.在教学中,要引导学生探究两个变量相关性的判断方法,感悟两个变量相关性判断的必要性.3.在鼓励学生主体参与的同时,不可忽视教师的主导作用,具体体现在设问、讲评和规范等方面,要教会学生清晰的思维、准确地计算,要引导学生感悟定性判断与定量判断之间的辩证关系.●教学流程情境引入⇒如何判断线性相关⇒如何判断线性相关的程度⇒线性回归方程的应用⇒可线性化的回归分析⇒归纳总结,深化认识1.自变量取值一定时,若因变量的取值也随之确定,则这两个变量之间的关系称为什么关系?若因变量的取值具有随机性呢?【提示】函数关系,相关关系.2.类比用函数图像研究函数,具有相关关系的两个变量可用什么研究?【提示】散点图.1.回归分析设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:b =l xy l xx=∑i =1n x i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x .2.相关系数 (1)相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r =l xyl xx l yy=∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2∑i =1ny 2i -n y2.(2)相关系数r 与线性相关程度的关系 ①r 的取值范围为[-1,1];②|r |值越大,误差Q 越小,变量之间的线性相关程度越高; ③|r |值越接近0,误差Q 越大,变量之间的线性相关程度越低. (3)相关性的分类①当r >0时,两个变量正相关; ②当r <0时,两个变量负相关;③当r=0时,两个变量线性不相关.一根弹簧的长度y(单位:厘米)在不同拉力x(单位:牛顿)的作用下的数据如下表:(1)求出该弹簧长度y 对拉力x 的线性回归方程; (2)预测拉力为18牛顿时的弹簧长度是多少?【思路探究】 根据样本点数据画出散点图.利用散点图直观分析弹簧长度y 与拉力x 具有线性相关关系,利用线性回归方程中参数的计算公式可得线性回归方程.【自主解答】 (1)作出散点图如图所示:由散点图可看出,两个变量呈现出近似的线性关系,可以建立弹簧长度y 对拉力x 的线性回归方程.将已知数据列成下表:由此可得x =6=17.50,y =6≈9.49,进而可求得b =1 076.20-6×17.50×9.492 275-6×17.502≈0.18, a =9.49-0.18×17.50=6.34.于是,y 对x 的线性回归方程为y =6.34+0.18x .(2)由线性回归方程可知当拉力为18牛顿时,弹簧长度的估计值为6.34+0.18×18=9.58(厘米).1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在作回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.......................4.回归直线必过样本点的中心点.假定单位面积小麦基本苗数x 与成熟期有效穗y 是线性相关的,今测得5组数据如下:求【解】 设线性回归方程为y =a +bx . 则x =30.36,y =43.5,x 2=921.729 6,x y =1 320.66,∑i =15x i y i =6 746.76,∑i =15x 2i =5 101.56.所以b =∑i =15x i y i -5x y∑i =15x 2i -5x 2≈0.291,a =y -b x ≈34.67,∴所求的线性回归方程为y =34.67+0.291x .当x =56.7时,y =34.67+0.291×56.7=51.170. 估计成熟期有效穗为51.170.下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车辆数是否有线性相关关系.机动车辆数x/千台95110112120129135150180 交通事故数y/千件6.27.57.78.58.79.810.213.0断交通事故数y与机动车辆数x是否线性相关.【自主解答】将数据列成下表:i x i y i x2i y2i x i y i195 6.29 02538.44589.021107.512 10056.25825.031127.712 54459.29862.441208.514 40072.25 1 020.051298.716 64175.69 1 122.361359.818 22596.04 1 323.0715010.222 500104.04 1 530.0818013.032 400169.00 2 340.0∑ 1 03171.6137 835671.009 611.7 由此可得x=128.875,y=8.95.进而求得r=9 611.7-8×128.875×8.95137 835-8×128.8752×671.00-8×8.952≈0.992 7.因为r>0.75,所以可以得出交通事故数y和机动车辆数x有较强的线性相关程度.1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多.需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r>0.75,则线性相关较为显著,否则为不显著.现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下:【解】 x =110×(120+108+…+99+108)=107.8, y =110(84+64+…+57+71)=68,∑i =110x 2i =1202+1082+…+992+1082=116 584, ∑i =110y 2i =842+642+…+572+712=47 384, ∑i =110x i y i =120×84+108×64+…+99×57+108×71=73 796. 所以相关系数为r =73 796-10×107.8×68116 584-10×107.8247 384-10×682≈0.750 6.由此可看出这10名学生的两次数学成绩具有较强的线性相关关系.可线性化的回归分析某地区的女性在不同年龄段的身高平均值x (单位:cm)和体重平均值y (单位:kg)的数据如下表:(2)若体重超过相同身高的女性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高175 cm、体重82 kg的女性的体重是否正常?【思路探究】由样本点画出散点图,找出拟合函数曲线,转化为线性回归模型解题.注意最后要将中间变量值用x代换.【自主解答】(1)根据上表中的数据画出散点图如图所示:由图可看出,样本点分布在某条类似指数函数曲线y=e c1+c2x的周围,其中c1和c2是待定的系数,令z=ln y,变换后的样本数据表如下:设z与x之间的线性回归模型为z=a+bx,则由表中数据得b≈0.020,a=z-b x≈0.625,所以z与x之间的线性回归方程为z=0.625+0.020x,所以y=e0.625+0.020x.(2)当x=175 cm时,预测平均体重y=e0.625+0.020×175≈61.87(kg),由于61.87×1.2=74.24<82,所以这位女性偏胖.非线性回归方程的求解步骤:若函数模型为y =x 2+bx +c ,则作变换t =________才能转化为y 对t 的线性回归方程. 【解析】 y =(x +b2)2+4c -b 24,令t =(x +b 2)2,则y =t +4c -b 24.【答案】 (x +b2)2求解不严谨致误某工厂在2012年的各月中,某产品的月总成本y (万元)与月产量x (吨)之间有如下数据:点后两位).【错解】 b =∑ni =1x i y i -n x y∑ni =1x 2i -n x2=0.92,a =y -b x =0.60.∴线性回归方程为y =0.92x+0.60.当x=6时,y=0.92×6+0.60=6.12(万元),即该产品1月份的总成本的估计值为6.12万元.【错因分析】未判断y与x是否线性相关就求线性回归方程,思维不严谨致误.【防范措施】在求线性回归方程之前,应先判断变量之间是否线性相关,再求回归方程,否则建立的线性回归方程没有意义.【正解】(1)散点图见下图,从图中可以看到,各点大致在一条直线附近,说明x与y有较强的线性相关关系.(2)b=∑ni=1x i y i-n x y∑ni=1x2i-n x2=0.92,a=y-b x=0.60,∴线性回归方程为y=0.92x+0.60.当x=6时,y=0.92×6+0.60=6.12(万元),即该产品1月份的总成本的估计值为6.12万元.1.解决线性回归问题的思路首先通过散点图分析两变量间是否线性相关,然后利用公式求回归方程,在此基础上,借助回归方程对实际问题进行分析.2.对于非线性回归问题,可以画出已知数据的散点图,经过比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把问题化为线性回归分析问题.1.下列两变量中具有相关关系的是( )A.正方体的体积与边长B.人的身高与体重C .匀速行驶车辆的行驶距离与时间D .球的半径与体积【解析】 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B 中人的身高与体重具有相关关系.【答案】 B2.某产品的广告费用x 与销售额y 的统计数据如下表:售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元【解析】 x =4+2+3+54=3.5,y =49+26+39+544=42,∴a =y -b x =42-9.4×3.5=9.1,∴回归方程为y =9.4x +9.1,∴当x =6时,y =9.4×6+9.1=65.5,故选B. 【答案】 B3.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y =0.254x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 由题意知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.【答案】 0.2544.两个变量满足如下关系:【解】 由表可得:∑5i =1x 2i =1375,∑5i =1y 2i =59 051,∑5i =1x i y i =8 285,x =15,y =108.6.∴r =∑5i =1x i y i -5x y∑5i =1x 2i -5x2∑5i =1y 2i -5y2=8 285-5×15×108.61 375-5×1525 9051-5×108.62≈0.982 6.因此可说两个变量的线性相关程度很强.一、选择题1.下列两个变量具有相关关系的是( ) A .正方体的体积与边长B .匀速行驶的车辆的行驶距离与行驶时间C .人的身高与体重D .人的身高与视力【解析】 A 、B 是函数关系,D 无相关关系.相关关系是一种不确定的关系. 【答案】 C2.随机抽样中测得四个样本点为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .y =x +1B .y =x +2C .y =2x +1D .y =x -1【解析】 x =1+2+3+44=52,y =2+3+4+54=72.因为回归直线一定过点(x,y),所以A项符合要求.【答案】 A3.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图1-1-1),以下结论正确的是( )图1-1-1A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同【解析】由样本的中心(x,y)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,无论样本点个数是奇数还是偶数,故D错.【答案】 A4.为了考查两个变量x和y之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都为t,那么下列说法中正确的是( )A.直线l1和l2都过点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.直线l1和l2必平行D.直线l1和l2必重合【解析】线性回归方程y=bx+a恒过点(x,y),故直线l1和l2都过点(s,t).【答案】 A5.若已知∑(x i-x)2是∑(y i-y)2的两倍,∑(x i-x)(y i-y)是∑(y i-y)2的1.2倍,则相关系数r的值是( )A.21.2B.1.22C.0.92 D.0.65【解析】由题意知r=∑i=1nx i-x y i-y∑i=1nx i-x2∑i=1ny i-y2=1.2∑i=1ny i-y22∑i=1ny i-y2·∑i=1ny i-y2=1.22.【答案】 B二、填空题6.已知变量y对x的线性回归方程为y=-0.81+0.50x,则当x=25时,y的估计值为________.【解析】当x=25时,y的估计值为-0.81+0.50×25=11.69.【答案】11.697.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864℃时,用电量约为________.【解析】∵x=18+13+10-14=10,y=24+34+38+644=40,y=-2x+a过(10,40),∴a=40+2×10=60,∴y=-2x+60. 当x=-4时,y=-2×(-4)+60=68.【答案】68度8.若回归直线方程中的回归系数b=0,则相关系数r=________.【解析】对比线性相关系数和线性回归方程系数b的求解公式:r=∑ni=1x i y i-n x y∑n i=1x2i-n x2∑ni=1y2i-n y2和b=∑ni=1x i y i-n x y∑ni=1x2i-n x2,可以发现其分子相同,故b=0,可推得r=0.【答案】0三、解答题9.某连锁经营公司所属的5个零售店某月的销售额和利润情况如下表:商店名称 A B C D E销售额x/千万元35679利润y/百万元2334 5用最小二乘法计算利润y对销售额x的线性回归方程.(判断相关性利用两种方法)【解】判断相关性先利用散点图大体观察是否具有相关性,散点图如下:通过散点图可知,两个变量具有相关性,下面通过计算再次明确是否具有相关性(根据上表数据,可以算出:x=6,y=3.4),其他数据见下表:x i y i x2i y2i x i y i进而可求得r =200-5×6263-5×3.42≈0.98,相关系数非常接近1,因此两个变量具有显著的线性相关性,b =112-5×6×3.4200-5×62=0.5,a =3.4-0.5×6=0.4,故所求线性回归方程为y =0.5x +0.4.10.某小卖部为了解雪糕销售量与气温之间的关系,随机统计并制作了卖出雪糕数与当天气温的对照表:【解】 由表中数据可得:∑i =18x 2i =6 466,∑i =18x i y i =8 884,x =28,y =37.25,进而可以求得b =∑i =18x i y i -8x y∑i =18x 2i -8x 2=8 884-8×28×37.256 466-8×282≈2.78, a =y -b x ≈37.25-2.78×28=-40.59.∴线性回归方程为y =-40.59+2.78x . 把x =37代入,得y ≈62,∴预测气温为37 ℃时,卖出雪糕的数量约为62根.11.某种图书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15检测每册书的成本费y 与印刷册数的倒数1x之间是否具有线性相关关系,如有,求出y对x 的回归方程.【解】 首先作变量转换u =1x,题目所给数据变成如下表所示的数据:i 1 2 3 4 5 6 7 8 9 10 u i 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 y i10.155.524.082.852.111.621.411.301.211.15可以求得,r =∑10i =1 u i -uy i -y∑10i =1u i -u 2∑10i =1y i -y2≈0.999 8.因此,变量y 与u 之间具有较强的线性相关关系.经计算得b ≈8.973,a ≈1.125,最后回代u =1x可得,y =1.125+8.973x.(教师用书独具)某商店经营一批进价为每件4元的商品,在市场调查时发现,此商品的销售单价x(元)与日销售量y(件)之间有如下关系:x 5678y 1087 3经计算得:x与y具有线性相关关系,且∑4i=1 (x i-x)(y i-y)=-11,∑4i=1(x i-x)2=5,为使日利润最大,则销售单价应定为多少元?【思路探究】本题具有综合性,首先求得线性回归方程,再利用函数思想求得关于利润的关系式,转化为二次函数知识求解.【自主解答】由b=∑ni=1x i-x y i-y∑n i=1x i-x2=-115=-2.2,结合数表可得x=6.5,y=7.由y=b x+a,得a=y-b x=7-(-2.2)×6.5=21.3,则销售单价为x时的利润w=(x-4)(-2.2x+21.3)=-2.2x2+30.1x-85.2,当x=30.12×2.2≈6.8时,日利润最大.∴销售单价应定为6.8元.1.在求回归方程时,一般先要考查y 与x 是否具有线性相关关系,考查的方法有两种:一种是画出散点图,另一种是作相关性检验,即求相关系数.2.求解两个变量的相关系数及它们的线性回归方程的计算量较大,需要细心、谨慎地计算.如果会使用含统计的科学计算器,能简单得到∑ni =1x i ,∑ni =1y i ,∑ni =1x 2i ,∑ni =1y 2i ,∑ni =1x i y i 这些量,也就无需制表这一步,直接算出结果即可.另外,利用计算机有关应用程序也可以对这些数据进行处理.3.本题把线性回归、一次函数、二次函数巧妙地结合在一起,知识交汇是高考命题的主要思路,所以这类题目应该引起关注.某高中地处县城,学校规定家到学校路程在5里以内的学生可以走读,因交通便利,所以走读生人数很多,该校先后5次对走读生的情况进行统计,下表是根据5次调查得到的下午开始上课时间与平均每天午休的走读生人数的统计数据表:(1)如果把下午开始上课时间2:00作为横坐标原点,上课时间每推迟10分钟,横坐标x增加1,以平均每天午休人数为纵坐标,画出散点图;(2)求平均每天午休人数y与上课时间x之间的线性回归方程y=bx+a;(3)预测当下午上课时间推迟到2:50时,走读生中大约有多少人午休?【解】(1)由题意得(2)x=2,y=500,b=130,a=y-b·x=240,∴所求线性回归方程为y=130x+240.(3)下午上课时间推迟到2:50,x=5,∴y=130×5+240=890.此时午休的走读生约有890人.线性回归的来历回归分析最早是19世纪末期高尔顿所引入.高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力进化问题,统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的.1855年,他发表了一篇“遗传的身高向平均数方向的回归”文章,分析儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将子女与父母身高的这种现象拟合出一种线形关系.但是有趣的是,通过观察他注意到,尽管这是一种拟合较好的线性关系,但仍然存在例外现象:身材较矮的父母所生子女比其父母要高,身材较高的父母所生子女的身高将回降到人的平均身高.换句话说,当父母身高走向极端(或者非常高,或者非常矮),子女的身高不会像父母身高那样极端化,其身高要比父母们的身高更接近平均身高.高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”.关于父辈身高与子代身高的具体关系,高尔顿和他的学生K·Pearson观察了1078对夫妇,以每对夫妇的平均身高作为自变量,取他们的一个成年子女的身高作为因变量,结果发现两者近乎一条直线,其回归直线方程为y=33.73+0.516x,这种趋势及回归方程表明父母身高每增加一个单位时,其成年子女的身高平均增加0.516个单位.这样当然极端值就会向中心靠拢.§2独立性检验2.1 条件概率与独立事件(教师用书独具)●三维目标1.知识与技能(1)了解条件概率的概念,能利用条件概率分析和解决简单的实际问题.(2)能从条件概率的角度理解两个事件相互独立的含义,能求两个相互独立事件同时发生的概率.2.过程与方法在利用事件的独立性对生活中的随机现象进行辨析的过程中,进一步培养学生的随机观念,掌握利用概率的知识,分析解决实际问题的方法.3.情感、态度与价值观通过利用概率知识解决简单的实际问题,进一步体会和感受数学知识在生活中的应用,培养随机意识.●重点难点重点:两个事件相互独立的概念及相应概率的计算.难点:对条件概率的概念的理解及相应计算.本节中条件概率的引入,目的是为了讲解事件的独立性.因此,在教学中,要引导学生探究如何从条件概率的角度来理解事件间的独立性.对于条件概率,可通过一些简单的问题,让学生理解其意义与求法.(教师用书独具)●教学建议1.由于条件概率的引入目的是为了讲解事件的独立性,在教学中,没有必要对条件概率的内容展开介绍.2.在教学中,要注意公式的类比与变形,由P(A|B)=P A ∩BP B类比可得到P(B|A)=P A∩BP A,变形可得到P(A∩B)=P(A|B)·P(B).3.如果事件A,B相互独立,则事件A与B,A与B,A与B也相互独立,课堂上可以以事件A与B相互独立为例,给出证明过程,深化学生对事件独立性的认识.●教学流程情境引入⇒实例探究⇒抽象概括:条件概率的定义及计算公式⇒实例探究⇒抽象概括:两事件独立的定义及其同时发生的概率的计算方法⇒应用实例及变式训练⇒归纳提升条件概率一个家庭有两个孩子,假设男女出生率一样.(1)这个家庭一男一女的概率是多少?(2)预先知道这个家庭中至少有一个女孩,这个家庭一男一女的概率是多少?【提示】 (1)12,(2)23.(1)概念:已知事件B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率,记为P (A |B ).(2)公式:当P (B )>0时,P (A |B )=P ABP B.相互独立事件在一次数学测试中,甲考满分,对乙考满分有影响吗? 【提示】 没有影响.(1)定义:对两个事件A ,B ,如果P (AB )=P (A )P (B ),则称A ,B 相互独立. (2)性质:如果A ,B 相互独立,则A 与B ,A 与B ,A 与B 也相互独立.(3)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=P (A 1)P (A 2)…P (A n ).条件概率问题在100件产品中有95件合格品,5件不合格品,现从中不放回地取两次,每次任取一件,试求:(1)第一次取到不合格品的概率;(2)在第一次取到不合格品后,第二次再次取到不合格品的概率.【思路探究】 求解的关键是判断概率的类型.第一问是古典概型问题;第二问是条件概率问题.【自主解答】 设“第一次取到不合格品”为事件A ,“第二次取到不合格品”为事件B .(1)P (A )=5100=0.05.(2)法一 第一次取走1件不合格品后,还剩下99件产品,其中有4件不合格品.于是第二次再次取到不合格品的概率为499,这是一个条件概率,表示为P (B |A )=499.法二 根据条件概率的定义计算,需要先求出事件AB 的概率.P (AB )=5100×499, ∴有P (B |A )=P ABP A =5100×4995100=499.1.注意抽取方式是“不放回”地抽取.2.解答此类问题的关键是搞清在什么条件下,求什么事件发生的概率. 3.第二问的解法一是利用缩小样本空间的观点计算的,其公式为P (B |A )=n ABn A,此法常应用于古典概型中的条件概率求法.在例1题设的条件下,试求在第一次取到合格品后,第二次取到不合格品的概率. 【解】 法一 第一次取走1件合格品后,还剩下99件产品,其中有5件不合格品,于是第二次取到不合格品的概率为599.法二 ∵P (A B )=95100×599,∴P (B |A )=PA B PA=95100×59995100=599.独立事件的判定对于下列给出的两个事件:①甲、乙两同学同时解一道数学题,事件A 表示“甲同学做对”,事件B 表示“乙同学做对”;②在某次抽奖活动中,记事件A 表示“甲抽到的两张奖券中,一张中一等奖,另一张未中奖”,事件B 表示“甲抽到的两张奖券均中二等奖”;③一个布袋里有3个白球和2个红球,记事件A ,B 分别表示“从中任意取一个是白球”与“取出的球不放回,再从中任取一球是红球”;④在有奖储蓄中,记甲在不同奖组M 和N 中所开设的两个户头分别中一等奖为事件A 和B .其中事件A 和事件B 相互独立的是( ) A .①② B .①④ C .③④ D .仅有①【思路探究】 判断事件A 与事件B 是否相互独立,就是要看事件A 的发生对事件B 的发生是否有影响.【自主解答】判断两个事件是不是相互独立有以下两种方法:(1)由定义,若P(AB)=P(A)P(B),则事件A与B相互独立.(2)由事件本身的性质直接判断,也就是判断一个事件的发生对另一个事件有没有影响.下列事件A,B是独立事件的是( )A.一枚硬币掷两次,A=“第一次为正面”,B=“第二次为反面”B.袋中有4个小球,其中2个白球,2个黑球,不放回地摸两次,A=“第一次摸到白球”,B=“第二次摸到白球”C.掷一枚骰子,A=“出现点数为奇数”,B=“出现点数为偶数”D.A=“人能活到30岁”,B=“人能活到60岁”【解析】由独立事件的意义可定性地判断B,C,D中,其中一个事件的发生对另一个事件有一定的影响.故选A.【答案】 A甲、乙两名篮球运动员分别进行一次投篮,如果两人投中的概率都是0.6.求:(1)两人都投中的概率;(2)其中恰有一人投中的概率;(3)至少有一人投中的概率.【思路探究】本题的着眼点是①事件性质的判断;②概率公式的选择;③“正难则反”的转化.【自主解答】设A为“甲投篮一次,投中”,B为“乙投篮一次,投中”.(1)易知AB为“两人各投篮一次,都投中”,由题意知,事件A与B相互独立,∴P(AB)=P(A)P(B)=0.6×0.6=0.36.(2)事件“两人各投篮一次,恰好有一人投中”包括两种情况:一种是甲投中,乙未投中(事件A B发生),另一种是甲未投中,乙投中(事件A B发生).根据题意,这两种情况在各投篮一次时不可能同时发生,即事件A B与A B互斥,并且A与B,A与B各自相互独立,因而所求概率为P(A B)+P(A B)=P(A)P(B)+P(A)P(B)=0.6×(1-0.6)+(1-0.6)×0.6=0.48.(3)事件“两人各投篮一次,至少有一人投中”的对立事件“两人各投篮一次,均未投中”的概率是P(A B)=P(A)P(B)=(1-0.6)×(1-0.6)=0.16.因此,至少有一人投中的概率为1-P(A B)=1-0.16=0.84.1.求解某些事件的概率时,应首先确定事件间的关系,即两事件是互斥事件,还是相互独立事件.再选择相应的概率公式进行概率计算.2.求解含有“恰有”“至少”“至多”等词语的概率问题,通常转化为求其对立事件的概率,即利用P(A)=1-P(A)求解.有n位同学参加某项选拔测试,每位同学能通过测试的概率都是p(0<p<1),假设每位同学能否通过测试是相互独立的,则至少有一位同学能通过测试的概率为( ) A.(1-p)n B.1-p nC.p n D.1-(1-p)n【解析】至少有一位同学通过测试的对立事件为无人通过测试,其概率为(1-p)n.应用对立事件的概率求解知,至少有一位同学通过测试的概率为1-(1-p)n.【答案】 D事件理解不清致误袋中有6个黄色、4个白色的乒乓球,作不放回抽样,每次任取一球,取2次,则在发现其中之一是黄色的时,另一个也是黄色的概率为________.【错解】P=610×59=49.【答案】4 9【错因分析】将该事件错误地认为是在第一次取出黄色的乒乓球的条件下,第二次取出的也是黄色的乒乓球.【防范措施】在求概率时,首先要弄清楚随机试验是什么?属于什么概型?其次要判断清楚事件的性质.“其中之一是黄色的”包含三个事件:①第一个是黄色的,第二个是白色的;②两个都是黄色的;③第一个是白色的,第二个是黄色的.。
高中数学第一章统计案例1回归分析教案含解析北师大版选修1_2

1回归分析回归分析1.线性回归方程设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程为y =a +bx . 则l xx =∑i =1n(x i -x -)2=∑i =1nx 2i -n x 2,l xy =∑i =1n (x i -x -)(y i -y -)=∑i =1nx i y i -n x - y -,l yy =∑i =1n (y i -y -)2=∑i =1ny 2i -n y -2,b =l xy l xx=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b x -.2.相关系数计算r =l xyl xx l yy=∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2=∑i=1nx iy i -n x y∑i=1nx2i-n x2∑i=1ny2i-n y2性质范围r∈[-1,1]线性相关程度(1)|r|越大,线性相关程度越高;(2)|r|越接近于0,线性相关程度越低;(3)当r>0时,两个变量正相关;(4)当r<0时,两个变量负相关;(5)当r=0时,两个变量线性不相关1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y=a+bx过点(x,y),其中x=1n∑i=1nx i,y=1n∑i=1ny i.3.相关系数的绝对值越接近于1,相关性越强;相关系数越接近于0,相关性越弱.线性回归方程[例1] )有如下的统计资料:使用年限x/年2345 6维修费用y/万元 2.2 3.8 5.5 6.57.0若y对x(1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程;(3)预测使用年限为10年时,维修费用是多少.[思路点拨] 先利用散点图分析设备使用年限与所支出的维修费用是否线性相关,若相关再利用线性回归模型求解.[精解详析] (1)作出散点图如图所示.(2)由表知,x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+75=5,∑i =15x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,∑i =15x 2i =22+32+42+52+62=90, 所以b =∑i =15x i y i -n x y∑i =15x 2i -n x 2=112.3-5×4×590-5×42=1.23, a =y -b x =5-1.23×4=0.08.所以线性回归方程为y =1.23x +0.08.(3)根据(2)中的线性回归方程,可预测使用年限为10年时,维修费用约为y =1.23×10+0.08=12.38万元.[一点通] 求回归直线方程的基本步骤:1.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2543.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x 681012y 235 6(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.解:(1)散点图如图:(2)∑i=1nx i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑i=1nx2i=62+82+102+122=344.b=158-4×9×4344-4×92=1420=0.7,a=y-b^x=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,y=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.相关系数[例2] 关于两个变量x和y的7组数据如下表所示:x 21232527293235y 711212466115325试判断x与y之间是否有线性相关关系.[思路点拨] 首先求出r的值,再判断相关关系.[精解详析] x-=17×(21+23+25+27+29+32+35)≈27.4,y-=17×(7+11+21+24+66+115+325)≈81.3,∑i=17x2i=212+232+252+272+292+322+352=5 414,∑i=17x i y i=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑i=17y2i=72+112+212+242+662+1152+3252=124 393,∴r=∑i=17x i y i-7x-y-∑i=17x2i-7x-2∑i=17y2i-7y-2=18 542-7×27.4×81.35 414-7×27.42×124 393-7×81.32≈0.837 5.由于r≈0.837 5与1比较接近,∴x与y具有线性相关关系.[一点通] 回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略地分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.4.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2; ③n =17,r =0.499 1;④n =3,r =0.995 0. 则变量y 和x 线性相关程度最高的两组是( ) A .①和② B .①和④ C .②和④D .③和④解析:选B 相关系数r 的绝对值越大,变量x ,y 的线性相关程度越高,故选B. 5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A 观察散点图可知r 1>0,r 3>0,r 2<0,r 4<0,根据散点的分散程度反映出的相关性的强弱,可知r 2<r 4<0<r 3<r 1.6.在研究硝酸钠的可溶性程度时,在不同的温度(单位:℃)下观测它在水中的溶解度,得观测结果如下:温度x 0 10 20 50 70 溶解度y66.776.085.0112.3128.0解:∑5i =1x i =150,∑5i =1y i =468,∑5i =1x 2i =7 900,∑5i =1y 2i =46 445.18, x =30,y =93.6,∑5i =1x i y i =17 035, r =∑5i =1x i y i -5x y∑5i =1x 2i -5x 2∑5i =1y 2i -5y2=17 035-5×30×93.67 900-5×302×46 445.18-5×93.62≈0.999 6.可线性化的回归分析问题[例3] 为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天12345 6繁殖个数y 612254995190(1)作出这些数据的散点图;(2)求y与x之间的回归方程.[思路点拨] 作出数据的散点图,选择合适的函数模型转化为线性模型.[精解详析] (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y=c1e c2x图像的周围,于是令z=ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25则有y=e0.69x+1.112.[一点通] 可线性化的回归方程的求解步骤:7.下列数据x,y符合哪一种函数模型( )x 12345678910y 2 2.693 3.38 3.6 3.84 4.08 4.2 4.3x B.y=2e xA.y=2+3。
高二数学选修1-2第一章统计案例复习(2013北师大版)精选教学PPT课件

∴r=
14
∑i=1xiyi-14 x y ∑i1=41x2i -14 x 2 ∑i1=41yi2-14 y 2
= 227.51×4369.5075.05≈0.999 7.
因此,年龄和身高之间具有较强的线性相关关系.
BS ·数学 选修1-2
14
(2)由(1)得b=∑ i=114xiyi-14 x ∑ i=1x2i -14 x
BS ·数学 选修1-2
BS ·数学 选修1-2
BS ·数学 选修1-2
对所抽取的样本数据进行分析,分析两个变量之间的关 系——线性关系或非线性关系,并由一个变量的变化去推测 另一个变量的变化,这就是对样本进行回归分析.回归分析 的过程就是建立回归模型的过程,具体步骤是:
BS ·数学 选修1-2
感谢伤痛,让我学会了坚忍,也练就了我释怀生命之起落的本能; 感谢生活,让我在漫长岁月的季节里拈起生命的美丽;
感谢有你,尽管远隔千里,可你寒冬里也给我温暖的心怀; 感谢关怀,生命因你而多了充实与清新;
感谢所有的一切~ ~ ~ ~ ~ ~ 感谢我身边每一位好友,为你祝福,为的敲起祈祷钟!伴你走过每一天。他是一个劫匪,坐过牢,之后又杀了人,穷途末路之际他又去抢银行。 是一个很小的储蓄所。抢劫遇到了从来没有过的不顺利,两个女子拼命反抗,他把其中一个杀了,另一个被劫持上了车。因为有人报了警,警车越来越近了,他劫持着这个女子狂逃,把车都开飞了,撞了很多人,轧了很多小摊。 这个刚刚21岁的女孩子才参加工作,为了这份工作,她拼命读书,毕业后又托了很多人,没钱送礼,是她哥卖了血供她上学为她送礼,她父母双亡,只有这一个哥哥。
是否左利手
不是左 合
左利手
性别
利手 计
女士
10
北师大高中数学选修12第一章统计案例全章教案

第一章统计案例教材整体分析回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地位。
本章是在《数学3(必修)》的统计知识的基础上,通过对典型案例的讨论,进一步学习线性回归分析模型及其应用,并初步了解独立性检验的基本思想,认识统计思想的应用价值。
一、教学目标学习统计最好通过活动和案例来进行,抛开实际意义的作图和计算是不能帮助学生理解好统计内容的. 因此,应该通过统计活动的过程对典型案例进行探究,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。
1.通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用。
2.通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用。
二、主要内容与设计思路统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的一组概念、法则和方法。
统计学最关心的问题是数据能给我们提供哪些信息。
具体地说,面对一个实际问题时,我们关心如何抽取数据、如何从数据中提取信息、所得结论是否可靠等。
本章的教学内容主要由回归分析(§1)和独立性检验(§2)这两个部分组成,在章末安排有一个统计活动即“学习成绩与视力之间的关系”。
在“回归分析”的内容中,教科书首先通过真实的例子,对用最小二乘法建立变量之间线性回归方程的一般原则和方法进行了复习;接着介绍了刻画变量之间线性相关程度的另一种方法—计算线性相关系数,并通过一个具体例子引导学生进一步体会引入线性相关系数的必要性;最后介绍了可以化成线性回归的非线性回归模型,让学生通过具体的问题进一步了解回归的基本思想和应用。
在“独立性检验”的内容中,教科书首先通过实例介绍了条件概率与独立事件;接着通过对“吸烟与肺癌是否相关”的分析介绍了独立性检验的方法;然后通过引入统计量初步感受独立性检验的基本思想;最后介绍独立性检验的应用解决了一些实际问题。
当然,统计的学习离不开实践。
因此,教科书还设计了一个统计活动:学习成绩与视力之间的关系,希望通过这个统计活动,使学生经历较为系统的数据处理过程,并在此过程中综合运用前面所学的知识和统计方法去解决实际问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析高中数学复习课(一)统计案例教案(含解析)北师大版选修12(1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现.(2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题.[考点精要]1.一个重要方程对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y =bx +a .其中b =∑i =1nx i -xy i -y∑i =1nx i -x2,a =y -b x .2.重要参数相关系数r 是用来刻画回归模型的回归效果的,其绝对值越大,模型的拟合效果越好. 3.两种重要图形[典例] (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.9610.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x =116∑i =116x i =9.97,s =116∑i =116x i -x 2=116⎝⎛⎭⎪⎪⎫∑i =116x 2i -16x2≈0.212,∑i =116i -8.52≈18.439,∑i =116(x i -x )(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x -3s ,x +3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2,0.008≈0.09.[解] (1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数为r =∑i =116x i -xi -8.5∑i =116x i -x2∑i =116i -8.52=-2.780.212×16×18.439≈-0.18.由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,所以这条生产线当天生产的零件尺寸的均值的估计值为10.02,∑i =116x 2i =16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 所以这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.[类题通法]求线性回归方程的基本步骤[注意] 对非线性回归问题应利用变量代换,把问题化为线性回归分析问题,使之得到解决.[题组训练]1.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的回归系数为b,回归截距是a,那么必有( )A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析:选A 正相关时,b>0,r>0;负相关时,b<0,r<0.2.为研究某种图书每册的成本费y(元)与印刷数x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.x y u∑i=18(x i-x)2∑i=18(x i-x)(y i-y)∑i=18(u i-u)2∑i=18(u i-u)(y i-y) 15.25 3.630.269 2 085.5-230.30.7877.049表中u i =1x i ,u =18∑i =18u i .(1)根据散点图判断:y =a +bx 与y =c +dx哪一个更适宜作为每册成本费y (元)与印刷数x (千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(回归系数的结果精确到0.01);(3)若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78 840元?(假设能够全部售出,结果精确到1)(附:对于一组数据(ω1,v 1),(ω2,v 2),…,(ωn ,v n ),其回归直线v =a +βω的斜率和截距的最小二乘估计分别为β=∑i =1nωi -ωv i -v∑i =1nωi -ω2,α=v -β ω)解:(1)由散点图判断,y =c +d x适宜作为每册成本费y (元)与印刷册数x (千册)的回归方程.(2)令u =1x,先建立y 关于u 的线性回归方程,由于d =∑i =18u i -uy i -y∑i =18u i -u2=7.0490.787≈8.957≈8.96, ∴c =y -d ·u =3.63-8.957×0.269≈1.22, ∴y 关于u 的线性回归方程为y =1.22+8.96u , 从而y 关于x 的回归方程为y =1.22+8.96x.(3)假设印刷x 千册,依题意:10x -⎝ ⎛⎭⎪⎫1.22+8.96x ·x ≥78.840.即8.78x ≥87.8,解得x ≥10,∴至少印刷10千册才能使销售利润不低于78 840元.独立性检验(1)为容易题,多与概率、统计等内容综合命题.(2)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系” 成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过概率P(K2≥6.635)≈0.01来评价该假设不合理的程度,由实际计算出的k>6.635,说明该假设不合理的程度约为99%,即“两个分类变量有关系” 这一结论成立的可信程度约为99%.[考点精要]独立性判断的方法(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.[典例] (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:P (χ2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828,χ2=n ad -bc 2a +bc +d a +cb +d.[解] (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 k g旧养殖法 62 38 新养殖法3466根据表中数据及χ2的计算公式得, χ2=200×62×66-34×382100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[类题通法]独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.(2)χ2统计量法:通过公式χ2=n ad -bc 2a +bc +d a +cb +d先计算χ2,再与临界值表作比较,最后得出结论.[题组训练]1.如果有99%的把握认为变量A 和B 有关系,那么χ2( ) A .χ2≥3.841B .χ2<3.841C .χ2≥6.635D .χ2<6.635解析:选C 将χ2的值与临界值比较,可知若有99%的把握认为变量A 和B 有关系,则χ2≥6.635.故选C.2.下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计 干净水 52 466 518 不干净水 94 218 312 总计146684830(1)能否有99%的把握认为这种传染病与饮用水的卫生程度有关,请说明理由. (2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析能否有95%的把握认为这种疾病与饮用水有关.解:(1)把表中的数据代入公式得 χ2=830×52×218-466×942146×684×518×312≈54.21.∵54.21>6.635,所以有99%的把握认为该地区这种传染病与饮用水不干净有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×5×22-50×9214×72×55×31≈5.785.因为5.785>3.841,所以有95%的把握认为该种疾病与饮用水不干净有关.1.为了研究气温对某种饮料销售的影响,经过统计,得到一个卖出饮料数与当天气温的对比表:摄氏温度 -1 3 8 13 17 饮料瓶数3405273122( ) A .140 B .190 C .210D .240。