2018学年高中数学选修1-2课件:第1章 统计案例1.2 精品

合集下载

2018年高三数学(北师大版)选修1-2精品学案:第一章 统计案例 章末小结

2018年高三数学(北师大版)选修1-2精品学案:第一章 统计案例 章末小结

第一章章末小结1.回归分析(1)回归分析步骤:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预测.(2)线性回归模型:y=bx+a,其中= x i,= y i,2.相关系数样本相关系数:对于变量y与x的一组观测值,把r==叫作变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度,|r|≤1.当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.|r|越接近1,相关程度越大;|r|越接近0,相关程度越小.3.条件概率与相互独立事件(1)条件概率的定义设A,B为两个事件,且P(A)>0,称P(B|A)= 为在事件A发生的条件下,事件B发生的条件概率.(2)条件概率相关性质①0≤P(B|A)≤1.②若P(B)≠0,则P(AB)=P(B)P(A|B);若P(A)≠0,则P(AB)=P(A)P(B|A).(3)相互独立事件的定义设A,B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立.事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫作相互独立事件.(4)相互独立事件的性质如果事件A与B相互独立,那么A与,与B,与也都是相互独立的.(5)如果一系列的事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1·A2·…·A n)=P(A1)·P(A2)·…·P(A n).4.χ2的计算公式及其特点(1)根据2×2列联表与构造的随机变量χ2= (其中n=a+b+c+d是样本容量)来计算χ2的值.(2)当数据量较大时,统计学中已有明确的结论,随机事件χ2≥x0发生的概率如下:当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;当χ2>2.706时,有90%的把握判定变量A、B有关联;当χ2>3.841时,有95%的把握判定变量A、B有关联;当χ2>6.635时,有99%的把握判定变量A、B有关联.由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误.利用χ2进行独立性检验,可以对推断正确的概率做出估计,样本容量n越大,估计越准确.题型1:线性回归方程已知关于某设备的使用年数x和支出的维修费用y(万元),由资料统计得5组数据(x i,y i)(i=1,2,3,4,5),由资料知y与x线性相关,并且由统计的五组数据得平均值分别为=4,=5.4,若用5组数据得到的线性回归方程y=bx+a去估计使用8年的维修费用比使用7年的维修费用多1.1万元.(1)求回归直线方程;(2)估计使用年数为10年时,维修费用约是多少.【解析】(1)因为直线y=bx+a经过定点(,),又=4,=5.4,所以5.4=4b+a,又8b+a-(7b+a)=1.1,解得b=1.1,a=1,所以回归方程为y=1.1x+1.(2)将x=10代入线性回归方程得y=12.所以,估计使用年数为10年时,维修费用约是12万元.【小结】回归方程一定过中心点(,).本题运用方程的思想,采用待定系数法求解.线性回归方程类似于一次函数的解析式,故有问题可类比一次函数,将问题转化为求函数值.题型2:线性回归模型问题一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,:(1)求变量y与x的相关系数,并对其相关性做出判断;(2)如果y与x有线性相关关系,求回归直线方程;(3)若在实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?【方法指导】(((【解析】(1)=12.5,=8.25,x i y i=438,4 =412.5,=660,=291,所以r===≈≈0.9954.所以y与x有很强的线性相关关系.(2)由(1)可求得b=0.7286,a=-0.8571,所以y=0.7286x-0.8571.(3)要使y≤10,得0.7286x-0.8571≤10,所以x≤14.901.所以机器的转速应控制在14.901转/秒以下.【小结】若能从散点图直观地判断相关关系,就利用散点图进行判断;若散点图不明显时,我们就要根据相关系数r进行判断.在求回归直线方程时学会合理进行运算很关键,为准确运算,可先列表求出相关数据,然后求解.题型3:非线性相关问题:检测每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系.如有,求出y对x的回归方程.【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再代回u=,就得到了y对x的回归曲线方程.【解析】首先作变量置换u=,题目所给数据变成如下表所示的10对数据:经计算得r=0.9998,从而认为u与y之间具有线性相关关系,由公式得a=1.125,b=8.973,所以y=1.125+8.973u.最后代入u=,可得y=1.125+.【小结】在某些情况下可以借助于线性回归模型,研究呈现非线性相关关系的两个变量之间的关系,分析哪个模型拟合效果更好.题型4:相互独立事件的概率甲、乙两人都进行一次射击,如果两人击中目标的概率都是0.8,两人之间相互没有影响.计算:(1)两人都击中目标的概率;(2)恰有一人击中目标的概率;(3)至少有一人击中目标的概率.(2(3【解析】设“甲击中目标”记为事件A,“乙击中目标”记为事件B,A与B相互独立.(1)两人各射击一次都击中目标即为事件AB,由事件A与B相互独立,得P(AB)=P(A)P(B)=0.8×0.8=0.64;(2)P(A+B)=P(A)+P(B)=P(A)P()+P()·P(B)=0.8×0.2+0.2×0.8=0.32;(3)P()=P()P()=(1-P(A))·(1-P(B))=(1-0.8)×(1-0.8)=0.04,1-P()=1-0.04=0.96.【小结】把一个复杂的事件拆分成几个互斥或者相互独立的事件,是解决较为复杂概率问题的根本方法.题型5:独立性检验模型为了考察某种药物预防疾病的效果,任选105只动物做试验,其中55只服用此种药,50只未服用此种药,之后发现服药的55只中有10只患病,未服药的50只动物中有20只患病,请判断此种药物是否有效.根据公式:χ2=≈6.1>3.841.所以我们有95%以上的把握判断该药物有效.【小结】在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论可能犯错误,这是数学中的统计思维与确定性思维的不同之处,但我们可以利用统计分析的结果去预测实际问题的结果.用独立性检验的方法准确地判断两个变量的关联性,但要注意其一般步骤及准确计算.1.(2014年·湖北卷)得到的回归方程为=bx+a,则().A.a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<0【解析】作出散点图如下:观察图像可知,回归直线=bx+a的斜率b<0,当x=0时,y=a>0.故a>0,b<0.【答案】B2.(2014年·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是().表1表2表3表4A.成绩B.视力C.智商D.阅读量【解析】A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.∵<<<,∴与性别有关联的可能性最大的变量是阅读量.【答案】D一、选择题1.设某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着().A.高度相关B.中度相关C.弱度相关D.极弱相关【答案】A2.设有回归直线方程y=2-1.5x,当变量x增加1个单位时().A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位【解析】设变量x增加1个单位后y变为y',则y'=2-1.5(x+1)=2-1.5x-1.5=y-1.5.【答案】C3.已知对一组观测值(x i,y i)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为().A.y=0.51x+6.6475B.y=6.6475x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【答案】A4.若事件M、N相互独立,则下列三个结论:①M与相互独立;②N与相互独立;③与相互独立.其中正确的个数为().A.0B.1C.2D.3【解析】由两个事件相互独立的概念可以判定.【答案】D5.某学校开展研究性学习活动,:对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是().A.y=2x-2B.y=()xC.y=log2xD.y=(x2-1)【解析】将给定的点代入比较即可.【答案】D6.下面是一个2×2列联表:则表中a+b+c+d等于().A.125B.128C.133D.147【解析】∵a+21=73,∴a=52,又由b+46=73+27,知b=54.∵c+d=27,∴a+b+c+d=133.【答案】C7.在研究变量x和y的线性相关性时,甲、乙二人分别做了研究,利用最小二乘法得到线性回归方程l1和l2,两人计算的相同,也相同,下列说法正确的是().A.l1与l2重合B.l1与l2一定平行C.l1与l2相交于点(,)D.无法判断l1和l2是否相交【解析】回归直线方程过点(,).【答案】C8.设有一个回归方程y=3-3.5x,若变量x增加一个单位,则().A.y平均增加3.5个单位B.y平均增加3个单位C.y平均减少3.5个单位D.y平均减少3个单位【解析】x的系数为-3.5,所以减少.【答案】C9.某市通过随机询问100,得到如下的2×2列联表:得到的正确结论是().A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【解析】χ2=≈3.030,因为χ2>2.706,所以说有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.【答案】C10.某道路的A、B、C三处都设有交通灯,这三盏灯在一分钟内开放绿灯的时间分别为25秒、35秒、45秒,某辆车在这条路上行驶时,三处都不停车的概率是().A.B.C.D.【解析】××=.【答案】A二、填空题11.有下列关系:(1)人的年龄与他(她)的身高之间的关系;(2)圆的体积与半径之间的关系;(3)直线上的点与该点的坐标之间的关系.其中有相关关系的是(填写你认为正确的序号).【答案】(1)12.从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为.【答案】正相关13.对四对变量y与x进行相关性检验,已知n是观测值的组数,r是相关系数.且已知:(1)n=7,r=0.9533;(2)n=15,r=0.3012;(3)n=17,r=0.4991;(4)n=3,r=0.9950.则变量y与x的线性关系很强的是.【解析】统计学中常用相关系数r来衡量两个变量之间线性关系的强弱,|r|≤1,|r|越接近于1,则y与x的线性关系越强.【答案】(1)(4)14.已知随机事件A的概率P(A)=0.5,事件B的概率P(B)=0.6,事件AB的概率P(AB)=0.4,则条件概率P(B|A)=.【解析】P(B|A)===0.8.【答案】0.815.幂函数曲线y=ax b,作变换u=ln y,v=ln x,c=ln a,得线性函数.【解析】将u=ln y,v=ln x,c=ln a代入y=ax b,消去x、y得u=c+bv.【答案】u=c+bv三、解答题16.因冰雪灾害,某柑橘基地果树严重受损,为此有关专家提出一种拯救果树的方案,该方案需分两年实施且相互独立.该方案预计第一年可以使柑橘产量恢复到灾前的1.0、0.9、0.8的概率分别为0.2、0.4、0.4;第二年可以使柑橘产量为第一年产量的1.5倍、1.25倍、1.0倍的概率分别是0.3、0.3、0.4.(1)求两年后柑橘产量恰好达到灾前产量的概率;(2)求两年后柑橘产量超过灾前产量的概率.【解析】(1)令A表示两年后柑橘产量恰好达到灾前产量这一事件,则P(A)=0.2×0.4+0.4×0.3=0.2.(2)令B表示两年后柑橘产量超过灾前产量这一事件,则P(B)=0.2×0.6+0.4×0.6+0.4×0.3=0.48.17.某工厂积极响应节能减排的号召,经过技术改造后,降低了能源消耗,下表提供了该厂记录的某种产品的产量x(吨):根据相关性检验,这组样本数据具有线性相关关系.(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(2)已知该厂技改前100吨此种产品的生产能耗为90吨.试根据求出的线性回归方程,预测生产100吨此产品的生产能耗比技改前降低多少吨?【解析】(1)==4.5,==3.5,=86,x i y i=66.5,b===0.7,a=-b=3.5-0.7×4.5=0.35.故线性回归方程为y=0.7x+0.35.(2)根据回归方程预测生产100吨产品消耗的能耗约为0.7×100+0.35=70.35.故耗能减少了90-70.35=19.65吨.18.企业为了研究员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,其中积极支持企业改革的调查者中,工作积极的有54人,工作一般的有32人,而不太赞成企业改革的调查者中,工作积极的有40人,工作一般的有63人.(1)根据以上的数据建立一个2×2列联表;(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?【解析】(1)(2)由公式得χ2=≈10.759,因为10.759>6.635,所以有99%以上的把握说抽样员工对待企业改革的态度与工作积极性是有关的,也可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的. 19.(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;(2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量.【解析】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,对预处理后的数据,容易算得=0,=3.2,b==6.5,a=-b=3.2.由上述计算结果,知所求回归直线方程为:y-257=b(x-2010)+a=6.5(x-2010)+3.2,即y=6.5x-12804.8.(2)利用回归直线方程,可预测2016年的粮食需求量约为6.5×(2016-2010)+260.2=6.5×6+260.2=299.2万吨.20.某市工薪阶层关于“延迟退休年龄”的态度进行调查,随机抽调了50人,他们月收入的频数神笛2005神笛2005(1)由以上统计数据填下面2×2列联表并问分析 “月收入以5000为分界点”对“延迟退休年龄”(2)若参加此次调查的人中,有9人为公务员,现在要从这9人中,随机选出2人统计调查结果,其中a 、b 恰为统计局工作人员,求两人至少有1人入选的概率.【解析】(1)2×2χ2=≈6.27>3.841.所以有95%以上的把握认为“月收入以5000为分界点”对“延迟退休年龄”的态度有差异.(2)设9人分别为a ,b ,c ,d ,e ,f ,g ,h ,k ,则选出的2人所有可能的情况为:ab ,ac ,ad ,ae ,af ,ag ,ah ,ak ;bc ,bd ,be ,bf ,bg ,bh ,bk ;cd ,ce ,cf ,cg ,ch ,ck ;de ,df ,dg ,dh ,dk ;ef ,eg ,eh ,ek ;fg ,fh ,fk ;gh ,gk ;hk.共36种,其中a 、b 至少有1人入选的情况有15种,∴a 、b 两人至少有1人入选的概率为P==.21.某种电路开关闭合后,会出现红灯或绿灯闪动.已知开关第一次闭合后,出现红灯和绿灯的概率都是,从开关第二次闭合起,若前一次出现红灯,则下一次出现红灯的概率是,出现绿灯的概率是;若前一次出现绿灯,则下一次出现红灯的概率是,出现绿灯的概率是.(1)第二次闭合后出现红灯的概率是多少?(2)前三次发光中,出现一次红灯、两次绿灯的概率是多少?【解析】(1)概率P 1=P (红红)+P (绿红)=×+×=.(2)概率P 2=P (红绿绿)+P (绿红绿)+P (绿绿红)=××+××+××=.。

2018年高中数学人教A版选修1-2第1章统计案例1.1习题含解析.docx

2018年高中数学人教A版选修1-2第1章统计案例1.1习题含解析.docx

人教 A 版 2018-2019 学年高中数学选修1-2 习题第一章统计案例1.1回归分析的基本思想及其初步应用课时过关·能力提升基础巩固1 关于线性相关的两个变量y 与 x 之间的回归直线方程叙述正确的是()A. 表示 y 与 x 之间的一种确定性关系B.表示 y 与 x 之间的函数关系C.表示 y 与 x 之间的最真实的关系D.表示 y 与 x 之间真实关系的一种效果最好的拟合答案 D2 四名同学根据各自的样本数据研究变量x,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论 :①y与 x 负相关 ,且②y 与 x 负相关 ,且③y 与 x 正相关 ,且④y 与 x 正相关 ,且其中一定不正确的结论的序号是()A. ①②B. ②③C.③④D.①④解析正相关指的是y 随 x 的增大而增大,负相关指的是y 随 x 的增大而减小,故一定不正确的为①④ ,应选 D .答案 D3 已知变量x,y 的取值如下表所示:x4 5 6y8 6 7若 y 与 x 线性相关 ,且线性回归方程为则的值为A .1B解析由题中表格 ,得代入线性回归方程,得 7=解得故选答案 A4 甲、乙、丙、丁四位同学各自对A,B 两变量的线性相关性做试验,并用回归分析方法分别求得R2与残差平方和m 如下表 :甲乙丙丁2R0.82 0.78 0.69 0.85m 106 115 124 103则试验结果体现A,B 两变量有更强的线性相关性的同学是()A .甲 B.乙 C.丙 D.丁答案 D5根据如下样本数据x345678y4.0 2.5-0.5--0.5 2.03. 0得到的回归方程为则ABCD解析可大致画出散点图如图所示,可判断故选答案 A6 为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100 次和 150 次试验 ,并且利用线性回归方法 ,求得回归直线分别为l 1和 l2.已知两个人在试验中发现变量x 的观测数据的平均值都是 s,变量 y 的观测数据的平均值都是t,则下列说法正确的是 ()A. l 1和 l2有交点 (s,t)B.l 1与 l2相交 ,但交点不一定是 (s,t)C.l 1与 l2必定平行D.l 1与 l2必定重合解析由题意知 (s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选 A .答案 A7 已知线性回归方程则当时的估计值是解析将 x= 11 代入得答案 8.958 下表是某厂1~4 月份用水量 (单位 :百吨 )的一组数据 ,已知用水量y 与月份 x 之间有较好的线性相关关系 ,其线性回归方程是则月份1 2 3 4用水量4.5 4 3 2.5y/百吨解析答案 5.259 在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数型曲线y= e bx+a的周围 ,令 z=ln y,求得回归直线方程为则该模型的回归方程为解析由 z=ln y得ln故故该模型的回归方程为答案10 为研究某灌溉渠道水的流速y(单位 :m/s)与水深 x(单位 :m) 之间的关系 ,测得 8 组数据如下 :水深1.40 1.50 1.60 1.70 1.80 1.902.00 2.10x/m水的流速1.70 1.79 1.88 1.952.03 2.10 2.16 2.21y/(m·s-1)(1) 如果 y 与 x 之间具有线性相关关系,求出线性回归方程;(2)预测水深为 1.95 m 时水的流速 .( 精确到 0.01)分析根据已知数据 ,计算回归系数求得回归方程再进行估计解 (1)采用列表方法计算与回归系数如下i x i y i x i y i1 1.40 1.70 1.962. 3802 1.50 1.79 2.252. 6853 1.60 1.88 2.563. 008续表i x i y i x i y i4 1.70 1.95 2.89 3.3155 1.80 2.03 3.24 3.6546 1.90 2.10 3.61 3.9907 2.00 2.16 4.00 4.3208 2.10 2.21 4.41 4.641∑ 14.0015.8224.9227.993于是5,-人教 A 版 2018-2019 学年高中数学修1-2∑∑≈0.733 3,-≈1.977 5-0.733 3 ×1.75≈0.694 2.故 y 与 x 之的性回方程(2)将 x= 1.95 代入所求的性回方程,得≈2.12.算果表明当水深 1.95 m ,可以水的流速 2.12 m/s.能力提升1 已知量x 与 y 正相关 ,且由数据算得本平均数由数据算得的性回方程可能是AC解析由量 x 与 y 正相关 ,可知 x 的系数正 ,排除 C,D .而所有的回直必点由此排除B,故 A .答案 A2 某大学的女生体重y(位 :kg) 与身高 x(位 :cm) 具有性相关关系,根据一本数据(x i,y i)(i= 1,2,⋯,n), 用最小二乘法建立的回方程下列中不正确的是A. y 与 x 具有正的性相关关系B.回直本点的中心C.若大学某女生身高增加 1 cm,其体重增加0.85 kgD.若大学某女生身高170 cm, 可断定其体重必58.79 kg解析 D 中 ,若大学某女生身高170 cm,可断定其体重0.85×170-85.71= 58.79(kg) .故 D 不正确 .答案 D3 已知x与y之间的几组数据如下表:x1 2 3 4 5 6y0 2 1 3 3 4假设根据上表数据所得线性回归直线方程为若某同学根据上表中的前两组数据和求得的直线方程为则以下结论正确的是AC∑-解析-故∑--答案 C★4 某市物价部门对本市的 5 家商场某商品一天的销售量及其价格进行调查,5 家商场该商品的价格 x 元和销售量y 件之间的一组数据如下表所示:价格 x/元销售量y/件9 9.5 m 10.5 11 11 n 8 65已知销售量y 与价格 x 之间有较强的线性相关关系,其线性回归直线方程是且则解析由已知,得将点的坐标代入线性回归直线方程得又m+n= 20,解得 m= 10,n= 10.答案 105 关于x与y有如下数据:x 2 4 5 6 8y 30 40 60 50 70为了对 x,y 两个变量进行统计分析,现有以下两种线性模型:甲乙则模型填甲或乙拟合的效果更好解析对于甲模型 ,∑∑对于乙模型因为所以甲模型拟合效果更好答案甲6 有一位同学家里开了一个小卖部,他为了研究气温对热茶销售杯数的影响,经过统计 ,得到一个卖出热茶杯数与当天气温的对比表:气温-5 0 4712 15 19 23 27 31 36x/℃热茶销售杯数 156 150 132 128 130 116 104 89 93 76 54y/杯(1) 求热茶销售杯数与气温的线性回归方程;(2)预测当气温为 -10 ℃时热茶的销售杯数 .分析根据样本点数据画出散点图,利用散点图直观分析热茶销售杯数y 与气温 x 具有线性相关关系,利用线性回归方程中参数的计算公式可得线性回归方程.解 (1)所给数据的散点图如图所示.由图可看出 ,这些点在一条直线附近,可以用线性回归方程来刻画y 与 x 之间的关系 .因为由公式计算得≈-2.352≈147.772,所以 y 对 x 的线性回归方程为(2)当气温为 -10 ℃时 ,由回归方程可以预测热茶的销售杯数为≈171.★7 假设关于某设备的使用年限x(单位 :年 )和所支出的维修费用y(单位 :万元 )的有关统计资料如下表所示 :使用年限 x/23456年维修费用 y/2.23.8 5.5 6.5 7.0万元若由资料知y 与 x 呈线性相关关系.(1) 求线性回归方程的回归系数(2)求 R2;(3)估计当使用年限为 10 年时 ,维修费用是多少 ?解 (1)由已知数据制成下表:i12345合计x i 2345620y i 2.23.85.56.57.025由此可得∑∑故∑-(2)R2= 1-≈0.958 7.∑(3)回归直线方程为当时故估计当使用年限为年时维修费用是万元。

2018高中数学人教A版选修1-2课件:第一章 统计案例 本章整合

2018高中数学人教A版选修1-2课件:第一章 统计案例 本章整合

综合应用 专题1 专题2 专题3 专题4
2.回归分析的方法:回归模型法. 基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变 量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的 关系; (3)由散点图确定回归方程的大致类型; (4)按一定规则估计回归方程中的参数; (5)得出结果后,可通过残差分析或利用R2来检查模型的拟合效果, 从而得到最佳模型.
综合应用 专题1 专题2 专题3 专题4
编号 残差e 编号 残差e
^ ^
1 0.36 6 -0.04
2 -0.32 7 0.28
3 0 8 -0.4
4 -0.68 9 -0.08
5 0.64 10 0.24
综合应用 专题1 专题2 专题3 专题4
(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.
^ ^
^
^ ^
^ ^
������=1 ������
∑ ������������ ������������ -������������ ������
������=1
������

2 ������2 ������ -������������
, ������ = ������ − ������ ������, 其中������, ������为样本平均值.
^
^
综合应用 专题1 专题2 专题3 专题4
解:(1)由题意知 n=10, ������ =
������
1 ������ ∑ ������ ������ ������ =1
2
������ =
80 10
= 8, y =
1 n ∑ ������ ������ n i=1

2018学年高中数学人教A版课件选修1-2 第一章 统计案例 章末分层突破 精品

2018学年高中数学人教A版课件选修1-2 第一章 统计案例 章末分层突破 精品

(2)用 y=13x+1 作为拟合直线时,y 的实际值与所得的 y 值的差的平方和为 s1=1-432+(2-2)2+(3-3)2+4-1302+5-1312=73.
用 y=12x+12作为拟合直线时,y 的实际值与所得的 y 值的差的平方和为 s2 =(1-1)2+(2-2)2+3-722+(4-4)2+5-922=12.
一个车间为了规定工时定额,需确定加工零件所花费的时间,为 此进行了 10 次试验,测得的数据如下表:
零件数 x/个 10 20 30 40 50 60 70 80 90 100 加工时间 y/min 62 72 75 81 85 95 103 108 112 127 经分析加工时间 y 与零件个数 x 线性相关,并求得回归直线方程为^y=0.670x +55.133.
因为 s1>s2,故直线 y=12x+12的拟合程度更好.
独立性检验
独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个 分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是 否有关系,而独立性检验可以精确地得到可靠的结论.
独立性检验的一般步骤: (1)根据样本数据制成 2×2 列联表. (2)根据公式计算 K2 的观测值 k. (3)比较 k 与临界值的大小关系作统计推断.
单位成本(元/件) 73 72 71 73 69 68
n
xiyi-n x y
i=1
b=
,a= y -b x (用最小二乘法求线性回归方程系数公式
n
x2i -n x 2
i=1
n
n
注:xiyi=x1y1+x2y2+…+xiyi+…+xnyn,x2i =x21+x22+…+x2i +…+x2n).

2018高中数学人教A版选修1-2课件:第一章 统计案例 1-2

2018高中数学人教A版选修1-2课件:第一章 统计案例 1-2
有责任 有酒精 无酒精 总计 650 700 1 350 无责任 150 500 650 总计 800 1 200 2 000
试根据上表画出等高条形图,并结合等高条形图分析血液中含有 酒精与对事故负有责任是否有关系.
典例透析 题型一 题型二 题型三 题型四
解:等高条形图如图所示:
图中两个深色条的高分别表示司机血液中有酒精和无酒精样本中 对事故负有责任的频率,从图中可以看出,司机血液中有酒精样本 中对事故负有责任的频率明显高于司机血液中无酒精样本中对事 故负有责任的频率.由此可以认为司机血液中含有酒精与对事故负 有责任有关系.
典例透析 题型一 题型二 题型三 题型四
y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d
知识梳理
2.等高条形图 (1)等高条形图与表格相比,能更直观地反映出两个分类变量间是 否相互影响,常用等高条形图展示列联表数据的频率特征.
(2)观察等高条形图发现 变量之间有关系.

������
������ +������
典例透析 题型一 题型二 题型三 题型四
独立性检验原理的应用 【例2】 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表 是一次调查所得的数据:
患心脏病 每一晚都打鼾 不打鼾 总计 30 24 54 未患心脏病 224 1 355 1 579 总计 254 1 379 1 633
根据独立性检验原理,能否在犯错误的概率不超过0.001的前提下 认为每一晚都打鼾与患心脏病有关系?
������ ������ +������

������ ������ +������

人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》精品课件_33

人教A版高中数学选修1-2《一章 统计案例  1.2 独立性检验的基本思想及其初步应用》精品课件_33

解:根据题目所给数据得到如下列联表:
患心脏病 不患心脏病 总计
秃顶
214
ቤተ መጻሕፍቲ ባይዱ不秃顶
451
总计
665
175
389
597
1048
772
1437
根据列联表中的数据,得到
K 2 1437 (214597 175 451)2 16.373 6.635. 3891048 665 772
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
(2)求k值 (3)下结论
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X 与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X 与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X 与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X 与Y有关系"
练习3:为了调查胃病是否与生活规律有关,在某地对540名40岁以上 的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者 生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生 活规律的共200人. (1)根据以上数据列出2×2列联表; (2)能够以99%的把握认为40岁以上的人患胃病与否和生活规律有关 系吗?为什么?

高中数学人教版选修1-2_模块复习课 第一课 统计案例 (共54张PPT)精选ppt课件

高中数学人教版选修1-2_模块复习课 第一课 统计案例 (共54张PPT)精选ppt课件

【解析】依题意有
P=(-3x+161.5)(x-30)=-3x2+251.5x-4845
=-3(x- )2+ 2 5 1.5
2 5 -1 .45 2845.
所以当x=6 ≈42时1 2 ,P有最大值,约为426.
2 5 1.5 即预测销售单6 价为42元时,能获得最大日销售利润.
【方法技巧】求线性回归方程的基本步骤
每晚都打鼾
30
224
254
不打鼾
24
1 355
1 379
总计
54
1 579
1 633
【解析】由列联表中的信息 知打鼾人群中未患心脏病的 比例为0.88,即患有心脏病 的比例为0.12;同理不打鼾 人群中未患心脏病的比例为0.98,即患有心脏病的比 例为0.02.作出等高条形图(如图).
从该图中可以看出:打鼾样本中患心脏病的比例明显 多于不打鼾样本中患心脏病的比例.因此可以认为“打 鼾与患心脏病有关”.
所以y关于x的b线9 4 性7 3 7 4 回 9 4 归7 3 2 2 方 程5 2,为a 2 7 5 2 1 2 3 ,
y 5 x 3. 2
(3)当x=10时,y =22,|22-23|<2,当x=11时y , =24.5
|24.5-25|<2,当x=13时, =29.5,|29.5-30|<2.
M包含的基本事件有:(AC)、(AD)、(BC)、(BD)、
(CD),所以P(M)=5 . 6
【补偿训练】某研究性学习小组对春季昼夜温差大小 与某花卉种子发芽多少之间的关系进行研究,他们分 别记录了3月1日至3月5日的每天昼夜温差与实验室每 天每100颗种子浸泡后的发芽数,得到如下资料:

2018学年高中数学人教A版课件选修1-2 第一章 统计案例 1-1 精品

2018学年高中数学人教A版课件选修1-2 第一章 统计案例 1-1 精品

“相关指数 R2、残差图”在回归分析中的作用
n
yi-^yi2
i=1
1.相关指数 R2 是用来刻画回归效果的,由 R2=1-
可知,R2 越
n
yi- y 2
i=1
大,意味着残差平方和越小,也就是说模型的拟合效果就越好.
2.残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在 水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报的精 度也越高.
非线性回归分析
[探究共研型]
探究 1 如何解答非线性回归问题?
【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已 知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象 作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换, 把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
6
6
所以 (yi-^yi)2≈0.013 1 8, (yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第 3 个样本点的残差比较大,需要确认在采 集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立 回归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15 的狭窄的水 平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧 长度与拉力成线性关系.
探究 2 已知 x 和 y 之间的一组数据,则下列四个函数中,模拟效果最好的 为哪一个?
x
1
2
y
3
5.99
①y=3×2x-1; ②y=log2x; ③y=4x; ④y=x2.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.2 独立性检验的基本思想 及其初步应用
自主学习•新知突破
1.了解分类变量、列联表的含义.会作2×2列联表. 2.了解随机变量K2的含义以及观测值k的计算公式. 3.了解独立性检验的基本思路及其初步应用.
饮用水的质量是人类普遍关心的 问题. 据统 计 , 饮 用优质水的 518人 中,身体状况优秀的有466人,饮用一 般水 的 312人 中, 身 体状况优秀的有 218人.
(2)2×2列联表 一般地,假设有两个分类变量X和Y,它们的取值分别为 {x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
x1
x2 总计
y1 a c a+c
y2 b d b+d
总计
a+b c+d a+b+c+d
1.分类变量及其关系的分析的理解 (1)这里的“变量”和“值”都应作为广义的变量和值来理 解,只要不属于同种类别都是变量和值,并不一定是取具体的 数值,如:男、女;上、下;左、右等. (2)频数分析是指用不同类别的事件发生的频率的大小比较 来分析分类变量是否有关联关系. (3)等高条形图更加形象直观地反映两个分类变量之间的差 异,进而推断它们之间是否具有关联关系.
3.下列关于随机变量 K2 的说法正确的是________.(填序 号)
①K2 在任何相互独立问题中都可以用来检验有关还是无 关;
②K2 的值越大,两个事件的相关性就越大; ③K2 是用来判断两个分类变量是否有关系的随机变量,只 对于两个分类变量适合; ④K2 的观测值 k 的计算公式为 k=a+bcn+add-ab+ccb+d.
有酒精 无酒精 总计
有责任 650 700 1 350
无责任 150 500 650
总计 800 1 200 2 000
(1)试作出相应的等高条形图; (2)结合等高条形图分析血液中含有酒精与对事故负有责任 是否有关系.
[思路点拨]
(1)相应的等高条形图如图:
(2)图中两个深色条的高分别表示司机血液中有酒精和无 酒精样本中对事故负有责任的频率,从图中可以看出,司机血 液中有酒精样本中对事故负有责任的频率明显高于司机血液中 无酒精样本中对事故负有责任的频率.由此可以认为司机血液 中含有酒精与对事故负有责任有关系.
利用随机变量K2判断分类变量间的关系
在调查的480名男士中有38名患有色盲,520名女士 中有6名患有色盲,利用独立性检验的方法来判断色盲与性别 是否有关?你所得的结论在什么范围内有效?
[ 思 路 点 拨 ] 作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论
根据题目所给的数据作出如下的列联表:
1.在一次恶劣气候的飞行航程中,调查男女乘客在机上 晕机的情况如下表所示,据此资料你是否认为在恶劣气候飞行 中男性比女性更容易晕机?
男性 女性 合计
晕机 23 9 32
不晕机 32 25 57
合计 55 34 89
解析: 由数据的列联表可以得到等高条形图为:
从图中可以发现男性中晕机的频率与女性中晕机的频率相 差较大,故我们认为性别和是否晕机有关系,且在恶劣气候飞 行中男性比女性更容易晕机.
(1)请根据所给数据,列出2×2列联表; (2)喜欢玩电脑游戏与认为作业多有关系的把握大约是多 少?
解析: (1)根据题意,列出2×2列联表如下:
认为作业多 认为作业不多 总计
喜欢玩电脑游戏
18
不喜欢玩电脑游戏
8
总计
26
9
27
15
23
24
50
(2)k=52071×8×231×5-268××2942≈5.059,P(K2≥5.024)=0.025,
得 k=1 00408×0×385×205×144-4×44925×6 62≈27.139,
8分
由于 27.139>10.828,所以在犯错误的概率不超过 0.001 的
前提下,认为性别与患色盲有关系.但这个结论只对所调查的
这 480 名男士和 520 名女士有效.
12 分
的方法
利用随机变量K2判断两分类变量是否有关系 收集样本数据
[思路点拨]
解析: (1)2×2列联表如下:
甲在生产现场 甲不在生产现场
总计
合格品数 982 493 1 475
次品数 8 17 25
总计 990 510 1 500
由列联表可得|ac-bd|=|982×17-493×8|=12 750,相差 较大,可在某种程度上认为“质量监督员甲是否在生产现场与 产品质量有关”.
解析: K2是用来判断两个分类变量是否有关的随机变 量,所以①错;K2的值越大,只能说明我们有更大的把握认为 二者有关系,却不能判断相关性的大小,②错;④中(ad-bc) 应为(ad-bc)2.
答案: ③
4.某班主任对全班50名学生进行了作业量多少的调查, 喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的 有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作 业不多的有15人.
所以在犯错误的概率不超过 0.025 的前提下认为喜欢玩电 脑游戏与认为作业多有关系.
合作探究•课堂互动
利用等高条形图判断分类变量间的关系
2012年5月1日起我国对醉驾列入法律,交通事故明 显降低,现从发生交通事故的司机中抽取2 000名司机的随机样 本,根据他们血液中是否含有酒精以及他们是否对事故负有责 任将数据整理如下:
计算K2的观测值k 结合实际问题确定临界值k0
结合k与k0的值作出判断
2.某电视台联合相关报社对“男女同龄退休”这一公众 关注的问题进行了民意调查,数据如下表所示:
赞同 反对 总计

198
217
415

476
109
585
总计
674
326
1 000
根据表中数据,能否在犯错误的概率不超过0.001的前提下
1.判断分类变量及其关系的方法: (1)利用数形结合思想,借助等高条形图来判断两个分类变 量是否相关是判断变量相关的常见方法. (2)一般地,在等高条形图中,a+a b与c+c d相差越大,两个 分类变量有关系的可能性就越大.
2.分析分类变量关系的步骤: (1)作大量的调查、研究,统计出结果. (2)列出列联表利用频率粗略估计. (3)作出等高条形图,从直观上进一步判断分类变量之间的 关联关系. 特别提醒:通过等高条形图可以粗略地判断两个分类变量 是否有关系,但无法精确地给出所得结论的可靠程度.
监督员甲在不在生产现场与产品质量好坏有关系.
判断两个分类变量之间有无关系,可以用 2×2列联表、等高条形图、独立性检验等方法作出判断,其中 从列联表和等高条形图中只能粗略地进行估计,要进行精确的 判断,必须利用独立性检验进行计算并与临界值对比.
3.调查339名50岁以上人的吸烟习惯与患慢性气管炎的情 况,获数据如下:
认为这一问题的看法与性别有关系?(P(K2≥关”.由列联
表中的数据,可以得到:
k=a+bcn+add-ab+cc2b+d
=1
000×198×109-217×4762 415×585×674×326
≈125.161>10.828
又 P(K2≥10.828)≈0.001,
所以有 99%的把握认为“吸烟与患慢性气管炎有关”.
(2)证明:假设“吸烟与患慢性气管炎之间没有关系”,由于事 件 A={k≥6.635}≈0.01,即 A 为小概率事件,而小概率事件发 生了,进而得假设错误,这种推断出错的可能性约为 1%,即 我们有 99%的把握认为吸烟与患慢性气管炎有关.
◎ 为 了 研 究 男 子 的 年 龄 与 吸 烟 的 关 系 , 抽 查 了 100 个 男 子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支 进行分组,数据如表,试问吸烟量与年龄是否有关?
故在犯错误的概率不超过 0.001 的前提下认为对“男女同
龄退休”这一问题的看法与性别有关.
独立性检验的综合应用
为了调查某生产线上质量监督员甲对产品质量的好 坏有无影响,现统计数据如下:甲在生产现场时,990件产品 中有合格品982件,次品8件;甲不在生产现场时,510件产品 中 有 合 格 品 493 件 , 次 品 17 件 . 试 分 别 用 列 联 表 、 等 高 条 形 图、独立性检验的方法分析监督员甲对产品质量的好坏有无影 响.能否在犯错误的概率不超过0.001的前提下,认为质量监督 员甲在不在生产现场与产品质量的好坏有关系?
独立性检验
定义 利用随机变量K2来判断“两个分类变量有关 系”的方法称为独立性检验
nad-bc2 公式 K2=____a_+__b__c_+__d__a_+__c___b_+__d_ __.其中n=
____a_+__b_+__c+__d_______
3.独立性检验思想的理解及常用的几个数值 (1)独立性检验的基本思想类似于数学中的反证法,要确认 两个分类变量有关系这一结论成立的可信程度,首先假设该结 论不成立,即假设结论“两个分类变量没有关系”成立,在该 假设下我们构造的随机变量K2应该很小,如果由观测数据计算 得到的K2的观测值很大,则在一定程度上说明假设不合理,根 据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设 不合理的程度,由实际计算得K2的观测值k≥6.635,说明假设 不合理的程度约为99%,即两个分类变量有关系这一结论成立 的可信程度为99%.
人的身体健康状况与饮用水的质 量之间有关系吗?
[提示] 人的身体健康状况与饮用水的质量之间有关系.
分类变量和列联表
1.分类变量 变量的不同“值”表示个体所属的__不__同__类__别___,像这样 的变量称为分类变量.
2.列联表 (1)定义:列出的两个分类变量的___频__数__表____,称为列联 表.
1.下面是一个2×2列联表:
相关文档
最新文档