【赢在课堂】2016高考数学 第一章 统计案例本章整合课件 北师大版选修1-2

合集下载

北师大选修(1-2)第一章《统计案例》word教案

北师大选修(1-2)第一章《统计案例》word教案

选修1-2 第一章 统计案例[课标研读][课标要求]了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)假设检验:了解假设检验的基本思想、方法及其简单应用. (3)聚类分析:了解聚类分析的基本思想、方法及其简单应用. (4)回归分析:了解回归的基本思想、方法及其简单应用.[命题展望]本章所涉及到的知识点均要进行大量的数据计算,而这些计算如果仅仅靠笔算往往是比较困难的,需要借助于计算机或计算器。

其实在新课标中提到“……应鼓励学生使用计算器、计算机等现代技术手段来处理数据……”,而我们目前的高考还不允许使用计算器,所以本章的更看重统计思想。

考虑到本章内容是新增内容,在高考中应该有所体现,但在高考试题中不会出现过于繁琐的计算题,相信会出现一道填空试题或填空题,出现解答题的可能性较小,即使出现,所涉及的计算应该不会很繁琐。

本章的疑点是用这种方法检验可靠吗?实际上这种方法仍然是用样本估计总体,由于抽样的随机性,结果并不唯一,所以用部分推断全体,推断可能正确,也有可能错误。

但我们只要科学合理地去抽样,那么犯错误的可能性就很小了。

如卡方检验中,若26.635χ>,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。

第一讲 回归分析的基本思想及其初步应用[知识梳理][知识盘点]1.相关关系是一种非确定的关系, 是对具有相关关系的两个变量进行统计分析的一种方法。

2.线性回是模型y bx a e =++(e 为 ),因变量y 的值是自变量x 和随机误差e 共同确定的,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为 ,因变量y 称为 。

3.模型中的参数a 和b 用 估计,其计算公式如下:121()()ˆ()niii nii x x y y bx x ==--=-∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,1nii y y ==∑(,)x y称为,回归直线一定经过样本中心点。

高中数学 第一章 统计案例本章知识体系课件 北师大版选修1-2

高中数学 第一章 统计案例本章知识体系课件 北师大版选修1-2

【规律方法】 对于条件概率的计算,首先要作出准 确判断是否为条件概率,具体计算时,通常设出事件 A 和 B,要理解 A 和 B 所表示的含义,然后代入条件概率计算公 式.
设两个独立事件 A 和 B 都不发生的概率为19,A 发生 B 不发生的概率与 B 发生 A 不发生的概率相同,则 A 发生的 前提下,B 发生的概率是多少?
【解析】 由已知 P( A B )=19,P(A B )=P(B A ), 即 P(A)P( B )=P(B)P( A ), 即 P(A)[1-P(B)]=P(B)[1-P(A)], ∴P(A)-P(A)P(B)=P(B)-P(A)P(B). ∴P(A)=P(B). ∴P( A )=P( B )=13.
某地最近十年粮食需求量逐年上升,下表是部分统计
数据:
年份
2002 2004 2006 2008 2010
需求量(万吨) 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方
程 y=bx+a;
(2)利用(1)中所求的直线方程预测该地 2012 年的粮食
需求量.
【解析】 由所给数据看出,年需求量与年份之间近 似直线上升,下面来求回归直线方程,为此对数据预处理 如下:
∴P(A)=23,P(B)=23,P(AB)=P(A)P(B)=49.
4 ∴P(B|A)=PPAAB=92=23.
3
独立性检验
两个变量之间是否有关联,可通过 2×2 列联表用公 式 χ2=a+bcn+add-ab+cc2b+d计算,与临界值比较判断 两个变量之间的关联程度,χ2 越大,两个变量关联程度 越大.当 χ2≤2.706 时认为两个变量无关联;当 χ2>2.706 时有 90%的把握认为两个变量有关联;当 χ2>3.841 时就 有 95%的把握认为两变量有关联;当 χ2>6.635 时就有 99%的把握认为两个变量有关联.

高中数学第一章统计案例章末高效整合课件北师大版选修1_2

高中数学第一章统计案例章末高效整合课件北师大版选修1_2

5.独立事件 (1)A,B 相互独立:对两个事件 A,B,如果 P(AB)=P(A)·P(B), 则称 A,B 相互独立.如果 A,B 相互独立,则 A 与 B ,A 与 B, A 与 B 也相互独立. (2)对多个事件,如果 A1,A2,…,An 相互独立,则有 P(A1A2…An)=P(A1)P(A2)…P(An).
1.维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化 度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度 是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去 控制这一指标,为此必须找出它们之间的关系,现安排一批实 验,获得如下数据.
(1)画散点图; (2)求回归方程; (3)求相关系数. 解析: (1)
7.独立性检验的应用 检验两个变量 A、B 的独立性的方法是:列出 A、B 的 2×2 列联表,根据观测数据计算,由公式 χ2= a+ban+adc-bb+cd2 c+d得到 χ2 的值,将该值与提供的参考值 比较做出判断.
热点考点例析
利用散点图判断线性相关
两个变量之间是否具有线性相关关系.可以先根据样本作 出散点图,看看各样本点是否都在一直线附近摆动.若是,则 两变量之间满足线性相关关系.可求出其线性回归方程.
(2)∵P( A )=1-P(A)=1-23=13,
P( A B)=16,
1 ∴P(B| A )=PPAAB=61=12.
3
2.抛掷红、蓝两颗骰子,设事件A为“蓝色骰子的点数为 3或6”,事件B为“两颗骰子的点数之和大于8”.
(1)求P(A),P(B),P(AB); (2)当已知蓝色骰子的点数为3或6时,问两颗骰子的点数之 和大于8的概率为多少?
当|r|接近于1时,表明两个变量的线性相关性越强.当|r|接 近于0时,表明两个变量几乎不存在线性相关关系.

高中数学第一章统计案例练习北师大版选修1_2

高中数学第一章统计案例练习北师大版选修1_2

【创新设计】2016-2017学年高中数学第一章统计案例练习北师大版选修1-21 回归分析题目击破一、基本概念函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.例1 下列变量之间的关系是相关关系的是________.(1)正方形的边长与面积之间的关系;(2)水稻产量与施肥量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故发生率之间的关系.分析两变量之间的关系有两种:函数关系和带有随机性的相关关系.解析(1)是函数关系;(2)不是严格的函数关系,但是具有相关性,因而是相关关系;(3)既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;(4)降雪量与交通事故发生率之间具有相关关系.答案(2)(4)点评该例主要考查对变量相关关系概念的掌握.二、线性回归方程设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫作回归直线.例2使用年限x 2345 6维修费用y 2.2 3.8 5.5 6.57.0若由资料知y对x呈线性相关关系,试求:(1)回归方程y=a+bx;(2)估计使用年限10年时,维修费用是多少?分析 因为y 对x 呈线性相关关系,所以可以用线性相关的方法解决问题.于是有b =90-5×42=1.23, a =y -b x =5-1.23×4=0.08.∴回归方程为y =1.23x +0.08.(2)当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用约是12.38万元.点评 已知y 对x 呈线性相关关系,无须进行相关性检验,否则,应首先进行相关性检验. 三、非线性回归问题分析非线性回归问题的具体做法是:(1)若问题中已给出经验公式,这时可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决. 下面举例说明非线性回归分析问题的解法.例3 某地区对本地的企业进行了一次抽样调查,表中是这次抽查中所得到的各企业的人均(1)设y 与x 之间具有近似关系y ≈ax b(a ,b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产值(精确到0.01).解 (1)在y ≈ax b的两边取常用对数,可得lg y ≈lg a +b lg x ,设lg y =z ,lg a =A ,lgx =X ,则z ≈A +bX .由公式(1)可得⎩⎪⎨⎪⎧A =-0.215 5,b =1.567 7,由lg a =-0.215 5, 得a ≈0.608 8,即a ,b 的估计值分别为0.608 8和1.567 7. (2)由(1)知y =0.608 8x1.567 7.样本数据及回归曲线的图形如图所示.当x=16时,y=0.608 8×161.567 7≈47.01(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.2 巧解非线性回归问题如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想.一、案例分析温度x/℃2345678某项指标y 5.790 6.8108.19910.00112.19014.79017.801 试建立某项指标y关于温度x的回归模型,并判断你所建立的回归模型的拟合效果.分析根据表中的数据画出散点图,再由图设出相应的回归模型.解画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线y=Bx2+A的周围.令X=x2,则变换后的样本点应该分布在y=bX+a(b=B,a=A)的周围.X 491625364964计算得到线性回归方程为y =0.199 94X +4.999 03.用x 2替换X ,得某项指标y 关于温度x 的回归方程y =0.199 94x 2+4.999 03. 计算得r ≈0.999 997,几乎为1,说明回归模型的拟合效果非常好.点评 本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图像相对照,选择一种跟这些样本点拟合的最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决. 二、知识拓展常见的非线性函数转换方法:(1)幂型函数y =ax m(a 为正数,x ,y 取正值)解决方案:对y =ax m 两边取常用对数,有lg y =lg a +m lg x ,令u =lg y ,v =lg x ,则原式可变为u =mv +lg a ,其中m ,lg a 为常数,该式表示u ,v 的线性函数. (2)指数型函数y =c ·a x (a ,c >0,且a ≠1)解决方案:对y =ca x两边取常用对数,则有lg y =lg c +x lg a ,令u =lg y ,则原式可变为u =x lg a +lg c ,其中lg a 和lg c 为常数,该式表示u ,x 的线性函数.与幂函数不同的是x 保持不变,用y 的对数lg y 代替了y . (3)反比例函数y =k x(k >0)解决方案:令u =1x,则y =ku ,该式表示y ,u 的线性函数.(4)二次函数y =ax 2+c解决方案:令u =x 2,则原函数可变为y =au +c ,该式表示y ,u 的线性函数. (5)对数型函数y =c log a x解决方案:令x =a u ,则原函数可变为y =cu ,该式表示y ,u 的线性函数.3 判断两个分类变量的关系本章的重点是用独立性检验的基本思想对两个分类变量作出明确的判断,下面通过典例剖析如何判断两个分类变量的关系.例 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189对于人力资源部的研究项目,根据上述数据能得出什么结论?分析 首先由已知条件确定a 、b 、c 、d 、n 的数值,再利用公式求出χ2的值,最后根据χ2值分析结果.解 由题目中表的数据可知:χ2=n ad -bc 2a +c a +b c +d b +d=-40×294×95×86×103≈10.759.因为10.759>6.635,所以有99%的把握说员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.点评 在列联表中注意事件的对应及有关值的确定,避免混乱;在判断两个分类变量的关系的可靠性时一般利用随机变量来确定;把计算出的χ2的值与临界值作比较,确定出“A 与B 有关系”的把握.4 独立性检验思想的应用在日常生活中,经常会面临一些需要推断的问题.在对这些问题作出推断时,我们不能仅凭主观臆断作出结论,需要通过试验来收集数据,并依据独立性检验思想做出合理的推断. 所谓独立性检验,就是根据采集样本的数据,利用公式计算χ2的值,比较与临界值的大小关系来判定事件A 与B 是否有关的问题.其基本步骤如下:(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量; (2)根据样本数据制作列联表;(3)计算统计量χ2,并查表分析.当χ2很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系.下面举例说明独立性检验思想在解决实际问题中的应用.例为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,统计结果为:患慢性气管炎共有56人,患慢性气管炎且吸烟的有43人,未患慢性气管炎但吸烟的有162人.根据调查统计结果,分析患慢性气管炎与吸烟在多大程度上有关系?解由列联表可以粗略估计出:有吸烟者中,有20.98%的患慢性气管炎;在不吸烟者中,有9.70%的患慢性气管炎.两个比例的值相差较大,所以结论“患慢性气管炎与吸烟有关”成立的可能性较大.根据列联表中的数据,得到χ2=-256×283×205×134≈7.469>6.635.所以有99%的把握认为“患慢性气管炎与吸烟有关”.点评通过计算检验随机变量χ2,可以比较精确地给出这种判断的可靠程度.先收集数据,然后通过一些统计方法对数据进行科学的分析,这是我们用统计方法解决实际问题的基本策略.。

高中数学第一章统计案例1回归分析教案含解析北师大版选修1_2

高中数学第一章统计案例1回归分析教案含解析北师大版选修1_2

1回归分析回归分析1.线性回归方程设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程为y =a +bx . 则l xx =∑i =1n(x i -x -)2=∑i =1nx 2i -n x 2,l xy =∑i =1n (x i -x -)(y i -y -)=∑i =1nx i y i -n x - y -,l yy =∑i =1n (y i -y -)2=∑i =1ny 2i -n y -2,b =l xy l xx=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b x -.2.相关系数计算r =l xyl xx l yy=∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2=∑i=1nx iy i -n x y∑i=1nx2i-n x2∑i=1ny2i-n y2性质范围r∈[-1,1]线性相关程度(1)|r|越大,线性相关程度越高;(2)|r|越接近于0,线性相关程度越低;(3)当r>0时,两个变量正相关;(4)当r<0时,两个变量负相关;(5)当r=0时,两个变量线性不相关1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y=a+bx过点(x,y),其中x=1n∑i=1nx i,y=1n∑i=1ny i.3.相关系数的绝对值越接近于1,相关性越强;相关系数越接近于0,相关性越弱.线性回归方程[例1] )有如下的统计资料:使用年限x/年2345 6维修费用y/万元 2.2 3.8 5.5 6.57.0若y对x(1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程;(3)预测使用年限为10年时,维修费用是多少.[思路点拨] 先利用散点图分析设备使用年限与所支出的维修费用是否线性相关,若相关再利用线性回归模型求解.[精解详析] (1)作出散点图如图所示.(2)由表知,x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+75=5,∑i =15x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,∑i =15x 2i =22+32+42+52+62=90, 所以b =∑i =15x i y i -n x y∑i =15x 2i -n x 2=112.3-5×4×590-5×42=1.23, a =y -b x =5-1.23×4=0.08.所以线性回归方程为y =1.23x +0.08.(3)根据(2)中的线性回归方程,可预测使用年限为10年时,维修费用约为y =1.23×10+0.08=12.38万元.[一点通] 求回归直线方程的基本步骤:1.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2543.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x 681012y 235 6(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.解:(1)散点图如图:(2)∑i=1nx i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑i=1nx2i=62+82+102+122=344.b=158-4×9×4344-4×92=1420=0.7,a=y-b^x=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,y=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.相关系数[例2] 关于两个变量x和y的7组数据如下表所示:x 21232527293235y 711212466115325试判断x与y之间是否有线性相关关系.[思路点拨] 首先求出r的值,再判断相关关系.[精解详析] x-=17×(21+23+25+27+29+32+35)≈27.4,y-=17×(7+11+21+24+66+115+325)≈81.3,∑i=17x2i=212+232+252+272+292+322+352=5 414,∑i=17x i y i=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑i=17y2i=72+112+212+242+662+1152+3252=124 393,∴r=∑i=17x i y i-7x-y-∑i=17x2i-7x-2∑i=17y2i-7y-2=18 542-7×27.4×81.35 414-7×27.42×124 393-7×81.32≈0.837 5.由于r≈0.837 5与1比较接近,∴x与y具有线性相关关系.[一点通] 回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略地分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.4.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2; ③n =17,r =0.499 1;④n =3,r =0.995 0. 则变量y 和x 线性相关程度最高的两组是( ) A .①和② B .①和④ C .②和④D .③和④解析:选B 相关系数r 的绝对值越大,变量x ,y 的线性相关程度越高,故选B. 5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A 观察散点图可知r 1>0,r 3>0,r 2<0,r 4<0,根据散点的分散程度反映出的相关性的强弱,可知r 2<r 4<0<r 3<r 1.6.在研究硝酸钠的可溶性程度时,在不同的温度(单位:℃)下观测它在水中的溶解度,得观测结果如下:温度x 0 10 20 50 70 溶解度y66.776.085.0112.3128.0解:∑5i =1x i =150,∑5i =1y i =468,∑5i =1x 2i =7 900,∑5i =1y 2i =46 445.18, x =30,y =93.6,∑5i =1x i y i =17 035, r =∑5i =1x i y i -5x y∑5i =1x 2i -5x 2∑5i =1y 2i -5y2=17 035-5×30×93.67 900-5×302×46 445.18-5×93.62≈0.999 6.可线性化的回归分析问题[例3] 为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天12345 6繁殖个数y 612254995190(1)作出这些数据的散点图;(2)求y与x之间的回归方程.[思路点拨] 作出数据的散点图,选择合适的函数模型转化为线性模型.[精解详析] (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y=c1e c2x图像的周围,于是令z=ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25则有y=e0.69x+1.112.[一点通] 可线性化的回归方程的求解步骤:7.下列数据x,y符合哪一种函数模型( )x 12345678910y 2 2.693 3.38 3.6 3.84 4.08 4.2 4.3x B.y=2e xA.y=2+3。

北师大版高中数学选修1-2课件第一章统计案例2第1课时

北师大版高中数学选修1-2课件第一章统计案例2第1课时
P(A|B)=PPA∩BB=00..1128=0.67.
(2)甲地为雨天时乙地也为雨天的概率是
P(B|A)=PPA∩AB=00..1220=0.60.
『规律方法』 1.条件概率的判断 题目中出现已知“在……前提下(条件下)”等字眼时,一般为求条件概率.题 目中没有出现上述明显字眼,但事件 B 的发生受事件 A 发生的影响时,也是条件 概率. 2.求条件概率的方法: (1)用公式 P(B|A)=PPAAB; (2)用 P(B|A)=nnAAB.
(1)甲、乙都未击中的概率; (2)敌机被击中的概率. [思路分析] (1)直接利用相互独立事件同时发生的概率公式计算即可;(2)从 正面分析较麻烦,可考虑求其对立事件的概率.
[解析] 记 A=“甲击中”,B=“乙击中”,C=“甲、乙都没有击中”, D=“敌机被击中”.由题意,甲击中与否并不影响乙击中与否,由此可认为 A
P(A)][1-P(B)][1-P(C)]=1-(1-12)(1-13)(1-14)=34. ∴目标被击中的概率为34.
命题方向3 ⇨综合应用
10 张奖券中有 3 张有奖,甲、乙两人从中各抽 1 张,甲先抽、乙 后抽,求:
(1)甲中奖的概率; (2)乙中奖的概率; (3)在甲未中奖的情况下,乙中奖的概率.
P(B|A)
_____________P_P_A∩B_B____________,记为
_____________P_A_∩_B.
• (3)条件概率计算P公A 式
• 当P(B)>0时,P(A|B)=P(A_)·_P(_B)___________;
• 当P(A)>0时,P(B|A)=______________. • 2.独立事件
可以证明:如果事件 A 与 B 相互独立,那么 A 与 B 、 A 与 B、 A 与 B 也都相 互独立.

高中数学第一章统计案例章末高效整合课件北师大版选修1_2

高中数学第一章统计案例章末高效整合课件北师大版选修1_2
令 χ2=a+bcn+add-ab+cc2b+d.当 χ2≤2.706 时,变量 A、 B 是没有关联的;当 χ2>2.706 时,有 90%的把握判定变量 A、B 有关联.当 χ2>3.841 时,有 95%的把握判定变量 A、B 有关联.当 χ2>6.635 时,有 99%的把握判定变量 A、B 有关联.
7.独立性检验的应用 检验两个变量 A、B 的独立性的方法是:列出 A、B 的 2×2 列联表,根据观测数据计算,由公式 χ2= a+ban+adc-bb+cd2 c+d得到 χ2 的值,将该值与提供的参考值 比较做出判断.
i=1
i=1
再由 a= y -b x 求 a 的值,并写出回归直线方程.( x , y ) 称为样本点的中心,回归直线过样本点的中心.
• (4)线性回归方程中的截距a和斜率b都是通过样本估 计而来的,存在着误差,这种误差可能导致预报结 果的偏差.
• (5)回归直线方程y=a+bx中的b表示x增加1个单位时 y的变化量为b,而a表示y不随x的变化而变化的量.
•章 末 高 效 整 合
知能整合提升
1.回归方程 (1)回归方程有两类:一是线性回归方程,即回归直线方程; 二是非线性回归方程. (2)我们把有相关关系(不确定性关系)转化为函数关系(确 定性关系),当两个具有相关关系的变量近似地满足一次函数关 系时,我们所求出的函数关系 y=a+bx 就是回归直线方程.求 回归直线方程的一般方法是利用计算器计算出 b,再由 a= y - b x 求出 a,写出回归直线方程 y=bx+a.
• (6)可以利用回归直线方程y=a+bx预报在x取某一个 值时,y的估计值.
2.线性相关关系强弱的分析与判断 (1)对于随机变量 x 和 y 随机抽到的 n 个数据(x1,y1),(x2, y2),…,(xn,yn).利用相关系数 r 来衡量两个变量之间的线性

北师大版选修1-2--第一章-统计案例-本章整合----课件(54张)

北师大版选修1-2--第一章-统计案例-本章整合----课件(54张)
=1
=1
=
154 675-20×107×71
232 728-20×1072 × 103 526-20×712
≈0.86.
所以智商与成绩有较强的线性相关关系,
故建立回归模型是有意义的.
20
b=
∑ xi yi -20x y
=1
20
∑ 2 -20
i=1
2
≈0.73,a= − ≈-7.11.
()
=
()
()
()
()
=
()
, 其中
()
为一次试验可能出现
的全部结果数, 是事件所包含的结果数, 为事件与
同时发生时所包含的结果数.
综合应用
专题一
专题二
专题三
专题四
专题五
专题六
应用一个口袋中,有6个红球,4个白球,这些球除颜色差异外,其他
综合应用
专题一
专题二
专题三
专题四
专题五
专题六
专题二 回归分析及相关系数
两个变量之间是否具有线性相关关系,可以通过作散点图或计算
线性相关系数来判断.若两个变量之间存在线性相关关系,可用最
小二乘法求出线性回归方程.设线性回归方程为y=a+bx,

则 b=
∑ xi yi -x
=1
n

i=1
2
2 -
所以P(A|B)=
()
()
=
1
3
3
5
5
= 9.
综合应用
专题一
专题二
专题三
专题四
专题五
专题六
专题五 相互独立事件
1.相互独立事件的判定方法
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
������=1 ������
∑ ������������ ������������ -������������
2 ������ ������=1
������
������
2
回归分析
������=1
∑ ������2 ������ -������������
∑ ������2 ������ -������������
2 ������=1 2
5
������ =1
i=1
������ =1
������=1
∑ ������������ '2 -5������'
∑ ������������ '2 -5������'
5
2
=
5
7790-5×6×210.4 220-5×36× 275990-5×210.4
≈0.9997,
所以 y'与 x'之间有较强的线性相关关系. 又 b=������=15
10
b=������=1 10

∑ ������������ ������������ -10������������
������=1 2 ������2 10 ������ ������
=
19749-10×5.5×288.7 385-10×5.5
2
≈46.9,
a=������-b������ =288.7-46.9×5.5≈30.8, 因此所求的线性回归方程是 y=46.9x+30.8. (3)当 x=11 时,y 的估计值为 y=46.9×11+30.8≈547(人次).

2 ������2 10 ������ ������
∑ ������2 ������ -10������
2
=
19749-10×5.5×288.7 385-10×5.5 × 1020953-10×288.72
2
≈0.984. 由于 0.984 接近 1,这说明点击人次 y 与播放天数 x 之间存在着线性相 关关系,求线性回归方程有实际意义.
������(������������) ������(������)
= = .
6 9
2 3
专题一
专题二
专题三
专题四
专题五
【应用 5】 一个盒子中有 6 根好晶体管,4 根坏晶体管,任取两次,每次取 一根,第一次取后不放回.求若已知第一根是好的,第二根也是好的的概率. 提示:分清条件是什么,应用条件概率公式求解. 解:设 Ai={第 i 根是好的}(i=1,2). 因为 P(A1)= 所以
������ ������
专题一
专题二
专题三
专题四
专题五
由此可得:������'=6,������'=210.4, ∑ xi' =220, ∑ yi' =275990, ∑ xi'yi'=7790. 进而可以求得 r=
������=1 5
5
2
5
2
5
∑ ������������ '������������ '-5������' ������'
36.95 -11.3=-7.605. 10
36.95 -11.3. ������
专题一
专题二
专题三
专题四
专题五
规律方法
通过变量代换,把非线性回归问题转化为线性回归问题,其本质就是换 元思想的应用,这也是数学上常用的重要思想方法.
专题一
专题二
专题三
专题四
专题五
专题三 条件概率
求条件概率的两种方法: (1)对于古典概型类型题目可采用求基本事件数的方法计算 P(A|B)=
������(������������) ������(������)
独立事件������(������������) = ������(������)������(������)
������(������������-������������)2 独立性检验������ = (������ + ������)(������ + ������)(������ + ������)(������ + ������) 独立性检验
3 5 ������(������1 ������2 ) P(A2|A1)= ������(������1 ) 6 10
= ,P(A1A2)= = .
5 9
6×5 10×9
= ,
5 9
1 3
所以第一根是好的,第二根也是好的的概率为 .
专题一
专题二
专题三
专题四
专题五
专题四 相互独立事件
1.相互独立事件的判定方法 (1)A,B 相互独立,则 P(A|B)=P(A)(P(B)>0),P(B|A)=P(B)(P(A)>0); (2)定义验证; (3)对实际问题,经验验证. 2.“恰有”、“至多”、“至少”类问题的求解方法 (1)可以采用分类讨论的方式,列出所有事件,然后结合互斥事件的概率 求解; (2)利用对立事件求解.
10 10 2 2 ∑ xi =385, ∑ yi =1020953, ∑ xiyi=19749 i=1 i=1 i=1 10
专题一
专题二
专题三
专题四
专题五
利用上表的数据,计算点击人次 y 与播放天数 x 之间的相关系数为
10
r=
������=1 10 i=1
∑ xi yi -10xy
10 ������=1
第一章:案例统计本章整合
回归分析
计算公式 b =
������=1 n
∑ xiyi -������x
2 ∑ ������2 ������ -������������ i=1
������
y
,������ = ������-������������
线性回归方程������ = ������ + ������������ 线性相关系数������ =
专题四
专题五
解:(1)散点图如图所示.
(2)借助科学计算器,完成下表:
i 1 2 3 4 5 6 7 8 9 10 xi 1 2 3 4 5 6 7 8 9 10 yi 51 134 213 235 262 294 330 378 457 533 xiyi 51 268 639 940 1310 1764 2310 3024 4113 5330 x=5.5,y=288.7
i=1
2
10
∑ (yi-������)2=764.961.
413.065 227.845×764.961
相关系数 r= 又 b=
413.065 227.845
≈0.9894,
表明这两个变量有很强的线性相关关系. ≈1.813,a=36.53-1.813×18.85≈2.355. 从而回归方程为 y=1.813x+2.355. 当 x=30 时,y=1.813×30+2.355≈56.7(公顷). 所以,当最大积雪深度为 30 厘米时,可灌溉的面积大约为 56.7 公顷.
专题一
专题二
专题三
专题四
专题五
【应用 2】为了估计山上积雪融化后对下游灌溉的影响,在山下建立了 一个观测站,测量了最大积雪深度 x(单位:厘米)与当年灌溉面积 y(单位:公 顷),得到连续 10 年的数据如下表:
年序 1 2 3 4 5 6 7 8 9 10 最大积雪深度 x/厘米 15.2 10.4 21.2 18.6 26.4 23.4 13.5 16.7 24.0 19.1 灌溉面积 y/公顷 28.6 19.3 40.5 35.6 48.9 45.0 29.2 34.1 46.7 37.4
(1)画出散点图. (2)由相关系数判断两变量之间是否有线性相关关系,求线性回归方程 是否有意义?若有意义求出线性回归方程. (3)当播放天数为 11 天时,估计点击人数为多少? 提示:通过散点图或计算相关系数判断两变量是否具有线性相关关系, 通过公式求回归直线方程,由方程进行估计.
专题一
专题二
专题三
试求回归方程,并预测在最大积雪深度为 30 厘米时的灌溉面积.
专题一
专题二
专题三
专题四
专题五
提示:作出散点图,观察两个变量 x 与 y 的关系,或求出相关系数 r 判断, 再求回归方程. 解:作出散点图,如图所示.
从图中看到,数据点大致落在一条直线附近,这说明变量 x 与 y 之间的 关系大致可看作是线性关系. 由所给数据得: ������ = ������ =
专题一
专题二
专题三
专题四
专题五
解:(1)散点图如图所示.
从散点图可以看出 y 与 x 不具有线性相关关系,可猜测为 y= +a 的关 系. 令 x'= ,y'=y,则 y'=bx'+a. x',y'之间的数据关系如下表:
x' 2 4 6 8 10 y' 64 138 205 285 360
1 ������
幂函数曲线������ = ������������ ������ 可线性化的回归分析 指数曲线������ = ������e������������ 倒指数曲线������ = ������e������
������
对数曲线������ = ������ + ������ln������ 条件概率与独立事件 条件概率������(������|������) =
专题一
专题二
专题三
专题四
专题五
专题二 可线性化的回归分析
非线性回归问题一般不给出经验公式,这时,应先画出已知数据的散点 图,把它与所学过的各种函数图像作比较,挑选一种跟这些散点图拟合得最 好的函数,采用适当的变量置换,把问题化为线性回归分析问题,使问题得以 解决. 常见的函数模型有:幂函数型 y=ax ;指数型 y=ae ;倒指数型 数型 y=a+bln x.
相关文档
最新文档