高中数学选修1-2《统计案例》知识点讲义汇编
人教版高中数学选修1-2知识点总结

人教版高中数学选修1-2知识点第一章统计案例1.线性回归方程①变量之间的两类关系:函数关系与相关关系;[来源:简单高中生(ID:jiandan100cn)]②制作散点图,判断线性相关关系;∧1nnx i y i -nx i =1y ⎪⎪③线性回归方程:y =bx +a (最小二乘法)。
其中,⎨⎪b =i =x i2-nx 2⎪⎪⎧⎩a =y -b ⎪x∑∑注意:线性回归直线经过定点(x ,y ).2.相关系数(判定两个变量线性相关性):∑nnnr =i =1i =i =11(i-x )y i -y ∑(xi-x )∑(yi-y )22(x注意:(1)r >0时,变量x ,y 正相关;r <0时,变量x ,y 负相关;(2)①|r |越接近于1,两个变量的线性相关性越强;②|r |接近于0时,两个变量之间几乎不存在线性相关关系。
3.条件概率对于任何两个事件A 和B ,在已知B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率.记为P (A |B ),其公式为P (A |B )=P (AB )P (A )4.相互独立事件(1)一般地,对于两个事件A ,B ,如果P (AB )=P (A )P (B ),则称A 、B 相互独立.(2)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=P (A 1)P (A 2)…P (A n ).(3)如果A ,B 相互独立,则A 与-B ,-A 与B ,-A 与-B 也相互独立.5.独立性检验(分类变量关系):[来源:简单高中生(ID:jiandan100cn)](1)2×2列联表设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1;通过观察得到下表所示数据:并将形如此表的表格称为2×2列联表(2)独立性检验根据2×2列联表中的数据判断两个变量A,B是否独立的问题叫2×2列联表的独立性检验。
高中数学第一章统计案例本章整合课件新人教A版选修1_2

本 章 整 合
专题1
专题2
专题3
专题4
专题一 回归分析 1.对所抽取的样本数据进行分析,分析两个变量之间的关系—— 线性关系或非线性关系,并由一个变量的变化去推测另一个变量的 变化,这就是对样本进行回归分析.回归分析的过程就是建立回归 模型的过程.有时,回归模型可能会有多种选择(如作线性回归模型), 这时,可通过残差分析或利用R2来检查模型的拟合效果,从而得到 最佳模型.
专题3
专题4
应用 2
一个车间为了规定工时定额,需要确定加工零件所花费的时间,为 此进行了10次试验,测得的数据如下:
编号 零件数 x/个 加工时间 y/分钟 1 10 62 2 20 68 3 30 75 4 40 81 5 50 89 6 60 95 7 70 8 9 10
80 90 100
102 108 115 122
^
^
专题1专题2Fra bibliotek专题3专题4
解:(1)由题意知 n=10, ������ =
������
1 ������ ∑ ������ ������ ������ =1
2
������ =
80 10
= 8, y =
1 n ∑ ������ ������ n i=1
=
20 10
= 2,
又 ∑ ������������2 − ������ ������ = 720-10×82=80,
专题1
专题2
专题3
专题4
专题二 独立性检验 1.独立性检验是对两个分类变量间是否存在相关关系的一种案 例分析方法,常用的直观方法为等高条形图.等高条形图由于是等 高的,因此它能直观地反映两个分类变量之间的差异的大小,而利 用独立性检验的思想方法,计算出某一个随机变量K2的观测值来判 断更精确些. 2.独立性检验的基本思想类似于数学上的反证法.要确认“两个分 类变量有关系”这一结论成立的可信程度,首先假设该结论不成立, 即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的 随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很 大,则在一定程度上说明假设不合理.
高中数学 复习课(一)统计案例教案(含解析)北师大版选修1-2-北师大版高二选修1-2数学教案

复习课(一) 统计案例回归分析(1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现.(2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题.[考点精要]1.一个重要方程对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y =bx +a .其中b =∑i =1nx i -xy i -y∑i =1nx i -x2,a =y -b x .2.重要参数相关系数r 是用来刻画回归模型的回归效果的,其绝对值越大,模型的拟合效果越好. 3.两种重要图形[典例] (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.9610.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x =116∑i =116x i =9.97,s =116∑i =116x i -x 2=116⎝⎛⎭⎪⎪⎫∑i =116x 2i -16x2≈0.212,∑i =116i -8.52≈18.439,∑i =116(x i -x )(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x -3s ,x +3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2,0.008≈0.09.[解] (1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数为r =∑i =116x i -xi -8.5∑i =116x i -x2∑i =116i -8.52=-2.780.212×16×18.439≈-0.18.由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,所以这条生产线当天生产的零件尺寸的均值的估计值为10.02,∑i =116x 2i =16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 所以这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.[类题通法]求线性回归方程的基本步骤[注意] 对非线性回归问题应利用变量代换,把问题化为线性回归分析问题,使之得到解决.[题组训练]1.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的回归系数为b ,回归截距是a ,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的符号相反D .a 与r 的符号相反解析:选A 正相关时,b >0,r >0;负相关时,b <0,r <0.2.为研究某种图书每册的成本费y (元)与印刷数x (千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.x y u∑i =18(x i -x )2∑i =18(x i -x )(y i -y )∑i =18(u i -u )2∑i =18(u i -u )(y i -y )15.253.630.269 2 085.5-230.30.7877.049表中u i =1x i ,u =18∑i =18u i .(1)根据散点图判断:y =a +bx 与y =c +dx哪一个更适宜作为每册成本费y (元)与印刷数x (千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(回归系数的结果精确到0.01);(3)若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78 840元?(假设能够全部售出,结果精确到1)(附:对于一组数据(ω1,v 1),(ω2,v 2),…,(ωn ,v n ),其回归直线v =a +βω的斜率和截距的最小二乘估计分别为β=∑i =1nωi -ωv i -v∑i =1nωi -ω2,α=v -βω)解:(1)由散点图判断,y =c +d x适宜作为每册成本费y (元)与印刷册数x (千册)的回归方程.(2)令u =1x,先建立y 关于u 的线性回归方程,由于d =∑i =18u i -uy i -y∑i =18u i -u2=7.0490.787≈8.957≈8.96, ∴c =y -d ·u =3.63-8.957×0.269≈1.22, ∴y 关于u 的线性回归方程为y =1.22+8.96u , 从而y 关于x 的回归方程为y =1.22+8.96x.(3)假设印刷x 千册,依题意:10x -⎝ ⎛⎭⎪⎫1.22+8.96x ·x ≥78.840.即8.78x ≥87.8,解得x ≥10,∴至少印刷10千册才能使销售利润不低于78 840元.独立性检验(1)为容易题,多与概率、统计等内容综合命题.(2)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系” 成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过概率P(K2≥6.635)≈0.01来评价该假设不合理的程度,由实际计算出的k>6.635,说明该假设不合理的程度约为99%,即“两个分类变量有关系” 这一结论成立的可信程度约为99%.[考点精要]独立性判断的方法(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.[典例] (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)附:P (χ2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828,χ2=n ad -bc 2a +bc +d a +cb +d.[解] (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法3466根据表中数据及χ2的计算公式得, χ2=200×62×66-34×382100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[类题通法]独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.(2)χ2统计量法:通过公式χ2=n ad -bc 2a +bc +d a +cb +d先计算χ2,再与临界值表作比较,最后得出结论.[题组训练]1.如果有99%的把握认为变量A 和B 有关系,那么χ2( ) A .χ2≥3.841 B .χ2<3.841 C .χ2≥6.635D .χ2<6.635解析:选C 将χ2的值与临界值比较,可知若有99%的把握认为变量A 和B 有关系,则χ2≥6.635.故选C.2.下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计 干净水 52 466 518 不干净水 94 218 312 总计146684830(1)能否有99%的把握认为这种传染病与饮用水的卫生程度有关,请说明理由. (2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析能否有95%的把握认为这种疾病与饮用水有关.解:(1)把表中的数据代入公式得 χ2=830×52×218-466×942146×684×518×312≈54.21.∵54.21>6.635,所以有99%的把握认为该地区这种传染病与饮用水不干净有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×5×22-50×9214×72×55×31≈5.785.因为5.785>3.841,所以有95%的把握认为该种疾病与饮用水不干净有关.1.为了研究气温对某种饮料销售的影响,经过统计,得到一个卖出饮料数与当天气温的对比表:摄氏温度 -1 3 8 13 17 饮料瓶数3405273122( ) A .140 B .190 C .210D .240解析:选B 依题意得x =15×(-1+3+8+13+17)=8,y =15×(3+40+52+73+122)=58,则回归直线必经过点(8,58),于是有a =58-6×8=10.当x =30时,y =6×30+10=190,故选B.2.下列说法中正确的有:( ) ①若r >0,则x 增大时,y 也相应增大; ②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.A .①②B .②③C .①③D .①②③解析:选C 若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确.r <0,表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故③正确.3.有下列数据:A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:选A 分别把x =1,2,3,代入求值,求最接近y 的值.即为模拟效果最好,故选A.4.某产品的广告费用x 与销售额y 的统计数据如下表:6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元解析:选B x =4+2+3+54=3.5,y =49+26+39+544=42,∵数据的样本中心点(3.5,42)在线性回归直线上,回归方程y =bx +a =9.4x +a ,∴42=a +9.4×3.5,∴a =9.1,∴线性回归方程是y =9.4x +9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5(万元).5.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为该栏目优秀B .有99%的人认为该栏目是否优秀与改革有关系C.有99%的把握认为电视栏目是否优秀与改革有关系D.没有理由认为电视栏目是否优秀与改革有关系解析:选 D 只有χ2>6.635时才能有99%的把握认为电视栏目是否优秀与改革有关系.而即使χ2>6.635也只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,故选D.6.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )优、良、中差总计实验班48250对比班381250总计8614100A.有关B.无关C.关系不明确D.以上都不正确解析:选A 随机变量χ2=100×48×12-38×2250×50×86×14≈8.306>6.635,则有99%的把握认为“实验效果与教学措施有关”.7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方程y=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189 现发现表中有一个数据看不清,请你推断出该数据的值为________.解析:由表格知x=30,得y=0.67×30+54.9=75.设表中的“模糊数字”为a.则a+62+75+81+89=75×5,所以a=68.答案:688.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:选未选总计男40545450女230220450总计635265900那么,认为选修《人与自然》与性别有关的把握是______.解析:χ2=n ad-bc2a+b c+d a+c b+d=163.794>6.635,即有99%的把握认为选修《人与自然》与性别有关.答案:99%9.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则r 1,r 2的大小关系为________.解析:对于变量X 与Y 而言,Y 随X 的增大而增大,故变量Y 与X 正相关,即r 1>0;对于变量U 与V 而言,V 随U 的增大而减小,故变量V 与U 负相关,即r 2<0.故r 2<0<r 1.答案:r 2<r 110.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试问:文科学生总成绩不好与数学成绩不好有关系吗?总成绩情况数学成绩情况总成绩好 总成绩不好总计 数学成绩好 478 12 490 数学成绩不好399 24 423 总计87736913解:根据题意,χ2=913×478×24-399×122490×423×877×36≈6.233>3.841,因此有95%的把握认为“文科学生总成绩不好与数学成绩不好有关系”.11.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:积极参加 班级工作 不太主动 参加班级工作总计 学习积极性高 18学习积极性一般19总计50(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是25,请完成上面的2×2列联表.(2)在(1)的条件下,试运用独立性检验的思想方法分析:能否有99%的把握认为学生的学习积极性与对待班级工作的态度有关?并说明理由.P (χ2≥k )0.010 0.005 0.001 k6.6357.87910.828解:(1)如果随机抽查这个班的一名学生,抽到积极参加班级工作的学生的概率是1225,所以积极参加班级工作的学生有24人,由此可以算出学习积极性一般且积极参加班级工作的人数为6,不太主动参加班级工作的人数为26,学习积极性高但不太主动参加班级工作的人数为7,学习积极性高的人数为25,学习积极性一般的人数为25,得到:积极参加 班级工作 不太主动 参加班级工作总计 学习积极性高 18 7 25 学习积极性一般6 19 25 总计 242650(2)χ2=50×18×19-6×7225×25×24×26≈11.538,因为11.538>6.635,所以有99%的把握可以认为学习积极性与对待班级工作的态度有关系.12.如图是我国2012年到2018年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2020年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解:(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17y i -y2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2020年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2020年我国生活垃圾无害化处理量将约为1.82亿吨.。
高中数学选修1-2(人教A版)第一章统计案例1.2知识点总结含同步练习及答案

为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果 如表所示.根据所选择的
193
个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计
58 64 122
无效
40 31 71
合计
98 95 193
解:提出假设
H 0 :药的效果与给药方式没有关系.
) 的前提下,认为"爱好该项运动与性别有关" 的前提下,认为"爱好该项运动与性别无关"
以上的把握认为"爱好该项运动与性别有关" 以上的把握认为"爱好该项运动与性别无关"
0.01 = 1% 1%
的机会错误,即有
99%
以上的把握认为“爱好这项运动与性别有
关”.同时,在犯错误的概率不超过
的前提下,认为“爱好该项运动与性别有关”.
答案: C 解析: 由题意
K 2 = 7.8 > 6.635 ,有 0.01 = 1% 的机会错误,即有 99% 以上的把握认为“爱好这项运 动与性别有关”.同时,在犯错误的概率不超过 1% 的前提下,认为“爱好该项运动与性别有关”;
高考不提分,赔付1万元,关注快乐学了解详情。
≈ 7.8
附表:
P (K 2 ⩾ k) k 0.050 3.841 0.010 6.635 0.001 10.828
参照附表,得到的正确结论是( A.在犯错误的概率不超过 B.在犯错误的概率不超过 C.有 D.有 解:C 由题意
K 2 = 7.8 > 6.635 ,有 99% 99% 0.1% 0.1%
答案: A
B.①③
C.②③
D.①②③
3. 分类变量 X 和 Y 的列联表如下:
则下列说法中正确的是 (
人教课标版高中数学选修1-2知识梳理:统计案例知识梳理

统计案例知识梳理一、知识结构图:二、要点回顾:1.2×2列联表.2.独立性检验与相关性检验(见下表).含义所用统计量步骤相同点不同点独立性检验2χ都是统计学中的常用方法,且步骤相似,思想一致所用的统计量不同,临界值不同相关性检验r三、关键信息强化:1.独立性检验的两个重要工具是:2χ统计量和临界值,只有准确计算2χ(熟记计算公式),熟记各临界值及统计决断的原则,才能正确地处理独立性检验的问题.2.线性回归方程y bx a=+中回归系数b和回归截距a的意义:b的意义:x每增加(或减少)一个单位,y平均改变b个单位.a的意义:y不受x变化影响的部分.3.由线性回归方程中a b,的计算公式a y bx=-知:回归直线y bx a=+必过点()x y,.4.做回归分析要有实际意义,而如何才能知道有无实际意义呢?———相关性检验.5.相关系数r和临界值0.05r是正确进行相关性检验的两大重要因素.要明确相关系数r的大小与相关程度的关系(即r的性质),并要会根据公式r的查法要熟练掌握.计算或利用计算器计算.另外0.056.相关性检验就是检验r与r的大小关系.0.05四、特别警示:1.分析两个变量相关关系的常用方法:(1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线的附近,那么就说这两个变量之间具有线性相关关系.r≤而且r越接近于1,相关程度越强;(2)利用相关系数r进行判断:1r越接近于0,相关程度越弱.2.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求线性回归方程.3.在实际问题中,经常会面临需要推断的问题,在作推断时,我们不能仅凭主观意愿作出结论,而是需要通过试验来收集数据,并根据独立性检验的原理做出合理的推断.4.统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误.好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据,整理分析数据得出的结论是“吸烟与患肺癌有关”,而且这个结论犯错误的概率在0.01以下,实际上,这是统计思维与确定性思维差异的反应,这是数学问题,不一定在实际中得到验证.五、应用举例:例1考察人的高血压是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:有多大把握认为高血压病与食盐摄入量有关? 解:由公式得22(34135326220)163380.154910.8286015732541379χ⨯-⨯⨯=≈>⨯⨯⨯, ∴有99.9%的把握说高血压病与食盐摄入量有关.例2 对某种产品进行一项腐蚀加工试验,得到腐蚀时间x (s )和腐蚀深度y (m μ)数据如下:(1)进行相关性检验;(2)如果x 与y 之间具有线性相关关系,求出线性回归方程,并预测当腐蚀时间为75s 时,腐蚀深度为多少m μ? 解:(1)计算得0.050.98360.632r r =>=, 则x 与y 具有线性相关关系. (2)求得 4.93a =,0.32b =, ∴线性回归方程为0.32 4.93y x =+,当腐蚀时间为75s 时,将75x =代入得29y ≈, ∴腐蚀深度约为29m μ.。
高中数学 第一章 统计案例本章知识体系课件 北师大版选修1-2

【规律方法】 对于条件概率的计算,首先要作出准 确判断是否为条件概率,具体计算时,通常设出事件 A 和 B,要理解 A 和 B 所表示的含义,然后代入条件概率计算公 式.
设两个独立事件 A 和 B 都不发生的概率为19,A 发生 B 不发生的概率与 B 发生 A 不发生的概率相同,则 A 发生的 前提下,B 发生的概率是多少?
【解析】 由已知 P( A B )=19,P(A B )=P(B A ), 即 P(A)P( B )=P(B)P( A ), 即 P(A)[1-P(B)]=P(B)[1-P(A)], ∴P(A)-P(A)P(B)=P(B)-P(A)P(B). ∴P(A)=P(B). ∴P( A )=P( B )=13.
某地最近十年粮食需求量逐年上升,下表是部分统计
数据:
年份
2002 2004 2006 2008 2010
需求量(万吨) 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方
程 y=bx+a;
(2)利用(1)中所求的直线方程预测该地 2012 年的粮食
需求量.
【解析】 由所给数据看出,年需求量与年份之间近 似直线上升,下面来求回归直线方程,为此对数据预处理 如下:
∴P(A)=23,P(B)=23,P(AB)=P(A)P(B)=49.
4 ∴P(B|A)=PPAAB=92=23.
3
独立性检验
两个变量之间是否有关联,可通过 2×2 列联表用公 式 χ2=a+bcn+add-ab+cc2b+d计算,与临界值比较判断 两个变量之间的关联程度,χ2 越大,两个变量关联程度 越大.当 χ2≤2.706 时认为两个变量无关联;当 χ2>2.706 时有 90%的把握认为两个变量有关联;当 χ2>3.841 时就 有 95%的把握认为两变量有关联;当 χ2>6.635 时就有 99%的把握认为两个变量有关联.
【教育课件】苏教版选修1-2高中数学第1章《统计案例》ppt复习课件.ppt

解 (1)散点图如图:
5
(2)由已知可得 x =5, y =50,x2i =145,
i=1 5
xiyi=1 380,
i=1
5
xiyi-5 x y
i=1
则b^ =
5
x2i -5 x 2
i=1
=1 318405--55××55×2 50=6.5,a^= y -b^ x =50-6.5×5=17.5,于是所
本章归纳整合
知识网络
要点归纳
1.独立性检验
(1)给出2×2列联表时,直接利用公式,查表判断;若没有给出2×2列联表, 应先根据样本数据列出2×2列联表,再利用公式进行计算并判断,一般要 求2×2列联表中的a、b、c、d的值均不小于5.
(2)在独立性检验中,两个变量是否有关,在多大程度上有关,是一种统计 关系,不能认为是因果关系.由于抽样的随机性,用χ2进行独立性检验时, 样本容量n越大,估计越准确.
^
^
a= y -b x =20.771-12.541×0.543≈13.961,
∴电阻 y 关于含碳量 x 之间的线性回归方程是
^
y=12.541x+13.961.
单击此处进入 解读高考
2005年11月7日7时33分
网络构建
专题归纳
解读高考
10
50
80
试说明:在这三种心理障碍中哪一种与性别关系最大?
总 计 25
20
65
110
解 对于三种心理障碍分别有 χ21,χ22与 χ23,则由表中数据可得: χ21=110×30×5×806×0-252×5×85202≈0.863; χ22=110×30×108×0×702-0×209×0 102≈6.366; χ23=110×30×158×0×306-5×154×5 502≈1.410. 所以没有充分的理由认为焦虑与性别有关,有 95%的把握认为说 谎与性别有关,没有充分的理由说明懒惰与性别有关.
高二数学选修1-2第一章统计案例复习(2013北师大版)精选教学PPT课件

∴r=
14
∑i=1xiyi-14 x y ∑i1=41x2i -14 x 2 ∑i1=41yi2-14 y 2
= 227.51×4369.5075.05≈0.999 7.
因此,年龄和身高之间具有较强的线性相关关系.
BS ·数学 选修1-2
14
(2)由(1)得b=∑ i=114xiyi-14 x ∑ i=1x2i -14 x
BS ·数学 选修1-2
BS ·数学 选修1-2
BS ·数学 选修1-2
对所抽取的样本数据进行分析,分析两个变量之间的关 系——线性关系或非线性关系,并由一个变量的变化去推测 另一个变量的变化,这就是对样本进行回归分析.回归分析 的过程就是建立回归模型的过程,具体步骤是:
BS ·数学 选修1-2
感谢伤痛,让我学会了坚忍,也练就了我释怀生命之起落的本能; 感谢生活,让我在漫长岁月的季节里拈起生命的美丽;
感谢有你,尽管远隔千里,可你寒冬里也给我温暖的心怀; 感谢关怀,生命因你而多了充实与清新;
感谢所有的一切~ ~ ~ ~ ~ ~ 感谢我身边每一位好友,为你祝福,为的敲起祈祷钟!伴你走过每一天。他是一个劫匪,坐过牢,之后又杀了人,穷途末路之际他又去抢银行。 是一个很小的储蓄所。抢劫遇到了从来没有过的不顺利,两个女子拼命反抗,他把其中一个杀了,另一个被劫持上了车。因为有人报了警,警车越来越近了,他劫持着这个女子狂逃,把车都开飞了,撞了很多人,轧了很多小摊。 这个刚刚21岁的女孩子才参加工作,为了这份工作,她拼命读书,毕业后又托了很多人,没钱送礼,是她哥卖了血供她上学为她送礼,她父母双亡,只有这一个哥哥。
是否左利手
不是左 合
左利手
性别
利手 计
女士
10
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 统计案例
一、回归分析的基本思想及其初步应用
1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。
变量间的这种相互关系,称为具有不确定性的相关关系.
(1)按方向分类
①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。
②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。
正相关 负相关 不相关
(2)相关性系数r (在《必修3》中有介绍)
用相关系数r 来衡量两个变量之间的相关关系
()()
()()
1
2
2
1
1
n
i
i
i n n
i
i
i i x x
y y r x x y y ===--=
--∑∑∑
2、两变量之间的关系存在两种不同的类型
(1)相关关系——非确定性关系 (2)函数关系——确定性关系
3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
其基本步骤是:①画出两个变量的散点图; ②求回归直线方程;
③并用回归直线方程进行预报。
4、回归直线方程:∧
∧∧+=a x b y
⎪⎪
⎪⎩
⎪⎪⎪⎨⎧
-=--=---=∧∧====∧∑∑∑∑x b y a x n x y
x n y x x x y y x x b n i i n
i i i n
i i n i i i ,)())((1
221121
()()()10.00,2,.
b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系.
称为样本点的中心,回归直线必定经过样本点的中心
例如:
,.i y bx a e a b e e y y
=++=-4、线性回归模型用来表示其中和为模型的未知参数,称为随机误差 残差:
5、相关指数2R 是用来刻画回归效果的,
2R 越大,残差平方和越小,模型的拟合效果就越好。
二、独立性检验的基本思想及其初步应用
1、列联表
假设有两个分类变量X 和Y ,它们的值域分另为{x 1, x 2}和{y 1, y 2},其样本频数列联表为: y 1 y 2 总计 x 1 a b a+b x 2
c
d
c+d 总计 a+c
b+d
a+b+c+d
()()
2
21
2
11n
i i i n
i
i y y R y y ==-=-
-∑∑
()()()()()
2
2
2=n ad bc K n a b c d a b c d a c b d -=+++++++、随机变量,其中为样本容量.
3、独立性检验
(1)利用随机变量2
K 来判断“两个分类变量有关系”的方法称为独立性检验,并且能较精确地给出这种判断的可靠程度。
(2)具体的做法是,由表中的数据算出随机变量K 2的值。
K 2的值越大,说明“X 与Y 有关系”成立的可能性越大。
下表k 是观测值,概率P 为犯错误的概率。
2()P K k ≥ 0.50
0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
例如:
4、利用列联表直接计算发现 和 相差很大,就判断两个分类变量之间有关系。
a a
b +
c c d
+。