高中数学(北师大版)选修1-2精品学案:第一章 统计案例 章末小结

合集下载

数学北师大版高中选修1-2选修1-2第一章 统计案例 §1.1.1回归分析导学案

数学北师大版高中选修1-2选修1-2第一章  统计案例   §1.1.1回归分析导学案

word 格式整理参考资料 学习帮手 第一章 统计案例§1.1.1回归分析预习案【学习目标】1. 理解并掌握用回归分析处理两个变量之间的不确定关系的统计方法。

2. 了解回归分析的意义。

3. 以极度的热情,自动自发、如痴如醉,投入到学习中,充分享受学习的快乐。

【使用说明与学法指导】1. 课前(前一天晚自习)自学课本并完成导学案,要求限时完成,书写规范;2. 带“★”的C 层可以选做,带“★★”的B,C 层可以选做.3. 自主探究先行一步,遇到难以理解的地方先做好标记,然后再通过小组讨论解决,如果小组不能解决的问题第二天在课堂上讨论解决。

一、预习自学: 基础知识梳理 问题导引知识点一:两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。

知识点二:线性回归方程1.求线性回归直线方程的步骤:(1) 作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,来判断两个量是否具有线性相关关系;(2) 求回归系数a ,b ,其中∑∑∑∑====--=---=n i i n i i i n i i n i i i xn x y x n y x x xy y x x b 121121)())((,x b y a -= (3) 写出回归直线方程a bx y +=,并用回归直线方程进行预测。

2. 回归直线a bx y +=过点),(y x ,这个点称为样本的中心.【预习自测】(大约10分钟,包括预习自学)1. 设有一个回归方程为22.5y x ∧=-,当变量x 增加一个单位时,( ) A 、y 平均增加2.5个单位 B 、y 平均增加2个单位C 、y 平均减少2.5个单位D 、y 平均减少2个单位2. 在一次试验中,测得),(y x 的四组数据值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为 ( ) A.1+=x y B.2+=x y C.12+=x y D.1-=x y3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 一定平行B. 1l 与2l 相交于点),(y xC.1l 与2l 重合D. 无法判断1l 和2l 是否相交【我的疑惑】(将在预习中不能理解的问题写下来,供课堂上处理)1.2.3.。

北师大选修(1-2)第一章《统计案例》word教案

北师大选修(1-2)第一章《统计案例》word教案

选修1-2 第一章 统计案例[课标研读][课标要求]了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)假设检验:了解假设检验的基本思想、方法及其简单应用. (3)聚类分析:了解聚类分析的基本思想、方法及其简单应用. (4)回归分析:了解回归的基本思想、方法及其简单应用.[命题展望]本章所涉及到的知识点均要进行大量的数据计算,而这些计算如果仅仅靠笔算往往是比较困难的,需要借助于计算机或计算器。

其实在新课标中提到“……应鼓励学生使用计算器、计算机等现代技术手段来处理数据……”,而我们目前的高考还不允许使用计算器,所以本章的更看重统计思想。

考虑到本章内容是新增内容,在高考中应该有所体现,但在高考试题中不会出现过于繁琐的计算题,相信会出现一道填空试题或填空题,出现解答题的可能性较小,即使出现,所涉及的计算应该不会很繁琐。

本章的疑点是用这种方法检验可靠吗?实际上这种方法仍然是用样本估计总体,由于抽样的随机性,结果并不唯一,所以用部分推断全体,推断可能正确,也有可能错误。

但我们只要科学合理地去抽样,那么犯错误的可能性就很小了。

如卡方检验中,若26.635χ>,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。

第一讲 回归分析的基本思想及其初步应用[知识梳理][知识盘点]1.相关关系是一种非确定的关系, 是对具有相关关系的两个变量进行统计分析的一种方法。

2.线性回是模型y bx a e =++(e 为 ),因变量y 的值是自变量x 和随机误差e 共同确定的,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为 ,因变量y 称为 。

3.模型中的参数a 和b 用 估计,其计算公式如下:121()()ˆ()niii nii x x y y bx x ==--=-∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,1nii y y ==∑(,)x y称为,回归直线一定经过样本中心点。

数学北师大版高中选修1-2北师大版数学选修1-2 第一章 统计案例 §1回归分析

数学北师大版高中选修1-2北师大版数学选修1-2     第一章  统计案例 §1回归分析

庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。

2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。

3、情感态度与价值观:(1)进一步树立数形结合的思想。

(2)进一步体会构建模型的作用。

教学重点:散点图的画法,回归直线方程的求解方法。

教学难点:回归直线方程的求解方法。

使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。

2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。

3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。

(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。

假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。

2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。

为了简化表示,我们引进求和符号,记作 。

3、1()n ii x x =-=∑ 。

1()ni i y y =-=∑ 。

4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。

高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第2课时 回归分析的应用

高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第2课时 回归分析的应用

第2课时回归分析的应用1.根据线性回归方程,对相关结论进行预测.2.理解从散点图进行非线性回归分析的意义,掌握如何将非线性回归问题转化为线性回归问题的方法.3.了解在解决实际问题的过程中寻找更好的模型的方法.重点:根据线性回归方程,对相关结论进行预测,探究非线性模型通过变换转化为线性回归模型的方法.难点:了解常用函数的图像特点,选择不同的模型建模,并通过相关指数对不同的模型进行比较.有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?要回答这个问题,我们先来一起学习本节的知识吧!问题1:相关系数的概念及相关系数r的性质相关系数r用来描述线性相关关系的强弱,且样本相关系数r===.r有如下性质:(1)|r|≤1;(2)|r|越接近于1,误差Q越小,x,y的线性相关程度越强;(3)|r|越接近于0,误差Q越大,x,y的线性相关程度越弱;(4)当r>0时,称两个变量正相关;当r<0时,称两个变量负相关;当r=0时,称两个变量线性不相关.问题2:在回归分析中,通过模型计算预测变量的值时,应注意的问题.(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预测值就是预测变量的精确值.问题3:几种能转化为线性回归模型的非线性回归模型(1)幂函数曲线y=ax b作变换u=ln y,v=ln x,c=ln a,得线性函数u=c+bv.(2)指数曲线y=a e bx作变换u=ln y,c=ln a,得线性函数u=c+bx.(3)倒指数曲线y=a作变换u=ln y,c=ln a,v=,得线性函数u=c+bv.(4)对数曲线y=a+b ln x作变换u=y,v=ln x,得线性函数u=a+bv.问题4:非线性回归问题进行回归分析的方法(1)若问题中已给出经验公式,这时可以将解释变量进行交换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量交换,将问题化为线性回归分析问题来解决.从以下几个方面认识相关关系:(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以使我们处理更为广泛的数学应用问题,还可以使我们对函数关系的认识上升到一个新的高度.一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预测、资料补充等方面有着广泛的应用.1.下列两个变量之间的关系不是函数关系的是().A.角度和它的余弦值B.正方形的边长和面积C.正n边形的边数和各内角度数之和D.人的年龄和身高【解析】函数关系就是一种变量之间的确定性的关系,A,B,C三项都是函数关系,它们的函数表达式分别为f(θ)=cos θ,g(a)=a2,h(n)=nπ-2π.D项不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.【答案】D2.为了表示n个点与相应直线在整体上接近程度,我们常用()表示.A.(y i-y)B.(y i-)C.(y i-y)2D.(y i-)2【解析】由回归直线方程y=a+bx,可知y为一个量的估计量,而y i为它的实际值,在最小二乘法中[y i-(a+bx)]2,即(y i-y)2,故选C.【答案】C3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为.【解析】因为A,B,C,D四点都在直线y=x+1上,故填y=x+1.【答案】y=x+14.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)估计最小的船的船员数和最大的船的船员数.【解析】(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,即船员平均相差6人.(2)9.1+0.006×192=10.252,估计最小的船的船员数为10.9.1+0.006×3246=28.576,估计最大的船的船员数为28.利用公式,确定回归直线方程某5名学生的数学和化学成绩如下表:学生A B C D E学科数学成绩(x)8876736663化学成绩(y)7865716461(1)画出散点图;(2)求化学成绩(y)对数学成绩(x)的回归直线方程.【方法指导】熟记公式,根据表格计算公式中所需的各种数据.【解析】(1)散点图(略).(2)=73.2,=67.8,x i y i=25054,=27174,所以b==≈0.625.a=-b=67.8-0.625×73.2=22.05.所以y对x的回归直线方程为y=0.625x+22.05.【小结】利用公式求解时应注意以下几点:①求b时应先求出,,x i y i,,再由a=-b求a的值,并写出回归直线方程.②线性回归方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预测结果的偏差.③回归直线方程y=a+bx中的b表示x增加1个单位时y的变化量为b,而a是不随x的变化而变化的量.④可以利用回归直线方程y=a+bx预测在x取某一个值时,y的估计值.根据回归直线方程,对结果进行分析或预测从某大学中随机选取8 名女大学生,其身高和体重数据如下表:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预测体重的回归方程,并预测一名身高为172 cm 的女大学生的体重.【方法指导】可以计算出r≈0.798.这表明体重与身高有较强的线性相关关系,从而可以建立身高和体重的线性回归方程,根据身高和体重的线性回归方程,由身高预测体重.【解析】由于问题中要求根据身高预测体重,因此选取身高为自变量x,体重为因变量y.作出散点图(如图).从图中可以看出,样本点呈条状分布,身高和体重有较强的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系,根据公式,可以得到b≈0.848,a≈-85.712.于是得到回归方程y=0.848x-85.712.因此,对于身高172 cm 的女大学生,由回归方程可以预测其体重为y=0.848×172-85.712=60.144 kg.【小结】解析中b=0.848是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.848 kg,这表明体重与身高具有正的线性相关关系.尽管身高172 cm的女大学生的体重不一定是60.144 kg,但一般可以认为她的体重接近60.144 kg.可线性化的非线性回归问题一只红铃虫的产卵数y和温度x之间的7组观测数据列于下表:温度x/℃21232527293235产卵数y/个711212466115325试建立y与x之间的回归方程,并预测温度为28 ℃时产卵数目.【方法指导】作出散点图(或根据已知的散点图)分析欲采用较为恰当的拟合曲线,用换元法转化成线性关系再进行回归分析.【解析】选择变量,画散点图.在散点图中,根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=c1的周围,其中c1和c2是待定参数.即问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围.这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了.由已知表的数据可以得到变换后的样本数据表(下表):x21232527293235z1.9463.3983.0453.1784.1904.7455.784下图给出了表中数据的散点图.从图中可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中的数据得到线性回归方程z=0.242x-2.884.相关系数r≈0.953.因此红铃虫的产卵数对温度的非线性回归方程为y=e0.242x-2.884.当x=28 ℃时,y ≈49.预测当气温为28 ℃时,产卵数为49个.综上所述,在本题中指数函数模型比一元线性模型、二次函数模型有更好的拟合效果.【小结】对于给定的样本点(x1,y1),(x2,y2),…,(x n,y n),其中a和b都是未知参数.应先根据散点图或利用相关系数r判断两变量间是否存在线性相关关系,若两变量线性相关性显著,采用例1的方法进行线性回归分析;若两变量线性相关性不显著,则可采用例2的方法和步骤进行拟合效果分析.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s)5101520304050607090120深度y(μm)610101316171923252946试求腐蚀深度y对时间t的回归直线方程.【解析】经计算可得相关系数r≈0.982,所以可以认为y与t之间有较强的线性相关关系.≈46.36,≈19.45,=36750,=5422,t i y i=13910.b==≈0.3.a=-b=19.45-0.3×46.36≈5.542.故所求的回归直线方程为y=0.3t+5.542.一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).(1)假定y与x之间有线性相关关系,求y对x的回归直线方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)【解析】(1)设回归直线方程为y=bx+a,=12.5,=8.25,=660,x i y i=438.于是b===,a=-b=8.25-×12.5=-×=-.故所求的回归直线方程为y=x-.(2)由y=x-≤10,得x≤≈15,即机器速度不得超过15转/秒.为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数x作解释变量,繁殖个数y作预测变量,作出这些数据的散点图;(2)建立解释变量x与预测变量y之间的回归方程.【解析】(1)所作散点图如图所示.(2)由散点图看出样本点分析在一条指数函数y=c1的周围,于是令z=ln y,则x、z数据如下表格,x123456z1.792.483.223.894.555.25由计算器得z=0.69x+1.112,r≈0.9999,则有y=e0.69x+1.112.1.给定x与y的一组样本数据,求得相关系数r=-0.990,则().A.y与x不相关B.y与x非线性相关C.y与x正相关D.y与x负相关【解析】因为r<0,故选D.【答案】D2.下列两个变量之间的关系不是函数关系的是().A.角度和它的正切值B.人的右手一柞长和身高C.正方体的棱长和表面积D.真空中自由落体运动物体的下落距离和下落时间【解析】由正切函数y=tan x知A是函数关系;人的右手一柞长和身高不是确定的关系,故B不是函数关系;设正方体的棱长为a,则它的表面积S=6a2,C是函数关系;由物理知识知,自由落体运动物体的下落距离h和下落时间t满足h=gt2(t>0),D是函数关系.【答案】B3.已知回归直线的方程为y=2-2.5x,则当x=25时,y的估计值是.【解析】将x=25代入方程得y=2-2.5×25=-60.5.【答案】-60.54.某市统计1994~2019年在校中学生每年高考考入大学的百分比,把农村、县镇、城市分开统计,为了便于计算,把1994年编号为0,1995年编号为1,…,2019年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线,城市:y=9.50+2.54x;县镇:y=6.76+2.32x;农村:y=1.80+0.42x.(1)对于农村学生来讲,系数等于0.42意味着什么?(2)在这一阶段,哪里的大学入学率增长最快?【解析】(1)对于农村学生来讲,系数等于0.42意味着1994~2019年在校中学生每年高考考入大学的百分比逐年增加0.42.(2)在这一阶段,城市的大学入学率增长最快.(2019年·山东卷)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预测广告费用为6万元时销售额为().A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】由表可计算==,==42,因为点(,42)在回归直线y=bx+a上,且b为9.4,所以42=9.4×+a,解得a=9.1,故回归方程为y=9.4x+9.1,将x=6代入方程得y=65.5,选B.【答案】B1.观察两个变量(存在线性相关关系)的数据如下:x-10-6.99-5.01-2.983.9857.998.01y-9-7-5-34.014.9978则两变量间的线性回归方程为().A.y=x+1B.y=xC.y=2x+D.y=x+1【解析】由于线性回归方程一定经过样本点的中心(,),所以本题只需求出,,然后代入所给选项进行检验,即可得到答案.由表中数据可得=0,=0,只有B项中的方程过点(0,0),故选B.【答案】B2.在以下四个散点图中(如图所示),适用于作线性回归的散点图为().A.①②B.①③C.②③D.③④【解析】①表示正相关,③表示负相关.【答案】B3.若线性回归方程y=a+bx中,b=0,则相关系数r=.【解析】由b==0,得(x i-)(y i-)=0,所以r==0.【答案】04.某种产品的广告费用支出x(万元)与销售额y(万元)之间有如下的对应数据:x(万元)24568y(万元)3040605070(1)求相关系数和回归直线方程;(2)据此预测广告费用支出为10万元时销售收入y的值.【解析】(1)=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,=22+42+52+62+82=145,=302+402+602+502+702=13500 ,x i y i=1380,r=≈0.919,即两变量间有很强的线性相关关系.b==6.5,a=-b=50-6.5×5=17.5,故回归直线方程为y=6.5x+17.5.(2)当x=10时,预测y的值为y=10×6.5+17.5=82.5.5.已知对一组观测值(x i,y i)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为().A.y=0.51x+6.65B.y=6.65x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【解析】y=bx+a过点(,),∴a=-b=38.14-0.51×61.75≈6.65,∴y=0.51x+6.65.【答案】A6.炼钢时钢水的含碳量与冶炼时间是().A.确定性关系B.相关关系C.函数关系D.无任何关系【解析】解答本题的关键是弄清相关关系的定义及相关关系与函数关系的区别.【答案】B7.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的线性相关关系,现取8组观测值,计算得x i=52,y i=228,=478,x i y i=1849,则y与x的回归直线方程是.(精确到小数点后两位数)【解析】根据给出的数据可先求=x i=6.5,=y i=28.5,然后代入公式b==≈2.62,从而a=-bx=28.5-2.62×6.5=11.47,所以回归直线方程y=11.47+2.62x.【答案】y=11.47+2.62x8.在彩电显影中,由经验可知形成染料光学密度y与析出银的光学密度x的公式为y=A(b<0),现测得试验数据如下:x i0.050.060.250.310.070.100.380.430.140.200.47y i0.100.141.001.120.230.371.191.250.590.791.29试求y对x的回归方程.【解析】由题意知,对于给定的公式y=A(b<0)两边取自然对数,得ln y=ln A+.与线性回归方程相对照可以看出,只要令u=,v=ln y,a=ln A,就有v=a+bu.这是v对u的线性回归方程,对此再套用相关系数公式,求回归系数a和b.题目中所给的数据由变量置换u=,v=ln y,变为如下所示的数据:u i20.00016.6674.0003.22614.28610.000v i-2.303-1.96600.113-1.470-0.994u i2.6322.3267.1435.0002.128v i0.1740.223-0.528-0.2360.255可以求出|r|≈0.998.可知u与v具有很强的线性相关关系.再求出b≈-0.146,a≈0.548,所以v=0.548-0.146u,把u和v置换回来,得ln y=0.548-,所以y==e0.548·≈1.73,所以y对x的回归方程为y=1.73.9.一唱片公司预测支出费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10千张,得到如下的资料:x i=28,=303.4,y i=75,=598.5,x i y i=237,则y与x的相关系数r 的绝对值为.【解析】根据公式,得相关系数r===0.3,所以|r|=0.3.【答案】0.310.测得某国10对父子身高(单位:英寸)如下:父亲身高(x)60626465666768707274儿子身高(y)63.665.26665.566.967.167.468.370.170(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求回归方程;(3)如果父亲的身高为73英寸,估计儿子的身高.【解析】(1)=66.8,=67.01,=4462.24,=44974,=4490.3401,=44941.93,x i y i=44842.4,r===≈0.98,所以y与x之间具有很强的线性相关关系.(2)设回归方程为y=bx+a.由b===≈0.4646,a=-b=67.01-0.4646×66.8≈35.97.故所求的回归方程为y=0.4646x+35.97.(3)当x=73时,y=0.4646×73+35.97≈69.9,所以当父亲的身高为73英寸时,估计儿子的身高为69.9英寸.。

2018年高三数学(北师大版)选修1-2精品学案:第一章 统计案例 章末小结

2018年高三数学(北师大版)选修1-2精品学案:第一章 统计案例 章末小结

第一章章末小结1.回归分析(1)回归分析步骤:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预测.(2)线性回归模型:y=bx+a,其中= x i,= y i,2.相关系数样本相关系数:对于变量y与x的一组观测值,把r==叫作变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度,|r|≤1.当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.|r|越接近1,相关程度越大;|r|越接近0,相关程度越小.3.条件概率与相互独立事件(1)条件概率的定义设A,B为两个事件,且P(A)>0,称P(B|A)= 为在事件A发生的条件下,事件B发生的条件概率.(2)条件概率相关性质①0≤P(B|A)≤1.②若P(B)≠0,则P(AB)=P(B)P(A|B);若P(A)≠0,则P(AB)=P(A)P(B|A).(3)相互独立事件的定义设A,B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立.事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫作相互独立事件.(4)相互独立事件的性质如果事件A与B相互独立,那么A与,与B,与也都是相互独立的.(5)如果一系列的事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1·A2·…·A n)=P(A1)·P(A2)·…·P(A n).4.χ2的计算公式及其特点(1)根据2×2列联表与构造的随机变量χ2= (其中n=a+b+c+d是样本容量)来计算χ2的值.(2)当数据量较大时,统计学中已有明确的结论,随机事件χ2≥x0发生的概率如下:当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;当χ2>2.706时,有90%的把握判定变量A、B有关联;当χ2>3.841时,有95%的把握判定变量A、B有关联;当χ2>6.635时,有99%的把握判定变量A、B有关联.由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误.利用χ2进行独立性检验,可以对推断正确的概率做出估计,样本容量n越大,估计越准确.题型1:线性回归方程已知关于某设备的使用年数x和支出的维修费用y(万元),由资料统计得5组数据(x i,y i)(i=1,2,3,4,5),由资料知y与x线性相关,并且由统计的五组数据得平均值分别为=4,=5.4,若用5组数据得到的线性回归方程y=bx+a去估计使用8年的维修费用比使用7年的维修费用多1.1万元.(1)求回归直线方程;(2)估计使用年数为10年时,维修费用约是多少.【解析】(1)因为直线y=bx+a经过定点(,),又=4,=5.4,所以5.4=4b+a,又8b+a-(7b+a)=1.1,解得b=1.1,a=1,所以回归方程为y=1.1x+1.(2)将x=10代入线性回归方程得y=12.所以,估计使用年数为10年时,维修费用约是12万元.【小结】回归方程一定过中心点(,).本题运用方程的思想,采用待定系数法求解.线性回归方程类似于一次函数的解析式,故有问题可类比一次函数,将问题转化为求函数值.题型2:线性回归模型问题一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,:(1)求变量y与x的相关系数,并对其相关性做出判断;(2)如果y与x有线性相关关系,求回归直线方程;(3)若在实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?【方法指导】(((【解析】(1)=12.5,=8.25,x i y i=438,4 =412.5,=660,=291,所以r===≈≈0.9954.所以y与x有很强的线性相关关系.(2)由(1)可求得b=0.7286,a=-0.8571,所以y=0.7286x-0.8571.(3)要使y≤10,得0.7286x-0.8571≤10,所以x≤14.901.所以机器的转速应控制在14.901转/秒以下.【小结】若能从散点图直观地判断相关关系,就利用散点图进行判断;若散点图不明显时,我们就要根据相关系数r进行判断.在求回归直线方程时学会合理进行运算很关键,为准确运算,可先列表求出相关数据,然后求解.题型3:非线性相关问题:检测每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系.如有,求出y对x的回归方程.【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再代回u=,就得到了y对x的回归曲线方程.【解析】首先作变量置换u=,题目所给数据变成如下表所示的10对数据:经计算得r=0.9998,从而认为u与y之间具有线性相关关系,由公式得a=1.125,b=8.973,所以y=1.125+8.973u.最后代入u=,可得y=1.125+.【小结】在某些情况下可以借助于线性回归模型,研究呈现非线性相关关系的两个变量之间的关系,分析哪个模型拟合效果更好.题型4:相互独立事件的概率甲、乙两人都进行一次射击,如果两人击中目标的概率都是0.8,两人之间相互没有影响.计算:(1)两人都击中目标的概率;(2)恰有一人击中目标的概率;(3)至少有一人击中目标的概率.(2(3【解析】设“甲击中目标”记为事件A,“乙击中目标”记为事件B,A与B相互独立.(1)两人各射击一次都击中目标即为事件AB,由事件A与B相互独立,得P(AB)=P(A)P(B)=0.8×0.8=0.64;(2)P(A+B)=P(A)+P(B)=P(A)P()+P()·P(B)=0.8×0.2+0.2×0.8=0.32;(3)P()=P()P()=(1-P(A))·(1-P(B))=(1-0.8)×(1-0.8)=0.04,1-P()=1-0.04=0.96.【小结】把一个复杂的事件拆分成几个互斥或者相互独立的事件,是解决较为复杂概率问题的根本方法.题型5:独立性检验模型为了考察某种药物预防疾病的效果,任选105只动物做试验,其中55只服用此种药,50只未服用此种药,之后发现服药的55只中有10只患病,未服药的50只动物中有20只患病,请判断此种药物是否有效.根据公式:χ2=≈6.1>3.841.所以我们有95%以上的把握判断该药物有效.【小结】在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论可能犯错误,这是数学中的统计思维与确定性思维的不同之处,但我们可以利用统计分析的结果去预测实际问题的结果.用独立性检验的方法准确地判断两个变量的关联性,但要注意其一般步骤及准确计算.1.(2014年·湖北卷)得到的回归方程为=bx+a,则().A.a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<0【解析】作出散点图如下:观察图像可知,回归直线=bx+a的斜率b<0,当x=0时,y=a>0.故a>0,b<0.【答案】B2.(2014年·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是().表1表2表3表4A.成绩B.视力C.智商D.阅读量【解析】A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.∵<<<,∴与性别有关联的可能性最大的变量是阅读量.【答案】D一、选择题1.设某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着().A.高度相关B.中度相关C.弱度相关D.极弱相关【答案】A2.设有回归直线方程y=2-1.5x,当变量x增加1个单位时().A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位【解析】设变量x增加1个单位后y变为y',则y'=2-1.5(x+1)=2-1.5x-1.5=y-1.5.【答案】C3.已知对一组观测值(x i,y i)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为().A.y=0.51x+6.6475B.y=6.6475x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【答案】A4.若事件M、N相互独立,则下列三个结论:①M与相互独立;②N与相互独立;③与相互独立.其中正确的个数为().A.0B.1C.2D.3【解析】由两个事件相互独立的概念可以判定.【答案】D5.某学校开展研究性学习活动,:对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是().A.y=2x-2B.y=()xC.y=log2xD.y=(x2-1)【解析】将给定的点代入比较即可.【答案】D6.下面是一个2×2列联表:则表中a+b+c+d等于().A.125B.128C.133D.147【解析】∵a+21=73,∴a=52,又由b+46=73+27,知b=54.∵c+d=27,∴a+b+c+d=133.【答案】C7.在研究变量x和y的线性相关性时,甲、乙二人分别做了研究,利用最小二乘法得到线性回归方程l1和l2,两人计算的相同,也相同,下列说法正确的是().A.l1与l2重合B.l1与l2一定平行C.l1与l2相交于点(,)D.无法判断l1和l2是否相交【解析】回归直线方程过点(,).【答案】C8.设有一个回归方程y=3-3.5x,若变量x增加一个单位,则().A.y平均增加3.5个单位B.y平均增加3个单位C.y平均减少3.5个单位D.y平均减少3个单位【解析】x的系数为-3.5,所以减少.【答案】C9.某市通过随机询问100,得到如下的2×2列联表:得到的正确结论是().A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【解析】χ2=≈3.030,因为χ2>2.706,所以说有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.【答案】C10.某道路的A、B、C三处都设有交通灯,这三盏灯在一分钟内开放绿灯的时间分别为25秒、35秒、45秒,某辆车在这条路上行驶时,三处都不停车的概率是().A.B.C.D.【解析】××=.【答案】A二、填空题11.有下列关系:(1)人的年龄与他(她)的身高之间的关系;(2)圆的体积与半径之间的关系;(3)直线上的点与该点的坐标之间的关系.其中有相关关系的是(填写你认为正确的序号).【答案】(1)12.从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为.【答案】正相关13.对四对变量y与x进行相关性检验,已知n是观测值的组数,r是相关系数.且已知:(1)n=7,r=0.9533;(2)n=15,r=0.3012;(3)n=17,r=0.4991;(4)n=3,r=0.9950.则变量y与x的线性关系很强的是.【解析】统计学中常用相关系数r来衡量两个变量之间线性关系的强弱,|r|≤1,|r|越接近于1,则y与x的线性关系越强.【答案】(1)(4)14.已知随机事件A的概率P(A)=0.5,事件B的概率P(B)=0.6,事件AB的概率P(AB)=0.4,则条件概率P(B|A)=.【解析】P(B|A)===0.8.【答案】0.815.幂函数曲线y=ax b,作变换u=ln y,v=ln x,c=ln a,得线性函数.【解析】将u=ln y,v=ln x,c=ln a代入y=ax b,消去x、y得u=c+bv.【答案】u=c+bv三、解答题16.因冰雪灾害,某柑橘基地果树严重受损,为此有关专家提出一种拯救果树的方案,该方案需分两年实施且相互独立.该方案预计第一年可以使柑橘产量恢复到灾前的1.0、0.9、0.8的概率分别为0.2、0.4、0.4;第二年可以使柑橘产量为第一年产量的1.5倍、1.25倍、1.0倍的概率分别是0.3、0.3、0.4.(1)求两年后柑橘产量恰好达到灾前产量的概率;(2)求两年后柑橘产量超过灾前产量的概率.【解析】(1)令A表示两年后柑橘产量恰好达到灾前产量这一事件,则P(A)=0.2×0.4+0.4×0.3=0.2.(2)令B表示两年后柑橘产量超过灾前产量这一事件,则P(B)=0.2×0.6+0.4×0.6+0.4×0.3=0.48.17.某工厂积极响应节能减排的号召,经过技术改造后,降低了能源消耗,下表提供了该厂记录的某种产品的产量x(吨):根据相关性检验,这组样本数据具有线性相关关系.(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(2)已知该厂技改前100吨此种产品的生产能耗为90吨.试根据求出的线性回归方程,预测生产100吨此产品的生产能耗比技改前降低多少吨?【解析】(1)==4.5,==3.5,=86,x i y i=66.5,b===0.7,a=-b=3.5-0.7×4.5=0.35.故线性回归方程为y=0.7x+0.35.(2)根据回归方程预测生产100吨产品消耗的能耗约为0.7×100+0.35=70.35.故耗能减少了90-70.35=19.65吨.18.企业为了研究员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,其中积极支持企业改革的调查者中,工作积极的有54人,工作一般的有32人,而不太赞成企业改革的调查者中,工作积极的有40人,工作一般的有63人.(1)根据以上的数据建立一个2×2列联表;(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?【解析】(1)(2)由公式得χ2=≈10.759,因为10.759>6.635,所以有99%以上的把握说抽样员工对待企业改革的态度与工作积极性是有关的,也可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的. 19.(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;(2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量.【解析】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,对预处理后的数据,容易算得=0,=3.2,b==6.5,a=-b=3.2.由上述计算结果,知所求回归直线方程为:y-257=b(x-2010)+a=6.5(x-2010)+3.2,即y=6.5x-12804.8.(2)利用回归直线方程,可预测2016年的粮食需求量约为6.5×(2016-2010)+260.2=6.5×6+260.2=299.2万吨.20.某市工薪阶层关于“延迟退休年龄”的态度进行调查,随机抽调了50人,他们月收入的频数神笛2005神笛2005(1)由以上统计数据填下面2×2列联表并问分析 “月收入以5000为分界点”对“延迟退休年龄”(2)若参加此次调查的人中,有9人为公务员,现在要从这9人中,随机选出2人统计调查结果,其中a 、b 恰为统计局工作人员,求两人至少有1人入选的概率.【解析】(1)2×2χ2=≈6.27>3.841.所以有95%以上的把握认为“月收入以5000为分界点”对“延迟退休年龄”的态度有差异.(2)设9人分别为a ,b ,c ,d ,e ,f ,g ,h ,k ,则选出的2人所有可能的情况为:ab ,ac ,ad ,ae ,af ,ag ,ah ,ak ;bc ,bd ,be ,bf ,bg ,bh ,bk ;cd ,ce ,cf ,cg ,ch ,ck ;de ,df ,dg ,dh ,dk ;ef ,eg ,eh ,ek ;fg ,fh ,fk ;gh ,gk ;hk.共36种,其中a 、b 至少有1人入选的情况有15种,∴a 、b 两人至少有1人入选的概率为P==.21.某种电路开关闭合后,会出现红灯或绿灯闪动.已知开关第一次闭合后,出现红灯和绿灯的概率都是,从开关第二次闭合起,若前一次出现红灯,则下一次出现红灯的概率是,出现绿灯的概率是;若前一次出现绿灯,则下一次出现红灯的概率是,出现绿灯的概率是.(1)第二次闭合后出现红灯的概率是多少?(2)前三次发光中,出现一次红灯、两次绿灯的概率是多少?【解析】(1)概率P 1=P (红红)+P (绿红)=×+×=.(2)概率P 2=P (红绿绿)+P (绿红绿)+P (绿绿红)=××+××+××=.。

高中数学第一章统计案例章末高效整合课件北师大版选修1_2

高中数学第一章统计案例章末高效整合课件北师大版选修1_2

5.独立事件 (1)A,B 相互独立:对两个事件 A,B,如果 P(AB)=P(A)·P(B), 则称 A,B 相互独立.如果 A,B 相互独立,则 A 与 B ,A 与 B, A 与 B 也相互独立. (2)对多个事件,如果 A1,A2,…,An 相互独立,则有 P(A1A2…An)=P(A1)P(A2)…P(An).
1.维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化 度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度 是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去 控制这一指标,为此必须找出它们之间的关系,现安排一批实 验,获得如下数据.
(1)画散点图; (2)求回归方程; (3)求相关系数. 解析: (1)
7.独立性检验的应用 检验两个变量 A、B 的独立性的方法是:列出 A、B 的 2×2 列联表,根据观测数据计算,由公式 χ2= a+ban+adc-bb+cd2 c+d得到 χ2 的值,将该值与提供的参考值 比较做出判断.
热点考点例析
利用散点图判断线性相关
两个变量之间是否具有线性相关关系.可以先根据样本作 出散点图,看看各样本点是否都在一直线附近摆动.若是,则 两变量之间满足线性相关关系.可求出其线性回归方程.
(2)∵P( A )=1-P(A)=1-23=13,
P( A B)=16,
1 ∴P(B| A )=PPAAB=61=12.
3
2.抛掷红、蓝两颗骰子,设事件A为“蓝色骰子的点数为 3或6”,事件B为“两颗骰子的点数之和大于8”.
(1)求P(A),P(B),P(AB); (2)当已知蓝色骰子的点数为3或6时,问两颗骰子的点数之 和大于8的概率为多少?
当|r|接近于1时,表明两个变量的线性相关性越强.当|r|接 近于0时,表明两个变量几乎不存在线性相关关系.

北师大版选修1-2高中数学第1章《统计案例》word章末复习学案

陕西省榆林育才中学高中数学 第1章《统计案例》第一章(无答案)北师大版选修1-2一、选择题1、散点图在回归分析中的作用是 ( )A .查找个体数目B .比较个体数据关系C .探究个体分类D .粗略判断变量是否呈线性关系4、下列说法正确的是 ( )A .任何两个变量都具有相关系B .球的体积与球的半径具有相关关系C .农作物的产量与施肥量是一种确定性关系D .某商品的产量与销售价格之间是非确定性关系5、在画两个变量的散点图时,下面哪个叙述是正确的( )A. 预报变量在x 轴上,解释变量在 y 轴上B. 解释变量在x 轴上,预报变量在 y 轴上C. 可以选择两个变量中任意一个变量在x 轴上D. 可以选择两个变量中任意一个变量在 y 轴上6、回归直线y bx a =+必过 ( )A .(0,0)B .(,0)xC .(0,)yD .(,)x y7、三维柱形图中,主、副对角线上两个柱形高度的 相差越大,要推断的论述成立的可能性就越大 ( )A .和B .差C .积D .商8、两个变量 y 与x 的回归模型中,求得回归方程为0.232x y e -=,当预报变量10x = ( )A. 解释变量30y e -=B. 解释变量y 大于30e -C. 解释变量y 小于30e -D. 解释变量y 在30e -左右9、在回归分析中,求得相关指数20.89R =,则( )A. 解释变量解对总效应的贡献是11%B. 解释变量解对总效应的贡献是89%C. 随机误差的贡献是89%C. 随机误差的贡献是0.89%10、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )A .若k =6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C .若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.D .以上三种说法都不对.11、3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为( )A .回归分析B .独立性检验分析C .残差分析 D. 散点图分析12、在独立性检验时计算的2K 的观测值k =3.99,那么我们有 的把握认为这两个分类变量有关系 ( )A .90%B .95%C .99%D .以上都不对二、填空题13、已知回归直线方程0.50.81y x =-,则25x =时,y 的估计值为 .14、如下表所示:计算2K = . 15、下列关系中: (1)玉米产量与施肥量的关系; (2)等边三角形的边长和周长; (3)电脑的销售量和利润的关系; (4)日光灯的产量和单位生产成本的关系.不是函数关系的是 .16、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的2K =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的.(填“有关”“无关”) 三、解答题18、为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表 33能以97.5%的把握认为药物有效吗?为什么?。

高中数学第一章统计案例章末高效整合课件北师大版选修1_2

令 χ2=a+bcn+add-ab+cc2b+d.当 χ2≤2.706 时,变量 A、 B 是没有关联的;当 χ2>2.706 时,有 90%的把握判定变量 A、B 有关联.当 χ2>3.841 时,有 95%的把握判定变量 A、B 有关联.当 χ2>6.635 时,有 99%的把握判定变量 A、B 有关联.
7.独立性检验的应用 检验两个变量 A、B 的独立性的方法是:列出 A、B 的 2×2 列联表,根据观测数据计算,由公式 χ2= a+ban+adc-bb+cd2 c+d得到 χ2 的值,将该值与提供的参考值 比较做出判断.
i=1
i=1
再由 a= y -b x 求 a 的值,并写出回归直线方程.( x , y ) 称为样本点的中心,回归直线过样本点的中心.
• (4)线性回归方程中的截距a和斜率b都是通过样本估 计而来的,存在着误差,这种误差可能导致预报结 果的偏差.
• (5)回归直线方程y=a+bx中的b表示x增加1个单位时 y的变化量为b,而a表示y不随x的变化而变化的量.
•章 末 高 效 整 合
知能整合提升
1.回归方程 (1)回归方程有两类:一是线性回归方程,即回归直线方程; 二是非线性回归方程. (2)我们把有相关关系(不确定性关系)转化为函数关系(确 定性关系),当两个具有相关关系的变量近似地满足一次函数关 系时,我们所求出的函数关系 y=a+bx 就是回归直线方程.求 回归直线方程的一般方法是利用计算器计算出 b,再由 a= y - b x 求出 a,写出回归直线方程 y=bx+a.
• (6)可以利用回归直线方程y=a+bx预报在x取某一个 值时,y的估计值.
2.线性相关关系强弱的分析与判断 (1)对于随机变量 x 和 y 随机抽到的 n 个数据(x1,y1),(x2, y2),…,(xn,yn).利用相关系数 r 来衡量两个变量之间的线性

北师大版数学选修1-2第一章统计案例章末归纳总结


条件概率与相互独立事件的概率
某班甲,乙,丙三名同学竞选班委,甲当选的 概率为45,乙当选的概率为35,丙当选的概率为170.
(1)求恰有一名同学当选的概率; (2)求至多有两人当选的概率.
[解析] 设甲,乙,丙当选的事件分别为 A、B、C.
(1)因为 P(A)=45,P(B)=35,P(C)=170且 A、B、C 相互独立, 所以恰有一名同学当选的概率为 P(A·B ·C + A ·B·C + A ·B ·C)=P(A·B ·C )+P( A ·B·C )+P( A ·B ·C)=P(A)·P( B )·P( C ) +P( A )·P(B)·P( C )+P( A )·P( B )·P(C)=45×25×130+15×35×130+ 15×25×170=24570.
(2)至多有两人当选的概率为 1-P(A·B·C)=1-P(A)·P(B)·P(C) =1-45×35×170=18235.
小张参加某电视台举行的百科知识比赛的预选赛,只有闯 过了三关的人才能参加决赛.按规则:只有过了第一关,才能 去闯第二关;只有过了第二关,才能去闯第三关.对小张来 说,过第一关的概率为0.8,如果不按规则去闯第一关,而直接 去闯第二关能通过的概率为0.75,直接去闯第三关能通过的概 率为0.5.
P(χ2≥k) 0.10 0.050 0.025 0.010 0.001
k
2.706 3.841 5.024 6.635 10.828
[答案]
(1)能
2 (2)3
[解析] (1)提出假设 H0:使用淡化海砂与混凝土耐久性是 否达标无关.
根据表中数据,求得 χ2 的观测值 k=60×32052××1450-×1250×52 =7.5>6.635.

高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第1课时 回归分析

第1课时回归分析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(x i,y i)(i=1,2,…,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于0 时,表明两个变量之间越不存在线性相关关系.问题4:线性回归分析的步骤对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(x n,y n).(1) 画散点图:看散点图是否呈条状分布.(2) 求回归直线方程(最小二乘法):b=, =x i,=y i,其中(,)为样本中心点,回归直线方程必经过样本中心点(,),得a=-b ;(3) 得出相关结论:回归直线方程为y=a+bx ,利用回归直线方程进行预测.“一只蝴蝶在巴西扇动翅膀,有可能会在美国的德克萨斯州引起一场龙卷风.”这就是洛伦兹1979年12月在华盛顿的“美国科学促进会”上的一次演讲中提出的“蝴蝶效应”.这次演讲给人们留下了极其深刻的印象.从此以后,所谓“蝴蝶效应”之说就不胫而走,名声远扬.“蝴蝶效应”之所以令人着迷、令人激动、发人深省,不但在于其大胆的想象力和迷人的美学色彩,而且在于其深刻的科学内涵和内在的哲学魅力.1.下列关系不属于相关关系的是( ).A.父母的身高与子女的身高B.人的身高与体重C.居民的收入与消费D.正方体的表面积和体积【解析】相关关系是一种非确定性关系,而D项是确定的关系,为函数关系,故选D.【答案】D2.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( ).A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反【解析】因为b与r的分母均为正,且分子相同,所以b与r同号.【答案】A3.某医院用光电比色检验尿汞时,得到尿汞含量x(毫克/升)与消化系数y的一组数据如下表:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章章末小结
1.回归分析
(1)回归分析步骤:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预测.
(2)线性回归模型:y=bx+a,其中
=x
i ,=y
i
,
2.相关系数
样本相关系数:对于变量y与x的一组观测值,把
r==
叫作变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度,|r| ≤ 1.当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.|r|越接近 1 ,相关程度越大;|r|越接近0 ,相关程度越小.
3.条件概率与相互独立事件
(1)条件概率的定义
设A,B为两个事件,且P(A)>0,称P(B|A)=为在事件A发生的条件下,事件B发生的条件概率.
(2)条件概率相关性质
①0 ≤P(B|A)≤ 1 .
②若P(B)≠0,则P(AB)= P(B)P(A|B) ;
若P(A)≠0,则P(AB)= P(A)P(B|A) .
(3)相互独立事件的定义
设A,B为两个事件,如果P(AB)= P(A)P(B) ,则称事件A与事件B相互独立.
事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫作相互独立事件.
(4)相互独立事件的性质
如果事件A与B相互独立,那么A与,与 B ,与也都是相互独立的.
(5)如果一系列的事件A
1,A
2
,…,A
n
相互独立,那么这n个事件同时发生的概率
等于每个事件发生的概率的积,即P(A
1·A
2
·…·A
n
)= P(A
1
)·P(A
2
)·…·P(A
n
) .
4.χ2的计算公式及其特点
(1)根据2×2列联表与构造的随机变量χ2=(其中n=a+b+c+d是样本容量)来计算χ2的值.
(2)当数据量较大时,统计学中已有明确的结论,随机事件χ2≥x0发生的概率
如下:
当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;
当χ2>2.706时,有90% 的把握判定变量A、B有关联;
当χ2>3.841时,有95% 的把握判定变量A、B有关联;
当χ2>6.635时,有99% 的把握判定变量A、B有关联.
由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误.利用χ2进行独立性检验,可以对推断正确的概率做出估计,样本容量n越大,估计越准确.
题型1:线性回归方程
已知关于某设备的使用年数x和支出的维修费用y(万元),由资料统计得5
组数据(x
i ,y
i
)(i=1,2,3,4,5),由资料知y与x线性相关,并且由统计的五组数据
得平均值分别为=4,=5.4,若用5组数据得到的线性回归方程y=bx+a去估计使用8年的维修费用比使用7年的维修费用多1.1万元.
(1)求回归直线方程;
(2)估计使用年数为10年时,维修费用约是多少.
【解析】(1)因为直线y=bx+a 经过定点(,),又=4,=5.4,所以5.4=4b+a,又8b+a-(7b+a)=1.1,解得b=1.1,a=1,所以回归方程为y=1.1x+1.
(2)将x=10代入线性回归方程得y=12.
所以,估计使用年数为10年时,维修费用约是12万元.
【小结】回归方程一定过中心点(,).本题运用方程的思想,采用待定系数法求解.线性回归方程类似于一次函数的解析式,故有问题可类比一次函数,将问题转化为求函数值.
题型2:线性回归模型问题
一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果:
(1)求变量y 与x 的相关系数,并对其相关性做出判断;
(2)如果y 与x 有线性相关关系,求回归直线方程;
(3)若在实际生产中,允许每小时的产品中有缺点的零件最多为
10个,那么,机器的运转速度应控制在什么范围内?
【方法指导】。

相关文档
最新文档