2015届高考数学总复习 基础知识名师讲义 第九章 第五节变量间的相关关系、统计案例 文
2015届高考数学总复习 基础知识名师讲义 第九章 第五节 变量间的相关关系、统计案例 理

第五节 变量间的相关关系、统计案例知识梳理 1.散点图.(1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的________.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.答案:1.(1)散点图2.相关关系.(1)从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为____________;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为____________.(2)线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做____________.(3)若两个变量x 和y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是______________的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.答案:2.(1)正相关 (2)回归直线 (3)非线性相关3.回归直线.(1)最小二乘法:如果有n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n )可以用下面的表达式来刻画这些点与回归直线的接近程度: [y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a+bx n )]2,使得上式达到最小值的y ^=b ^x +a ^就是我们要求的直线,这种方法称为最小二乘法.(2)在回归直线方程y ^=b ^x +a ^中,b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x·y∑i =1nx 2i -n x2,a^1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列两种常用的统计方法,并能应用这些方法解决一些实际问题. (1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;(2)回归分析:了解回归分析的基本思想、方法及其简单应用.=________,其中x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n.b ^叫做回归直线方程的斜率,a^是直线在y 轴上的截距.答案:3.y -b ^x4.相关系数.r=∑i =1nx i -xy i -y∑i =1nx i -x2y i -y2,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量________; (2)当r <0时,表明两个变量________;(3)r 的绝对值越接近1,表明两个变量的线性相关性______;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.当|r |∈[0.3,0.75)时,相关性一般.当|r |∈[0,0.25]时,相关性较弱.答案:4.(1)正相关 (2)负相关 (3)越强5.残差分析.(1)线性回归模型:y =bx +a +e 中,a ,b 称为模型的未知参数;e 称为随机误差.(2)残差平方和:对于样本点(x i ,y i )(i =1,2,…,n ),Q =∑i =1n(y i -y )称为残差平方和,Q 值越小,说明线性回归模型的拟合效果越好.(3)相关指数:用相关指数R 2来刻画回归的效果,公式是R2= . R 2的值越大,说明残差平方和越小,也就是说模型拟合效果______.答案:5.越好6.独立性检验.(1)若变量的不同“值”表示个体所属的不同类型,则这类变量称为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的________.2×2列联表独立性检验公式K 2=__________________.答案:6.(3)独立性检验n (ad -bc )2(a +b )(c +d )(a +c )(b +d )基础自测1.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为( )A .①③④B .②④⑤C .③④⑤D .②③⑤答案:C2.(2013·武昌调研)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线由K 2=n (a +b )(c +d )(a +c )(b +d ),算得K 2=260×50×60×50≈7.8.附表:A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:因为K 2=110×(40×30-20×20)260×50×60×50≈7.8>6.635,所以有99%以上的把握认为“选择过马路的方式与性别有关”.答案:A3.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x+1上,则这组样本数据的样本相关系数为__________________.解析:所有点均在直线上,则样本相关系数最大即为1. 答案:14.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析: 由题意得y ^2-y ^1=[0.254(x +1)+0.321]-[0.254x +0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2541.(2012·湖南卷)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:根据回归方程的概念和性质知选项A ,B ,C 三项均正确,选项D 错误,线性回归方程只能预测学生的体重. 选项D 应改为“若该大学某女生身高为170 cm ,则估计其体重大约为58.79 kg”.答案:D2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众年龄为20至40岁的概率.解析:(1)有关.收看新闻节目多为年龄大的.(2)应抽取的人数为:5×2745=3(人).(3)由(2)知,抽取的5名观众中,有2名观众年龄处于20至40岁,3名观众的年龄大于40岁.记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共10个,其中恰有1人为20至40岁的基本事件有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共6个,因此所求的概率P =610=35.1.(2013·梅州一模)在2014年1月15日当天,某物价部门对本市的5家商场的某商品的一天销售量价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:y ^=-3.2x +40,且m +n =20,则其中的n =________.解析:x =15(9+9.5+m +10.5+11)=15(40+m ),y =15(11+n +8+6+5)=15(30+n ).因为其线性回归直线方程是:y ^=-3.2x +40,所以15(30+n )=-3.2×15(40+m )+40,即30+n =-3.2(40+m )+200,又m +n =20, 解得m =n =10. 答案:102.某大学高等数学老师上学期分别采用了A ,B 两种不同的教学方式对甲、乙两个大一新生班进行教改试验(两个班人数均为60人,入学数学平均分数和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名同学的上学期数学期末考试成绩,得到茎叶图如下:(1)依茎叶图判断哪个班的平均分高?(2)从乙班这20名同学中随机抽取2名高等数学成绩不得低于85分的同学,求成绩为90分的同学被抽中的概率.(3)学校规定:成绩不低于85分的为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d(4)从乙班高等数学成绩不低于85分的同学中抽取2人,成绩不低于90分的同学得奖金100元,否则得奖金50元,记ξ为这2人所得的总奖金,求ξ的分布列和数学期望.解析:(1)甲班高等数学成绩集中于60~90分之间,而乙班数学成绩集中于80~100分之间,所以乙班的平均分高.(2)P =C 11C 19C 210=15.(3)K 2=40×(13×27×20×20≈5.584>5.024,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关.(4)由题可知ξ的可能取值为100,150,200.P ()ξ=100=C 25C 210=29,P ()ξ=150=C 15C 15C 210=59,P ()ξ=200=C 25C 210=29,所以ξ的分布列为:∴E (ξ)=100×29+150×9+200×9=150.。
变量间的相关关系

2.正相关:在散点图中,点散布在从左下角到右上 角的区域,对于两个变量的这种相关关系,我们将 它称为正相关。
思考6:如图是高原含氧量与海拔高度的相关关系 的散点图,高原含氧量与海拔高度有何相关关系? 点的分布有何特点?
海平面以上,海拔高度 越高,含氧量越少。
点散布在从左上角到右 下角的区域内。
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考3:上图叫做散点图,你能描述一下散点图的含 义吗?
1.散点图:在平面直角坐标系中,表示具有相关关系 的两个变量的一组数据图形,称为散点图.
脂肪含量
思考4:观察散点图的大致趋势,人的年龄的与人体 脂肪含量具有什么相关关系?
大体上看,随着年龄的增加,人体中脂肪百分比也 在增加。
年龄 23 脂肪 9.5
27 39 17.8 21.2
41 25.9
45
49 50
27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的更明 确的关系,我们需要对数据进行分析,通过作图可 以对两个变量之间的关系有一个直观的印象.以x轴 表示年龄,y轴表示脂肪含量,你能在直角坐标系 中描出样本数据对应的图形吗?
销售价格 12.2 15.3 24.8 21.6 18.4 29.2 22
(万元)
画出数据对应的散点图,并指出销售价格与房屋面积 这两个变量是正相关还是负相关.
解: 35
30 25 20 15 10 5 0
高三数学一轮复习 第9章第5节 变量的相关关系、统计案例课件 文 (广东专用)

程可能是( )
∧
∧
A.y=-10x+200 B.y=10x+200
∧
∧
C.y=-10x-200 D.y=10x-200
【解析】 由题意回归方程斜率应为负,故排除B,D,又销售量 应为正值,故C不正确,故选A.
【答案】 A
3.(2011·辽宁高考)调查了某地若干户家庭的年收入 x(单位:万元)和 年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线
∧
(2)由于 x 与 y 之间具有线性相关关系,根据回归系数公式得到b= 499974=0.5,a∧=100-0.5×100=50,
∧
∴线性回归方程为y=0.5x+50. 当 y=115 时,x=130. 建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有
助于物理成绩的进一步提高.,
某地区甲校高二年级有1 100人,乙校高二年级有900人,为了 统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层 抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本 次测试合格线是50分,两校合格率均为100%)
nad-bc2 构造一个随机变量 K2= a+bc+da+cb+d , 其中 n= a+b+c+d 为样本容量
∧
1.线性回归方程y=bx+a 是否一定过样本点的中心( x , y ), 为什么?
【提示】 一定过点( x , y ),∵a= y -b x ,∴ y =b x +a,即
∧
点( x , y )一定在回归直线y=bx+a 上.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样 本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有 明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再 把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样 方法更好.
2015年高考数学第一轮复习课件:9.3变量间的相关关系、统计案例

递减趋势
递增趋势
解析 由图(1)可知,各点整体呈递减趋势,x 与 y 负相关; 由图(2)可知,各点整体呈递增趋势,u 与 v 正相关.
答案 C
第十一页,编辑于星期五:十一点 五十一分。
考
线性回归方程及其应用
点
【例题 2】(2013·重庆卷)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单位:千元)的数据资料,
得回归直线方程,分别得到以下四个结论:
①y 与 x 负相关且y^ =2.347x-6.423; ②y 与 x 负相关且y^ =-3.476x+5.648;
不是负相关;
④方程中的 x 的系数 为负,不是正相关,
③y 与 x 正相关且y^ =5.437x+8.493;
∴①④一定不正确.
④y 与 x 正相关且y^ =-4.326x-4.578.
i=1
10
i=1
xiyi-10 x y
i=1
由此得b^ =
10
=2840=0.3,
x2i -10 x 2
i=1
^
a
= y -b^
x =2-0.3×8=-0.4,故所求回归方程为y^
=0.3x-0.4.
第十三页,编辑于星期五:十一点 五十一分。
线性回归方程及其应用
(2) 由于变量 y 的值随 x 值的增加而增加(b^ =0.3>0),
xiyi-n x y
i=1
附:线性回归方程y^ =b^ x+a^ 中,b^ =
,a^ = y -b^
n
x2i -n x 2
i=1
x ,其中 x , y 为样本平均值.
第十二页,编辑于星期五:十一点 五十一分。
变量间的相关关系讲义

变量间的相关关系讲义变量间的相关关系讲义一、基础知识梳理知识点1:变量之间的相关关系两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系。
注意:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。
点睛:两个变量相关关系与函数关系的区别和联系相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。
知识点2.散点图.1.在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图。
2.从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合。
3.对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内。
如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从左上角到右下角的区域。
2015届高考数学(文)基础知识总复习精讲课件:第9章 第5节 变量间的相关关系、统计案例

对低蛋白食物组,设年龄为x,身高为y,同样可得线性回归方程 =51.226+ 8.686x,通过对斜率、截距进行比较,可以看出不同食物对婴儿的身高有显著
xy
1
2
73
4 146
2
3
72
9 216
3
4
71
16 284
4
3
73
9 219
5
4
69
16 276
6
568Leabharlann 25 340合计21
426
79 1 481
根据以上数据求线性回归方程.
解析:设回归直线方程为y^=b^x+^a,
-x =261,-y =4626=71,
6
x2i =79,
6
xiyi=1
481,
年 龄
0.2
0.5
0.8
1
1
1.4 1.8
2
2
2.5 2.5 3 2.7
身 高
54
54.3
63
66 69
73
82
83
80.3
91
93.2 94
94
低蛋白食物组
年 龄 0.4 0.7 1 1 1.5 2
2
2. 4
2. 8
3
1.3 1.8
0.2
3
身 高
52
55
61
63. 4
66
68.5
67.9
7 2
76
变式探究
1.(1)有五组变量: ①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积; ⑤汽车的重量和每公里耗油量. 其中两个变量成正相关的是( ) A.①③ B.②④ C.②⑤ D.④⑤ (2)有10名同学高一(x)和高二(y)的数学成绩如下:
2015高考数学(文)一轮总复习课件:9.3 变量间的相关关系、回归分析及独立性检验

迁移发散:(2013·南昌模拟)下表提供了某厂节能降耗 技术改造后在生产 A 产品过程中记录的产量 x(吨)与 相应的生产能耗 y(吨)的几组对应数据:
x y 3 2.5 4 t 5 4 6 4.5
根据上表提供的数据,求出 y 关于 x 的回归直线 方程为 y=0.35+0.7x,那么表中 t 的值为() A. 3 B. 3.15 C. 3.5 D. 4.5
第九章 §9.3 变量间的相关关系、回归分析及独立性检验
最新考纲 基础梳理
第 三 节
自主测评 典例研析
特色栏目
备课优选
最新考纲
1. 会作两个有关联变量的数据的散点图,会利用散点图认识变 量间的相关关系. 2. 了解最小二乘法的思想,能根据给出的线性回归方程系数公 式求回归直线方程. 3. 了解独立性检验(只要求 2×2 列联表)的基本思想,方法及其 简单应用. 4. 了解回归分析的基本思想,方法及其简单应用.
点评:本题考查相关关系的判断,判断两变量之间是 否具备相关关系,可以利用散点图,也可以可利用样 本相关系数.
规律总结:在散点图中,如果所有的样本点都落在某 一函数的曲线上,就用该函数来描述变量之间的关系 即变量之间具有函数关系.如果所有的样本点都落在 某一函数的曲线附近,变量之间就有相关关系.如果 所有的样本点都落在某一直线附近,变量之间就有线 性相关关系.画散点图时,两组数据中可以任选一组 作为横坐标取值,另一组作为纵坐标取值且平面直角 坐标系中两坐标轴的长度单位可以不同.
7.675-1.562 ^ 解析:∵当 y =7.675 时,x= ≈9.262, 0.66 7.675 则 ≈0.829≈83%. 9.262
5、已知 x,y 之间的数据如下表所示,则回归直线过 点 (3,2.5).
高考数学 第九章 第五节变量间的相关关系课件 理

中最小的.
()
(2)已知回归方程 yˆ=4.4x+838.19,则可估计x与y的增长速 度之比约为______.
【解析】(1)任何一组观测值都能利用公式得到直线方程,但
这个方程可能无意义,①不正确;回归直线方程 yˆ=bˆ x+aˆ 经 过样本点的中心( x, y ),可能不经过(x1,y1),(x2,y2), …,(xn,yn)中的任何一点,这些点分布在这条直线附近, ②不正确;③正确;④正确.
【例1】下表是某小卖部6天卖出的热茶的杯数与当天气温的对 比表.
气温 (℃)
26
18
13
10
4
-1
杯数y 20
24
34
38
50
64
(1)将表中的数据画成散点图; (2)你能依据散点图指出气温与热茶杯数的关系吗? (3)如果气温与卖出热茶杯数近似成线性相关关系的话,请画出 一条直线来近似地表示这种线性相关关系.
的直线叫做回归直线.
【即时应用】
(1)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回 归直线方程 yˆ=bˆ x+aˆ ,判断下面说法是否正确(请在括号内 填写“√”或“×”)
①任何一组观测值都能得到具有代表意义的回归直线方程;
()
②直线 yˆ=bˆ x+aˆ 至少经过点(x1,y1),(x2,y2),…,(xn,yn)
xi x yi y
n
2
xi x
xiyi nxy
i1 n
x
2 i
2
nx
,
i1
i1
aˆ y bˆ x;
第四步,写出回归方程 yˆ bˆx aˆ. 【提醒】对于任意一组样本数据,利用上述公式都可以求得 “回归方程”,如果这组数据不具有线性相关关系,即不存在 回归直线,那么所得的“回归方程”是没有实际意义的.因此, 对一组样本数据,应先作散点图,在具有线性相关关系的前提 下再求回归方程.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五节 变量间的相关关系、统计案例1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解下列两种常用的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析:了解回归分析的基本思想、方法及其简单应用.知识梳理 1.散点图.(1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的________.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.2.相关关系.(1)从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为________;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为________.(2)线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做________.(3)若两个变量x 和y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是__________的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.3.回归直线.(1)最小二乘法:如果有n 个点: (x 1,y 1),(x 2,y 2),…,(x n ,y n )可以用下面的表达式来刻画这些点与回归直线的接近程度: [y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2,使得上式达到最小值的y ^=b ^x +a ^就是我们要求的直线,这种方法称为最小二乘法.(2)在回归直线方程y ^=b ^x +a ^中,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x ·y∑i =1nx 2i -n x 2,a ^=________,其中x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n.b ^叫做回归直线方程的斜率,a ^是直线在y 轴上的截距.4.相关系数.,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量________; (2)当r <0时,表明两个变量________;(3)r 的绝对值越接近1,表明两个变量的线性相关性________;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.当|r |∈[0.3,0.75)时,相关性一般.当|r |∈[0,0.25]时,相关性较弱.5.残差分析.(1)线性回归模型:y =bx +a +e 中,a ,b 称为模型的未知参数;e 称为随机误差.(2)残差平方和:对于样本点(x i ,y i )(i =1,2,…,n ),Q =∑i =1n(y i -y )称为残差平方和,Q 值越小,说明线性回归模型的拟合效果越好.(3)相关指数:用相关指数R 2来刻画回归的效果,公式是R 2=1-∑i =1n(y i -y i )2∑i =1n(y i -y )2.R 2的值越大,说明残差平方和越小,也就是说模型拟合效果________. 6.独立性检验.(1)若变量的不同“值”表示个体所属的不同类型,则这类变量称为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的________.2×2列联表y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a +b +c +d 独立性检验公式K 21.散点图2.(1)正相关 负相关 (2)回归直线 (3)非线性相关3.(2)\o(y,\s\up6(-))-b \o(x,\s\up6(-)),4.(1)正相关 (2)负相关 (3)越强5.(3)越好6.(3)独立性检验 \f(n (ad -bc )2,(a +b )(a +c )(b +d )(c +d )),基础自测 1.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的; ⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为( )A .①③④B .②④⑤C .③④⑤D .②③⑤ 答案:C 2.(2013·武昌调研)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还由算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:因为K 2=110×(40×30-20×20)260×50×60×50≈7.8>6.635,所以有99%以上的把握认为“选择过马路的方式与性别有关”.答案:A3.(2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:所有点均在直线上,则样本相关系数最大即为1. 答案:14.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析: 由题意得y ^2-y ^1=[0.254(x +1)+0.321]-[0.254x +0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2541.(2013·湖北卷)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2 347x -6 423;②y 与x 负相关且y ^=-3 476x +5 648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④解析:①回归方程中x 的系数为正,不是负相关;④方程中的x 的系数为负,不是正相关,所以①④一定不正确.答案:D2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众年龄为20至40岁的概率. 解析:(1)有关.收看新闻节目多为年龄大的.(2)应抽取的人数为:5×2745=3(人).(3)由(2)知,抽取的5名观众中,有2名观众年龄处于20至40岁,3名观众的年龄大于40岁.记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共10个,其中恰有1人为20至40岁的基本事件有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共6个,因此所求的概率P =610=35.1.(2013·梅州一模)在2014年1月15日当天,某物价部门对本市的5家商场的某商品由散点图可知,y ^=-3.2x +40,且m +n =20,则其中的n =____________.解析:x -=15(9+9.5+m +10.5+11)=15(40+m ),y -=15(11+n +8+6+5)=15(30+n )因为其线性回归直线方程是:y ^=-3.2x +40,所以15(30+n )=-3.2×15(40+m )+40,即30+n =-3.2(40+m )+200,又m +n =20, 解得m =n =10. 答案:102.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)根据上表提供的数据,求出y 关于x 的线性回归方程为y =0.7x +0.35,那么表中t 的值为( )A .3B .3.15C .3.5D .4.5解析:由y ^=0.7x +0.35得2.5+t +4+4.54=0.7×3+4+5+64+0.35⇒11+t 4=3.5⇒t =3,故选A.答案:A。