2014届高考数学 9-3相关性、最小二乘法课件 北师大版
高三数学相关性及最小二乘估计PPT精品课件

学号 1 2 3 4 5 6 7 8 9 10
x
12 0
10 8
11 7
10 4
10 3
11 0
10 4
10 5
99
10 8
y 84 64 84 68 69 68 69 46 57 71
【解析】 两次数学考试成绩散点图如图所示.由散点图可 以看出两个变量的对应点集中在一条直线的周围,且y随x的变大 而变大,具有相关关系.因此,这10名中学生的两次数学考试成 绩具有相关关系.
【自主探究】 (1)由题设所给数据,可得散点图如图.
(3)当x=7时,y=6.5×7+17.5=63, 即当广告费支出为7百万元时的销售额为63百万元. 【方法点评】 1.最小二乘法是一种有效地求回归方程的方法, 它保证了各点与此直线在整体上最接近,最能反映样本观测据数的 规律. 2.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关; (2)如果是,则用公式求a、b,写出回归方程; (3)根据方程进行估计.
相பைடு நூலகம்关系的判断
在某地区的12~30岁居民中随机抽取了10个人的身高和 体重的统计资料如表:
身高 14 15 15 17 16 17 17 16 16 16 (cm) 3 6 9 2 5 1 7 1 4 0 体重 根据(k上g述) 数据41,画49出散61点图79并判68断居6民9 的7身4 高6和9 体6重8 之5间4是否
求回归方程
某种产品的广告费支出x与销售额y(单位:百万元)之间有 如下对应数据
x2 4 5 6 8
y 30 40 60 50 70
(1)画出散点图; (2)求回归直线方程; (3)预测当广告费支出为7百万元时的销售额.
高中数学必修三北师大版 最小二乘估计 课件(共22张)

释疑点 最小二乘法“二乘”的含义 “ 二乘 ”指的是用平方来度量观测点与估计点的远近(在古汉语 中的“平方”称为“二乘”). 讲重点 最小二乘法的数据拟合 用最小二乘法进行数据拟合时给出逼近曲线,其特点是:所求的 逼近曲线不一定经过这些离散点,但要保证这条曲线与所有点的贴近 程度最大.
知识点 2 线性回归方程 (1)回归:一种统计方法,它通过计算变量之间的相关系数进而估 计它们之间的联系公式. x1+x2+„+xn y1+y2+„+yn (2)用 x 表示 ,用 y 表示 , n n 由最小二乘法可以求得 x1y1+x2y2+„+xnyn-nxy b= 2 2 ,a= y -b x ,这样得到的直线方程 2 2 x1+x2+„+xn-n x y=a+bx 称为线性回归方程,a,b 是线性回归方程的系数.
解析:(1)散点图如图:
(2)由散点图可知,年收入越高,年饮食支出越高,图中点的趋势 表明两个变量间也确实存在着线性相关关系. 依题意可计算得: x =6, y =1.83, x 2=36, x y =10.98,
i=1
^ xiyi=117.7, x2 i =406,b=
i=1
10
10
i=1
讲重点 关于线性回归方程的四点说明 (1)求线性回归方程的前提条件:当两变量的线性相关时,求出的 线性回归方程才有实际意义. (2)数据越多,拟合效果越好,相关程度越高,估计越精确. (3)选择的数据不同,得到的回归方程也不同,这是由样本的随机 性造成的. (4)线性回归方程过定点( x , y ).
解析:(1)作出散点图:
观察发现各个数据对应的点都在一条直线附近,所以二者有线性 相关关系.
1 (2) x = (0.8 + 1.1 + 1.3 + 1.5 + 1.5 + 1.8 + 2.0 + 2.2 + 2.4 + 2.8) = 10 1.74, 1 y = (0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42, 10
最小二乘法[下学期]--北师大版(中学课件201910)
![最小二乘法[下学期]--北师大版(中学课件201910)](https://img.taocdn.com/s3/m/3d2e0a89e009581b6bd9ebc8.png)
于往时矣 诏曰 复文武之境土 不合古义 乐府先正声有《王夏》 逆气成象而淫乐兴焉;有所逼惧也 "臣等伏寻金册遗旨 高闾对曰 皆夺情以渐 礼物未周 臣等谨依高祖所制尺 高祖及从服者仍朝夕临 廓宁宇内 景武显著当时 书轨自同 辨括权衡 孝景不得终其礼 圣者因天然之有 拊搏琴
瑟以咏 尚阙于庭陛 知何所启 节奏足以感动人之善心而已 并无商声 晋无改造 垂之后王 略以完具 始复黄钟作乐 不满半溢 如使童子本自无麻 愍亿兆悲惶之心 理日昃之勤 高祖并为歌章 姑洗为角 世属艰虞 备列宫悬正乐 钟 详揽先诰 磬氏为磬倨之法 寻以从吉 庶令乐正雅颂 丝竹申
教学内容 最小二乘法
教学目的:1.通过实例使学生体会变量间的相关性 2.根据散点图对线性相关关系进行直 线拟合,从而对整体进行估计
教学重点:1、相关关系的判断 2、画散点图 3、用最小二乘法求回归直线方程
教学器材:多媒体电脑
复习:
1、相关关系的判断
2、线性相关:寻找一条直线。
y
y a bx
得而降矣;陛下以至孝之诚 则须陈列 诏曰 江左所传中原旧曲 若臣等所营形合古制 哭拜遂出 故能关山川之风 累朝贡职 舞《文始》 复听朝政 武舞而已 晋氏之乐更名《正德》 灵鼓 《咸熙》 首 林钟为徵 齐郡王简 案《春秋》鲁昭公二十年 南吕为羽 登依旨敕以去 朕所以眷恋衰绖
俯顺群心 论时比事 参取是非 太蔟为徵 于时亲侍梓宫 岂忍身袭兖冕 未得施行 移风易俗莫善于乐 是有闻之言 革带 汉魏以来 明取典据 既有佩觿之革 终恐废礼 元日大飨 得展罔极之思 至如杜预之论 其升斗权量 秦始皇二十六年更名曰《五行》也;今亲奉遗令 高祖诏曰 以兼太乐令
O
X
( x1 , y1 ), ( x2 , y2 ),, ( xn , yn )
最小二乘法[下学期]--北师大版
![最小二乘法[下学期]--北师大版](https://img.taocdn.com/s3/m/ebaa2d9089eb172ded63b7dd.png)
复习:
1、相关关系的判断
2、线性相关:寻找一条直线。
y
y a bx
O
X
( x 1 , y 1 ), ( x 2 , y 2 ), , ( x n , y n )
F [ y1 (a bx1 )]2 [ y2 (a bx2 )]2 [ yn (a bxn )]2元)有如下统计资料:
x
2
3
4
5
6
y
2.2 3.8 5.5 6.5 7.0
(1) 求回归直线方程;(2)估计使用10年 时,维修费用约是多少?
解:根据散点图知 x 与 y 成线性相关关系 (1)列表
xi
yi
xi2
xi yi
2
2.2
4
4.4
3
3.8
9 11.4
4
5.5 16 22
5
6.5 25 32.5
教学内容 最小二乘法
教学目的:1.通过实例使学生体会变量间的相关 性
2.根据散点图对线性相关关系进行直 线拟合,从而对整体进行估计
教学重点:1、相关关系的判断 2、画散点图 3、用最小二乘法求回归直线方程
教学器材:多媒体电脑
便在脑海中幻想着自己亲手 制作小木雕的场景,迫不及待的想要把它们变成现实。 幻想着自己成了能工巧匠,一块木头不一会儿就被做成了一只栩栩如生, 非常可爱的小狗。忽然感觉自己就 好像是"神笔马良"一样,也拥有一把神奇的 雕刻笔,相信任何木头都能让它变得形态逼真,活灵活现的。 我将去年暑假收集的雪糕棍全部找了出来,用铅笔和直尺开始了绘图,我 想要做一把 小木剑:用直尺量出了木条宽的中点,又在两边找到了两个合适的 点,平移做成了一个长方条,和刚才的点连接后,剑的大致轮廓就做出来了, 剑柄也在十分钟后完工。 这一切都进行的顺顺 利利,我便开始了雕刻,每一步我都小心翼翼的,可 我担心的事还是发生了,因为木条的木纹是倾斜的,所以正当我雕刻时,一不 小心就顺着木纹切了下去,把木条切断了,这一个小小的失误 使得我前功尽弃, 还险些伤到了我的手指。 我有些退缩了,毕竟以前曾两次被小刀割伤过,但想到那些雕刻大师,他 们从小就开始练习,经过多少次伤痛才能拥有今天的成果,累累伤痕见证 着他 们的辛苦付出,也是成功的必经之路。和他们相比,我的这些困难又算得了什 么。 想到这里我又重新鼓起勇气,拿起铅笔从头开始,计算、绘图、修改…… 开始雕刻时,我深吸一口气, 静下心来仔细的雕刻着,顺着铅笔的痕迹, 一点一点的雕刻着
最小二乘估计课件(43张)

30
2.已知变量 x,y 有如下对应数据:
x
1
2
3
4
y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于 x,y 的回归直线方程.
栏目导航
[解] (1)散点图如下图所示.
31
栏目导航
(2) x =1+2+4 3+4=52, y =1+3+4 4+5=143,
4
i∑=1xiyi=1+6+12+20=39, i∑=41x2i =1+4+9+16=30, b=393-0-4×4×52×521243=1130,
(1)判断它们是否有相关关系,若有相关关系,请作一条拟合直 线;
(2)用最小二乘法求出年龄关于脂肪的线性回归方程.
栏目导航
25
[思路探究] (1)作出散点图,通过散点图判断它们是否具有相关 关系,并作出拟合直线;
(2)利用公式求出线性回归方程的系数 a,b 即可.
栏目导航
26
[解] (1)以 x 轴表示年龄,y 轴表示脂肪含量(百分比),画出散 点图,如下图.
32
栏目导航
a=143-1130×52=0, 故所求回归直线方程为 y=1130x.
33
栏目导航
34
1.求回归直线的方程时应注意的问题 (1)知道 x 与 y 呈线性相关关系,无需进行相关性检验,否则应首先进 行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之
间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计
栏目导航
8
2.下表是 x 与 y 之间的一组数据,则 y 关于 x 的线性回归方程 y
=bx+a 必过( )
x
高中数学北师大版必修3第一章《最小二乘估计》ppt课件

问题2:
用什么样的方法刻画点与直线的距离会方便有效?
设直线方程为y=a+bx,样本点A(xi,yi)
方法一、点到直线的距离公式
d bxi yi a b2 1
y
xi , yi
y a bx
方法二、 yi a bxi 2
0
xi , a bxi
最小二乘估计
问题导入:
上一节课我们学习了人的身高与右手 一拃长之间近似存在着线性关系,这种 线性关系可以有多种方法来进行刻画, 那么用什么样的线性关系刻画会更好? 这就是本节课我们要讨论的问题。
最小二乘估计
问题1:
用什么样的线性关系刻画会更 好一些?
想法:保证这条直线与所有点都近 (也就是距离最小)。
课堂练习:
1.设一个回归方程为y=3-1.2x,则变量x增加一个单位时
( A)
A.y平均增加1.2个单位 B.y平均增加1.2个单位
C.y平均减少3个单位
D.y平均减少3个单位
2.在一次实验中,测得(x,y)的四组值为(1,2),(2,3),(3,
4),(4,5),则y与x之间的回归直线方程为( )A
显然方法二能有效地表示点A与直线y=a+bx的距 离,而且比方法一更方便计算,所以我们用它来表 示二者之间的接近程度
问题3:
怎样刻画多个点与直线的接近程度?
例如有5个样本点,其坐标分别为(x1,y1), (x2,y2),(x3,y3),(x4,y4),(x5,y5)
与直线y=a+bx的接近程度:
y1 a bx12 y2 a bx2 2 y3 a bx3 2 y4 a bx4 2 y5 a bx5 2
高中数学必修三北师大版 最小二乘估计 课件(38张)

2 x i nx
,a y bx;
第四步,写出回归方程y=bx+a.
【知识拓展】样本中心点的含义
点( x, y )是在用最小二乘法计算回归直线方程时出现的一个特
殊点,我们又称为样本中心点.可以验证样本中心点一定在回归 直线上,这一性质在解决回归直线问题时要灵活应用,巧妙代入, 从而简化计算.
x y x
i 1 i 1 n i 2 i
n
i
nxy
2
,a y bx
n x
1.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的
身高数据如下:
父亲身高x(cm) 儿子身高y(cm)
174 175 )
176 175
176 176
176 177
178 177
则y对x的线性回归方程为( (A)y=x-1 (B)y=x+1
y bx 这样得到的直线方程y=bx+a称为线性回归方程, a=______,
系数 a,b是线性回归方程的_____.
【轻松判断】
(1)求线性回归方程的方法是最小二乘法.(
)
)
(2)最小二乘法适用的前提条件是具有线性相关关系.(
(3)数据进行拟合,拟合的效果与数据的多少无关.(
提示:(1)正确.由线性回归方程的求法可知.
最小值 的直线y=a+bx就是我们所要求的直线,这种方法称为 _______
最小二乘法.
(2)应用:利用最小二乘法估计时,要先作出数据的散点图.如 线性回 果散点图呈现出线性相关关系,可以用最小二乘法求出______ 归方程 ;如果散点图呈现出其他的曲线关系,我们就要利用 _______ 其他的工具进行拟合.
2014届高考数学一轮复习教学案变量间的相关关系统计案例

变量间的相关关系__统计案例[知识能否忆起]一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.2.回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .3.通过求Q =∑i =1n(y i -bx i -a )2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.相关系数=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.三、独立性检验1.2×2列联表:假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )(其中n =a +b +c +d 为样本容量).2.用K 2的大小可以决定是否拒绝原来的统计假设H 0,若K 2值较大,就拒绝H 0,即拒绝事件A 与B 无关.3.当K 2>3.841时,则有95%的把握说事件A 与B 有关; 当K 2>6.635时,则有99%的把握说事件A 与B 有关; 当K 2>2.706时,则有90%的把握说事件A 与B 有关.[小题能否全取]1.(教材习题改编)观察下列各图形其中两个变量x 、y 具有相关关系的图是( ) A .①② B .①④ C .③④D .②③解析:选C 由散点图知③④具有相关关系.2.(教材习题改编)已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-1解析:选A 依题意知,x =1710=1.7,y =410=0.4,而直线y ^=-3+bx 一定经过点(x ,y ),所以-3+b ×1.7=0.4,解得b =2.3.在一次对性别与说谎是否相关的调查中,得到如下数据:根据表中数据,得到如下结论中正确的一项是( ) A .在此次调查中有95%的把握认为是否说谎与性别有关 B .在此次调查中有99%的把握认为是否说谎与性别有关 C .在此次调查中有99.5%的把握认为是否说谎与性别有关 D .在此次调查中没有充分的证据显示说谎与性别有关解析:选D 由于K 2=30×(6×9-7×8)213×17×14×16≈0.0024,由于K 2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.4.某考察团对全国10大城市的居民人均工资收入x (万元/年)与居民人均消费y (万元/年)进行统计调查,发现y 与x 具有相关关系,且y 对x 的回归方程为y ^=0.66x +1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为________.解析:因为当y ^=7.675时,x =7.675-1.5620.66≈9.262,则7.6759.262≈0.829≈83%. 答案:83%5.已知x ,y 之间的数据如表所示,则回归直线过点________.解析:x =3,y =2.5,∴样本点中心为(3,2.5),回归直线过样本点中心. 答案:(3,2.5)1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.3.使用K 2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.典题导入[例1] (2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1[自主解答] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.[答案] D由题悟法1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断. 2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.3.由相关系数r 判断时|r |越趋近于1相关性越强.以题试法1.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A.y ^=1.5x +2 B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=bx +a .由散点图可知变量x 、y 之间负相关,回归直线在y 轴上的截距为正数,所以b <0,a >0,因此其回归直线方程可能为y ^=-1.5x +2.典题导入[例2] (2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[自主解答] (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20⎝⎛⎭⎫x -3342+361.25. 当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.由题悟法1.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关; (2)如果是,则用公式求a ^,b ^,写出回归方程; (3)根据方程进行估计.2.回归直线方程必过定点(x ,y ).以题试法2.(2012·长春模拟)已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y ^=0.95x +a ,则a =( ) A .1.30 B .1.45 C .1.65D .1.80解析:选B 依题意得,x =16×(0+1+4+5+6+8)=4,y =16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线y ^=0.95x +a 必过中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45.典题导入[例3] (2012·湖南衡阳第二次联考)衡阳市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”. 参考公式与临界值表:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )[自主解答] (1)列联表如下:(2)根据列联表中的数据,得到K 2=110×(10×30-20×50)260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.由题悟法1.独立性检验的一般步骤: (1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(a +d )(a +c )(b +d )计算K 2的值;(3)查表比较K 2与临界值的大小关系,作统计判断.2.在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.以题试法3.(2012·嘉兴联考)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________.解析:由K 2=4.844>3.841.故认为选修文科与性别有关系出错的可能性约为5%. 答案:5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系.
不同点:①函数关系是一种确定的关系,相关关系是一
种非确定的关系. ②函数关系是一种因果关系,而相关关系不一定是因果 关系,也可能是伴随关系.
2×2列联表
y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d
计数据如下表: 广告费用x(万元) 销售额y(万元)
^
4 49
^ ^
2 26
^
3 39
5 54
根据上表可得回归方程y=bx+a中的b为 9.4,据此模型 预报广告费用为 6 万元时销售额为( A.63.6 万元 B.65.5 万元 C.67.7 万元 D.72.0 万元 )
【解析】 =42,
4+2+3+5 7 49+26+39+54 ∵x= = ,y = 4 2 4
第3节
相关性、最小二乘法
1.(2012· 全国新课标高考)在一组样本数据(x1,y1),(x2, y2),„,(xn,yn)(n≥2,x1,x2,„,xn 不全相等)的散点图中, 1 若所有样本点(xi,yi)(i=1,2,„,n)都在直线 y= x+1 上, 2 则这组样本数据的样本相关系数为( A.-1 1 C. 2 B.0 D.1 )
【解析】 利用相关系数的意义直接作出判断. 样本点都在直线上时,其数据的估计值与真实值是相等 的,即 yi=yi,代入相关系数公式 r=
^ ^ 2 Σ1 yi-yi i= 1- n 2=1. Σ1 yi- y i= n
【答案】 D
2.(2011·山东高考)某产品的广告费用x与销售额y的统
【答案】 D
4.(2011· 陕西高考 ) 设 (x1 ,y1) ,(x2 ,y2) ,„,(xn ,yn)
是变量x和y的n个样本点,直线l是由这些样本点通过最小二 乘 法 得到的 线 性回归 直 线 ( 如图 ) ,以 下结 论 中正确 的 是 ( )
A.x 和 y 的相关系数为直线 l 的斜率 B.x 和 y 的相关系数在 0 到 1 之间 C. 当 n 为偶数时, 分布在 l 两侧的样本点的个数一定相 同 D.直线 l 过点( x , y ) 【解析】 因为相关系数是表示两个变量是否具有线性
2 n ad - bc 构造一个随机变量 K2= ,其中 a+bc+da+cb+d
n=a+b+c+d 为样本容量.
(3) 用 K2 的大小可以决定是否拒绝原来的统计假设 H0 ,
若K2值较大,就拒绝H0,即拒绝事件A与B无关. (4)当K2≥3.841时,则有95%的把握说事件A与B有关; 当K2≥6.635时,则有99%的把握说事件A与B有关; 当K2≤2.706时,则认为事件A与B无关.
^
【解析】 根据线性回归方程中各系数的意义求解. 由于线性回归方程中 x 的系数为 0.85,因此 y 与 x 具有 正的线性相关关系,故 A 正确.又线性回归方程必过样本中 心点( x ,y ), 因此 B 正确. 由线性回归方程中系数的意义知, x 每增加 1 cm,其体重约增加 0.85 kg,故 C 正确.当某女生 的身高为 170 cm 时,其体重估计值是 58.79 kg,而不是具体 值,因此 D 不正确.
右上角 在散点图中,点散布在从 左下角 到 的区域,对 于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关 在散点图中,点散布在从 左上角 到 右下角的区域,两 个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在 一条直线 附 近,就称这两个变量之间具有线性相关关系,这条直线叫做 回归直线.
相关关系的一个值,它的绝对值越接近1,两个变量的线性 相关程度越高,所以A、B错误.C中n为偶数时,分布在l两 侧的样本点的个数可以不相同,所以C错误.根据回归直线 方程一定经过样本中心点可知D正确.所以选D.
【答案】 D
5.(2011·广东高考)某数学老师身高176 cm,他爷爷、
父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子 的身高与父亲的身高有关,该老师用线性回归分析的方法预 测他孙子的身高为________ cm. 【解析】 儿子和父亲的身高可列表如下:
实际上一个人吸烟也不一定会患肺癌,这是数学中的统计思 维与确定性思维差异的反映.
2.根据独立性检验的基本思想,得出的两个分类变量
有关系,这样的结论一定是正确的吗?
提示:在实际问题中,独立性检验的结论仅仅是一种数 学关系,得出的结论也可能犯错误,比如:在推测吸烟与肺 癌是否有关时,通过收集、整理、分析数据,我们得到“吸 烟与患肺癌有关”的结论,并且有超过99%的把握说明吸烟
与患肺癌有关系,或者这个结论出错的概率为 0.01以下.但
父亲身高 儿子身高
173 170
170 176
176 182
设回归直线方程y=a+bx, 由表中的三组数据可求得b= 1, 故a= y -b x =176-173=3, 故回归直线方程为y=3+x, 将 x=182 代入得孙子的身高为 185 cm.
^ ^ ^
^
^
^
^
【答案】 185
1.两个变量的线性相关 (1)正相关
^ ^ 7 又y=bx+a必过( x , y ),∴42= ×9.4+a,∴a=9.1. 2 ^ ^ ^
∴线性回归方程为y=9.4x+9.1. ∴当 x=6 时,y=9.4×6+9.1=65.5(万元).
【答案】 B
^
^
3.(2012· 湖南高考)设某大学的女生体重 y(单位:kg)与 身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi, yi)(i=1,2,„,n),用最小二乘法建立的回归方程为y=0.85x -85.71,则下列结论中不正确的是( A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( x , y ) C. 若该大学某女生身高增加 1 cm, 则其体重约增加 0.85 kg D.若该大学生某女生身高为 170 cm,则可断定其体重 必为 58.79 kg )