变量的相关性

合集下载

第三课变量的相关性

第三课变量的相关性

第三课 变量的相关性栏目一:知识要点一、知识清单1.两个变量的有关系两个变量的有关系两个变量常见的关系可分为函数关系和相关关系,函数关系中两个变量的关系是确定的,而相关关系中两个变量的关系是不确定的。

的,而相关关系中两个变量的关系是不确定的。

2.两个变量的相关性 (1) (1)正相关:正相关:在散点图中在散点图中,,点散布在从左下角到右上角的区域点散布在从左下角到右上角的区域..对于两个变量的这种相关关系对于两个变量的这种相关关系,,我们将它称为正相关我们将它称为正相关. .(2)(2)负相关:在散点图中负相关:在散点图中负相关:在散点图中,,点散布在从左上角到右下角的区域点散布在从左上角到右下角的区域,,两个变量的这种相关关系称为负相关负相关. .(3)(3)线性相关关系、回归直线线性相关关系、回归直线线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近如果散点图中点的分布从整体上看大致在一条直线附近,,就称这两个变量之间具有线性相关关系相关关系,,这条直线叫做回归直线这条直线叫做回归直线. . 3.回归方程 (1)(1)最小二乘法最小二乘法最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. . (2)(2)回归方程回归方程回归方程若已知两个具有线性相关关第的变量的一组数据:1122(,),(,),...,(,)n n x y x y x y ,则这组数据相应的点对应的回归方程为 y = bx a + ,其中a 、b 是由最小二乘法确定的待定系数,计算公式为 1122211()()()nni i i i i i n ni i i i x x y y x y nx y b x x x nx a y bx ====ì---ïï==ïí--ïï=-ïîåååå其中x =n1å=ni i x 1,y =n1å=ni i y 1, a 为回归方程的斜率,b 为截距.为截距.二、方法清单求样本数据的线性回归方程的算法步骤:求样本数据的线性回归方程的算法步骤:第一步,计算平均数x y ,;第二步,求和;,åå==ni i n i i i x y x 121第三步,计算 1122211()();()nni i i i i i nn i ii i x x y y x y nx y b a y bx x x x nx ====---===---åååå , 第四步,写出回归方程第四步,写出回归方程.y b x aÙ=+ 三、教材挖掘1.1. 回归直线一定经过样本中心点,即y b x a Ù=+过点(,)x y (其中x =n1å=ni ix1,y =n1å=ni iy1).这是高考涉及最多的关于线性回归方程的知识点.2.2.两个变量的相关系数两个变量的相关系数两个变量的相关系数若相应于变量x 的取值i x ,变量y 的观察值为i y (1i n ££),则两个变量的相关系数r 的计算公式为:12211()()()()niii nni i i i x x y y r x x y y ===--=--ååå(其中x =n1å=ni ix1,y =n1å=ni iy1).(1)统计中用相关系数r 来衡量两个变量之间线性相关性的强弱来衡量两个变量之间线性相关性的强弱. . (2)当0r >时表明,x y 正相关,当0r <时表明,x y 负相关负相关. .栏目二:课前基础自测1. (2009宁夏海南卷理)对变量x , y 有观测数据理力争(,i i x y )(i =1,2,…,10),得散点图1;对变量,u v 有观测数据(,i i u v )(i =1,2,…,10),得散点图2. 由这两个散点图可以判断(可以判断()x y x y设回归直线方程y a bx=+ ,根据中的三组数据及12inx yb y bxnx=,学生编号学生编号 1 2 3 4 5 6 7 8 数学分数x 60 65 70 75 80 85 90 95 物理分数y 72 77 80 84 88 90 93 95 化学分数z6772768084879092(参考数据:x ,y ,z x y x z x 550456105018x =y bx 1755)x z x =å755z x年份 2002 2004 2006 2008 2010 年份需求量(万吨) 236 246 257 276 286 需求量(万吨)+---´-´´+´+yx b2.2.了解最小二乘法的思想了解最小二乘法的思想了解最小二乘法的思想,,能根据给出的线性回归方程系数公式建立线性回归方程能根据给出的线性回归方程系数公式建立线性回归方程. . (二) 命题规律1.1.以考查线性回归系数为主以考查线性回归系数为主以考查线性回归系数为主,,同时可考查利用散点图判断两个变量间的相关关系同时可考查利用散点图判断两个变量间的相关关系; ;2.2.以实际生活为背景以实际生活为背景以实际生活为背景,,重在考查回归方程的求法重在考查回归方程的求法; ;3.3.在高考题中本部分的命题主要是以选择、填空题为主,属于中档题目。

随机变量独立性判断随机变量的独立性和相关性

随机变量独立性判断随机变量的独立性和相关性

随机变量独立性判断随机变量的独立性和相关性随机变量的独立性和相关性是概率论和数理统计中的重要概念。

在实际问题中,我们经常需要判断随机变量之间是否相互独立或者相关。

本文将介绍如何判断随机变量的独立性和相关性。

一、什么是随机变量的独立性和相关性随机变量的独立性和相关性描述了随机变量之间的关系。

独立性:若两个随机变量X和Y的联合分布等于各自的边缘分布之积,即P(X=x, Y=y) = P(X=x)P(Y=y),则称X和Y独立。

相关性:若两个随机变量X和Y之间存在某种依赖关系,即它们的联合分布和边缘分布不相等,称X和Y相关。

二、判断随机变量的独立性和相关性的方法1. 统计方法利用样本数据进行统计分析,可以判断随机变量的独立性和相关性。

对于两个随机变量X和Y,如果它们的样本相关系数接近于0,可以认为X和Y近似独立;如果样本相关系数接近于1或-1,可以认为X和Y相关。

2. 图形方法通过绘制散点图可以直观地观察随机变量的相关性。

对于两个随机变量X和Y,如果它们的散点图呈现出线性关系,则可以认为X和Y相关;如果散点图呈现出无规律的分布,则可以认为X和Y近似独立。

3. 利用协方差和相关系数判断协方差和相关系数是判断随机变量相关性的重要指标。

协方差衡量了两个随机变量之间的线性相关性,若协方差为0,则可以认为两个随机变量不相关。

相关系数除了衡量两个随机变量的线性相关性,还可以衡量非线性相关性,相关系数的范围在-1至1之间,绝对值越接近1表示相关性越强,绝对值越接近0表示独立性越强。

三、应用举例1. 抛硬币问题假设一次抛硬币,X表示正面次数,Y表示反面次数。

在这个例子中,X和Y的取值只能是0或1,它们的联合分布如下:P(X=0, Y=0) = 1/2P(X=1, Y=0) = 1/2P(X=0, Y=1) = 1/2P(X=1, Y=1) = 1/2可以看出,X和Y的联合分布等于各自的边缘分布之积,即P(X=x, Y=y) = P(X=x)P(Y=y),因此X和Y是独立的。

变量的相关性、回归分析、独立性检验

变量的相关性、回归分析、独立性检验
甲校 优秀 非优秀 总计 15 45 60 乙校 20 30 50 总计 35 75 110
复习目标
课前预习
高频考点
课时小结
2 110 × ( 15 × 30 - 20 × 45 ) K2的观测值k= ≈2.829>2.706, 60×50×35×75
故在犯错误的概率不超过0.10的前提下认为两个学校的数学 成绩有差异.
n
.
通过求 Q= [yi-(b xi+a )]2 的最小值而得出回
i=1
归直线的方法, 即求回归直线, 使得样本数据的点到它 的距离的平方和最小,这一方法叫作最小二乘法.
复习目标 课前预习 高频考点 课时小结
- x· y xiyi-n-
i =1
n
(5) 相关系数: r=
n 2 2 -2 xi -n- x y2 i -n y i=1 i=1
高频考点
课时小结
解析 (1)从甲校抽取 110× 1 000
1 200 1 200+1 000
=60(人),
从乙校抽取 110× 故 x=10,y=7.
1 200+1 000
=50(人),
复习目标
课前预习
高频考点
课时小结
1学成绩的优秀率为50×100%=40%. (3)表格填写如图,
甲校 优秀 非优秀 总计 乙校 总计
复习目标
课前预习
高频考点
课时小结
参考数据与公式:
2 n ( ad - bc ) 由列联表中数据计算K2= . (a+b)(c+d)(a+c)(b+d)
临界值表
P(K2≥k0) k0 0.10 0.05 0.010
2.706 3.841 6.635

11.3变量的相关性

11.3变量的相关性

1.变量间的相关关系2.散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图.3.回归直线方程与回归分析(1)直线方程y ^=a +bx ,叫做Y 对x 的回归直线方程,b 叫做回归系数.要确定回归直线方程,只要确定a 与回归系数b .(2)用最小二乘法求回归直线方程中的a ,b 有下列公式 b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a ^ =y -b ^x a ^ ,b ^表示是按最小二乘法求得的a ,b 的估计值. (3)相关性检验①计算相关系数r ,r 具有以下性质:|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱;②|r |>r 0.05,表明有95%的把握认为x 与Y 之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义. 4.独立性检验 (1)2×2列联表:BB合计A n 11 n 12 n 1+ A n 21 n 22 n 2+ 合计n +1n +2n其中n 1+=n 11+n 12,n 2+=n 21+n 22,n +1=n 11+n 21,n +2=n 12+n 22,n =n 11+n 12+n 21+n 22. (2)χ2统计量: χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.(3)两个临界值:3.841与6.635当χ2>3.841时,有95%的把握说事件A 与B 有关; 当χ2>6.635时,有99%的把握说事件A 与B 有关; 当χ2≤3.841时,认为事件A 与B 是无关的. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )(4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( × )(5)变量X ,Y 关系越密切,则由观测数据计算得到的χ2越大.( √ )(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( × )1.(2015·湖北)已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关 答案 C解析 因为y =-0.1x +1,-0.1<0,所以x 与y 负相关.又y 与z 正相关,故可设z =ay +b (a >0),所以z =-0.1ax +a +b ,-0.1a <0,所以x 与z 负相关.故选C. 2.下面是2×2列联表:y 1 y 2 合计 x 1a2173x 2 22 25 47 合计b46120则表中a ,b 的值分别为( )A .94,72B .52,50C .52,74D .74,52 答案 C解析 ∵a +21=73,∴a =52.又a +22=b ,∴b =74.3.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是( ) A .有99%的人认为该电视栏目优秀B .有99%的人认为该电视栏目是否优秀与改革有关系C .有99%的把握认为该电视栏目是否优秀与改革有关系D .没有理由认为该电视栏目是否优秀与改革有关系 答案 D解析 只有χ2≥6.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而即使χ2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故只有D 正确.4.某产品在某零售摊位的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如下表所示:x 16 17 18 19 y50344131由上表可得回归直线方程y ^=b ^x +a ^中的b ^=-4,据此模型预测零售价为15元时,每天的销售量为( ) A .51个 B .50个 C .49个 D .48个 答案 C解析 由题意知x =17.5,y =39,代入回归直线方程得a ^=109,109-15×4=49,故选C.5.(教材改编)在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2≈27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”). 答案 有关题型一 相关关系的判断例1 (1)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1(2)对变量x ,y 有观测数据(x i ,y i ) (i =1,2,…,10),得散点图(1);对变量u 、v 有观测数据(u i ,v i ) (i =1,2,…,10),得散点图(2).由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 答案 (1)D (2)C解析 (1)所有点均在直线上,则样本相关系数最大即为1,故选D.(2)由图(1)可知,各点整体呈递减趋势,x 与y 负相关;由图(2)可知,各点整体呈递增趋势,u 与v 正相关. 思维升华 判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r >0时,正相关;r <0时,负相关.(3)回归直线方程中:b ^>0时,正相关;b ^<0时,负相关.(1)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^ =-3.476x +5.648; ③y 与x 正相关且y ^ =5.437x +8.493; ④y 与x 正相关且y ^ =-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④(2)变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( ) A .r 2<r 1<0 B .0<r 2<r 1 C .r 2<0<r 1 D .r 2=r 1答案 (1)D (2)C解析 (1)由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.(2)对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,即r 2<0,所以选C. 题型二 线性回归分析例2 (2015·课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w∑i =18(x i -x )2∑i =18(w i -w )2∑i =18(x i -x )·(y i -y )∑i =18(w i -w )·(y i -y ) 46.6563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,α^=v -β^u .解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的回归直线方程,由于d ^=∑i =18(w i -w )·(y i -y )∑i =18(w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的回归直线方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^ 取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.思维升华 (1)回归直线y ^=b ^x +a ^必过样本点的中心(x ,y ). (2)正确运用计算b ^,a ^ 的公式和准确的计算,是求回归直线方程的关键.(3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的回归直线方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入回归直线方程, 得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时. 题型三 独立性检验例3 大家知道,莫言是中国首位获得诺贝尔奖的文学家,国人欢欣鼓舞.某高校文学社从男女生中各抽取50名同学调查他们对莫言作品的了解程度,结果如下:阅读过 莫言的 作品数 (篇) 0~2526~5051~7576~100101~130男生 3 6 11 18 12 女生48131510(1)试估计该校学生阅读莫言作品超过50篇的概率;(2)对莫言作品阅读超过75篇的则称为“对莫言作品非常了解”,否则为“一般了解”.根据题意完成下表,并判断对莫言作品非常了解是否与性别有关?非常了解一般了解合计 男生 女生 合计解 (1)由抽样调查得阅读莫言作品在50篇以上的频率为11+18+12+13+15+1050+50=79100,据此估计该校学生阅读莫言作品超过50篇的概率约为79100.(2)非常了解 一般了解 合计 男生 30 20 50 女生 25 25 50 合计5545100根据列联表数据得 χ2=100×(30×25-20×25)250×50×55×45≈1.010<3.841,所以对莫言作品是否非常了解与性别无关.思维升华 (1)独立性检验的关键是正确列出2×2列联表,并计算出χ2的值.(2)弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析. 解 (1)2×2列联表如下:主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(2)因为χ2=30×(4×2-16×8)212×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.22.求回归直线方程的方法技巧典例 (12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2006 2008 2010 2012 2014 需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=b ^x +a ^; (2)利用(1)中所求出的回归直线方程预测该地2016年的粮食需求量. 规范解答解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据处理如下:年份-2010 -4 -2 0 2 4 需求-257-21-111929对处理的数据,容易算得x =0,y =3.2,[4分] b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02=26040=6.5, a ^=y -b ^x =3.2.[6分]由上述计算结果,知所求回归直线方程为 y ^-257=6.5(x -2010)+3.2, 即y ^=6.5(x -2010)+260.2.[8分](2)利用所求得的回归直线方程,可预测2016年的粮食需求量大约为6.5×(2016-2010)+260.2=6.5×6+260.2=299.2(万吨).[12分]温馨提醒 求回归直线方程时,重点考查的是计算能力.若本题用一般法去解,计算更烦琐(如年份、需求量,不做如上处理),所以平时训练时遇到数据较大的题目时,要考虑有没有更简便的方法解决.[方法与技巧]1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程.2.根据χ2的值可以判断两个事件有关的可信程度. [失误与防范]1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量χ2的值的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.A 组 专项基础训练 (时间:45分钟)1.(2014·湖北)根据如下样本数据x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0, 当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H :“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的χ2≈3.918,则下列表述中正确的是( )A .有95%的把握认为“这种血清能起到预防感冒的作用”B .若有人未使用该血清,那么他在一年中有95%的可能性得感冒C .这种血清预防感冒的有效率为95%D .这种血清预防感冒的有效率为5% 答案 A解析 由题意可知,有95%的把握认为“这种血清能起到预防感冒的作用”. 3.在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求回归直线方程; ④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x ,y 具有线性相关结论,则在下列操作顺序中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①答案 D解析 对两个变量进行回归分析时,首先收集数据(x i ,y i ),i =1,2,…,n ;根据所搜集的数据绘制散点图. 观察散点图的形状,判断线性关系的强弱, 求相关系数,写出回归直线方程, 最后对所求出的回归直线方程作出解释; 故正确顺序是②⑤④③①.4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 ∵0.85>0,∴y 与x 正相关,∴A 正确; ∵回归直线经过样本点的中心(x ,y ),∴B 正确; ∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85, ∴C 正确.故选D.5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:可得χ2=110×(40×30-20×20)260×50×60×50≈7.8,则下列结论正确的是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 答案 A解析 根据独立性检验的定义,由χ2≈7.8>6.635可知,我们有99%以上的把握认为“爱好该项运动与性别有关”,故选A.6.已知x 与y 之间的几组数据如下表:假设根据上表数据所得回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b ^>b ′,a ^>a ′ B.b ^ >b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′答案 C解析 b ′=2,a ′=-2,由公式b ^=∑i =16(x i -x )(y i -y )∑i =16(x i -x )2求得,b ^ =57,a ^ =y -b ^ x =136-57×72=-13,∴b ^ <b ′,a ^ >a ′.7.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位; ④对事件X 与Y 的随机变量χ2的值来说,χ2越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,随机变量χ2越小,说明两个相关变量有关系的把握程度越小. 8.某班班主任对全班30名男生进行了“认为作业量多少”的调查,数据如下表:该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种有________的把握. 答案 95% 解析 计算得χ2=30×(12×8-2×8)214×16×20×10≈4.286>3.841,则推断有95%的把握.9.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下表的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少? 解 (1)列表b ^=∑5i =1x i y i -5x y∑5i =1x 2i-5x 2=112.3-5×4×590-5×42=1.23,于是a ^=y -b ^x =5-1.23×4=0.08. 所以回归直线方程为y ^=1.23x +0.08.(2)当x =12时,y ^=1.23×12+0.08=14.84(万元), 即估计使用12年时,维修费用是14.84万元.10.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?解 (1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为360500×100%=72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为320500×100%=64%.(2)完成的2×2列联表如下:χ2=1 000×(360×180-320×140)2500×500×680×320=7.352>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.B 组 专项能力提升 (时间:30分钟)11.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个回归直线方程y ^=3-5x ,变量x 增加1个单位时,y 平均增加5个单位;③设具有相关关系的两个变量x ,y 的相关系数为r ,则|r |越接近于0,x 和y 之间的线性相关程度越强; ④在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量间有关联的把握就越大. 以上,错误结论的个数为( ) A .0 B .1 C .2 D .3 答案 C解析 方差反应一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;在回归直线方程y ^ =3-5x 中,变量x 增加1个单位时,y 平均减小5个单位,故②不正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,|r |越接近于1,相关程度越强,故③不正确;对分类变量x 与y 的随机变量χ2来说,χ2越大,“x 与y 有关系”的可信程度越大,故④正确.综上所述,错误结论的个数为2,故选C.12.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^ ,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( ) A.116 B.18 C.14 D.12 答案 B解析 依题意可知样本点的中心为⎝⎛⎭⎫34,38,则38=13×34+a ^ ,解得a ^ =18.13.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:乙班 c 30 合计已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,有95%的把握能认为“成绩与班级有关系”D .根据列联表中的数据,认为“成绩与班级没有关系” 答案 C解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据, 得到χ2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,所以选项C 正确.因此有95%的把握认为“成绩与班级有关系”.14.某百货公司1~6月份的销售量x 与利润y 的统计数据如下表:月份 1 2 3 4 5 6 销售量x (万件) 10 11 13 12 8 6 利润y (万元)222529261612(1)根据2~5月份的数据,画出散点图,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?解 (1)根据表中2~5月份的数据作出散点图,如图所示:计算得x =11,y =24,∑5i =2x i y i =11×25+13×29+12×26+8×16=1 092,∑5i =2x 2i =112+132+122+82=498,则b ^=∑5i =2x i y i -4x y ∑5i =2x 2i -4x2=1 092-4×11×24498-4×112=187, a ^ =y -b ^ x =24-187×11=-307.故y 关于x 的回归直线方程为y ^ =187x -307.(2)当x =10时,y ^ =187×10-307=1507,此时|1507-22|<2;当x =6时,y ^=187×6-307=787, 此时|787-12|<2.故所得的回归直线方程是理想的.15.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断“生产能手与工人所在的年龄组是否有关”?解 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.05=2(人),记为B 1,B 2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以得χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)=100×(15×25-15×45)260×40×30×70=2514≈1.786.因为1.786<3.841.所以认为“生产能手与工人所在的年龄组没有关系”.。

高中数学 第2讲变量的相关性、回归分析及独立性检验

高中数学 第2讲变量的相关性、回归分析及独立性检验

第2讲 变量的相关性、回归分析及独立性检验一、知识回顾1.如何判断两个变量的线性相关:如果在散点图中,2个变量数据点分布在一条直线附近,则这2个变量之间具有线性相关关系。

2.所求直线方程 ˆy=bx +a 叫做回归直线方程;其中 ⋅∑∑∑∑nnii i ii=1i=1nn222iii=1i=1(x-x)(y -y)x -nx yb ==,a =y -bx (x-x)x-nxy回归直线方程必过中心点(,)x y3.相关系数的∑nii (x-x)(y -y)r =性质• (1)|r|≤1.(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.4. ˆˆ=-i i y y i 残差e=实际值-预测值2^^211()===-∑∑nniiii i e y y 总残差平方和:残差平方和越小,即模型拟合效果越好5. 两个分类变量的独立性检验:(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下计算随机变量 22n(ad -bc)K =(a +b)(c +d)(a +c)(b +d)(3) 根据随机变量K 2查表得“两个分类变量没有关系”的概率,用1减去此概率即得有联系的概率 典型例题:例1.(宁夏海南卷)对变量x, y 有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断( )。

(A )变量x 与y 正相关,u 与v 正相关 (B )变量x 与y 正相关,u 与v 负相关 (C )变量x 与y 负相关,u 与v 正相关 (D )变量x 与y 负相关,u 与v 负相关1x 1y 1u 1v变式1. (韶关一模文、理)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性作试验,)()A 甲 ()B 乙 ()C 丙 ()D 丁 例2.一系列样本点(,)(1,2,,)=⋅⋅⋅i i x y i n 的回归直线方程为23,∧=-y x 若117==∑nii X则1==∑ni i y变式1.某地第二季各月平均气温(℃)与某户用水量(吨)如下表,根据表中数据,用最小二乘法求得用水量关于月平均气温的线性回归方程是( )A B. C. D. 例3.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程ˆˆy bxa =+; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3 2.543546 4.566.5⨯+⨯+⨯+⨯=)例4.(惠州一模)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪x y y x 5.115ˆ-=x y5.115.6ˆ-=x y 5.112.1ˆ-=x y5.113.1ˆ-=x y0.0005300035000.00030.0004200015000.00020.0001400025001000月收入(元)频率/组距 第2讲 变量的相关性、回归分析及独立性检验课后作业:姓名: 学号:1.若施化肥量x 与小麦产量y 之间的回归直线方程为ˆ2504yx =+,当施化肥量为50kg 时,预计小麦产量为2.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1 2 3 4用水量y5.443 5.2由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是a x y +-=∧7.0,则=a3.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A .57.2 3.6B .57.2 56.4C .62.8 63.6D .62.8 3.64.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .6B .6C .66D .6.55.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ) A.5,10,15,20,25 B.2,4,8,16,32 C.1,2,3,4,5 D.7,17,27,37,476.(广州调研文、理)某校对全校男女学生共1600名进行健康调查,选用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是 人.7. (韶关一模文、理)一个社会调查机构就某地居民的 月收入调查了10000人,并根据所得数据画了样本的频率分 布直方图(如下图)。

数据分析中的相关性和因果性的区别

数据分析中的相关性和因果性的区别

数据分析中的相关性和因果性的区别数据分析在当今社会中扮演着越来越重要的角色。

通过对大量数据的收集、整理和分析,我们可以从中发现一些有趣的规律和趋势。

在数据分析中,相关性和因果性是两个重要的概念。

虽然它们经常被混淆使用,但它们实际上有着明显的区别。

相关性是指两个或多个变量之间的关系。

当两个变量之间存在相关性时,它们的变化趋势可能是一致的,即当一个变量增加时,另一个变量也会增加(正相关),或者一个变量增加时,另一个变量会减少(负相关)。

相关性可以通过计算相关系数来衡量,最常用的是皮尔逊相关系数。

例如,研究人员可能发现,一个城市的人口数量与该城市的犯罪率之间存在正相关关系,即人口越多,犯罪率越高。

然而,相关性并不意味着因果关系。

相关性只是表明两个变量之间存在某种关系,但并不能确定其中一个变量的变化是导致另一个变量发生变化的原因。

换句话说,相关性只是一种观察到的现象,并不能说明其中的因果关系。

在前面的例子中,人口数量和犯罪率之间的正相关并不能说明人口数量的增加是导致犯罪率增加的原因。

可能有其他因素,例如经济状况、社会福利等,导致了这种相关性的存在。

因果性是指一个事件或变量的改变是由另一个事件或变量的改变引起的。

在数据分析中,确定因果关系是非常困难的,因为我们很难排除其他可能的因素。

为了确定因果关系,我们需要进行实验研究,通过控制其他变量的影响,仅改变一个变量,然后观察结果的变化。

只有在重复实验中,我们能够观察到相同的结果,才能得出因果关系的结论。

举一个简单的例子来说明相关性和因果性之间的区别。

假设有一个研究发现,人们在夏天更喜欢吃冰淇淋,并且在夏天的犯罪率也更高。

这里存在一个相关性,即冰淇淋的销量和犯罪率之间存在正相关关系。

然而,这并不能说明吃冰淇淋导致了犯罪率的增加,而更可能是由于夏天天气炎热,人们更喜欢吃冰淇淋的同时,也更容易发生犯罪行为。

在实际的数据分析中,我们经常需要区分相关性和因果性。

相关性可以帮助我们发现一些有趣的关联关系,但不能用来解释其中的因果关系。

利用SPSS软件分析变量间的相关性

利用SPSS软件分析变量间的相关性

利用SPSS软件分析变量间的相关性利用SPSS软件分析变量间的相关性引言SPSS(Statistical Package for the Social Sciences)是一款功能强大的统计软件,广泛应用于统计学、社会科学研究以及市场调研等领域。

利用SPSS软件可以对数据进行有效的整理、分析和可视化展示。

其中,分析变量之间的相关性是一个重要的统计问题,能够帮助我们揭示变量之间的关联性和趋势。

本文将介绍如何使用SPSS软件进行变量相关性分析,并通过实例进行详细说明。

一、相关性的概念和意义相关性是指两个或多个变量之间的关联程度。

在统计学中,我们常用相关系数来衡量变量之间的相关性。

变量之间的相关性分为正相关、负相关和无相关三种情况。

正相关表示两个变量的值趋势向着同一方向变化;负相关表示两个变量的值趋势向着相反的方向变化;无相关表示两个变量之间没有明显的变化趋势。

变量间的相关性分析在许多领域都具有重要的意义。

在市场调研中,通过分析产品价格与销量之间的相关性,可以帮助企业优化定价策略;在医学研究中,分析某种药物的剂量与疗效之间的相关性,可以指导药物的使用和治疗方案的制定。

二、SPSS软件基础操作在进行相关性分析之前,我们首先需要掌握SPSS软件的基础操作。

以下是常用的几个操作步骤:1. 导入数据:在SPSS软件中,我们可以通过导入Excel表格、CVS文件等方式将数据导入软件中。

2. 创建变量:在导入数据后,有时需要创建新的变量。

例如,在分析一个销售数据表格时,我们可以通过销售额除以销售数量来创建一个新的变量,表示平均每笔交易的金额。

3. 数据整理:为了进行相关性分析,我们有时需要对数据进行整理和清洗。

例如,去掉重复值、缺失值或异常值。

4. 变量选择:根据需要,我们可以选择特定的变量进行相关性分析。

三、SPSS软件中的相关性分析在SPSS软件中,相关性分析是一个比较简单的操作。

以下是基本的步骤:1. 打开SPSS软件,选择“Analyze(分析)”菜单栏,再选择“Correlate(相关性)”,点击“Bivariate(双变量)”。

相关性分析

相关性分析

相关性分析简介相关性分析是统计学中常用的一种方法,用于研究两个或多个变量之间的关系强度和方向。

相关性分析可以帮助我们了解变量之间的线性关系,帮助我们做出预测和推断。

在数据分析领域,相关性分析是一个重要的工具。

通过分析变量之间的相关性,我们可以揭示变量之间的关联程度,从而为我们的决策提供依据。

相关性分析可以应用于各种领域,包括金融、市场营销、医疗保健等。

相关性分析的方法1. 相关系数相关系数是衡量两个变量之间相关性的度量指标。

常见的相关系数有皮尔逊相关系数、斯皮尔曼相关系数和切比雪夫相关系数等。

这些相关系数的取值范围通常在-1到1之间。

当相关系数接近1时,表示两个变量正相关;当相关系数接近-1时,表示两个变量负相关;当相关系数接近0时,表示两个变量无相关性。

1.1 皮尔逊相关系数皮尔逊相关系数是最常见的相关系数之一,用于衡量两个变量之间的线性关系强度和方向。

皮尔逊相关系数的取值范围在-1到1之间,其中-1表示完全负相关,0表示无相关性,1表示完全正相关。

计算皮尔逊相关系数的公式如下:Pearson correlation coefficient = Cov(X, Y) / (std(X) * std(Y))1.2 斯皮尔曼相关系数斯皮尔曼相关系数,也称为秩相关系数,用于衡量两个变量之间的非线性关系。

斯皮尔曼相关系数的计算是基于变量的秩次,而不是变量的原始数值。

计算斯皮尔曼相关系数的公式如下:ρ = 1 - (6 * ∑(d^2) / (n * (n^2 -1)))其中,d是X和Y的秩次差,n是样本的数量。

2. 相关性分析的应用相关性分析可以帮助我们了解变量之间的关系,从而找出变量之间的规律和趋势。

在实际应用中,相关性分析具有广泛的用途。

2.1 金融领域在金融领域,相关性分析可以帮助我们了解各个金融指标之间的关系。

例如,我们可以分析利率和股市指数之间的相关性,以确定利率对股市的影响。

相关性分析还可以用于构建投资组合,通过分析各个投资品种之间的相关性,来降低投资组合的风险。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

变量的相关性
1.变量间的相关关系
(1)散点图 将样本中 n 个数据点xi ,yi )(i =1,2,…,n )描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.
(2)正相关、负相关
①散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种关系称为正相关
②散点图中各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值却由大变小,这种关称为负相关
2.两个变量的线性相关
(1)线性相关关系
观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线的求法
设具有线性相关关系的两个变量x ,y 的一组观察值为(x i ,y i )(i =1,2,…,n ),则回归直线方程y ^=b ^x +a ^的系数为:
其中x -=11n i i X n =∑ , y -=11n i i Y n =∑ , (x -,y -
)称作样本点的中心
考点1 利用回归直线方程对总体进行估计
例2:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x (吨)与相应的生
(1)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程y ^=b ^x +a ^;
(2)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)?
(1)1
n i
i x =∑y i =3×2.5+4×3+5×4+6×4.5=66.5, x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5, 1
n
i x =∑2i =32+42+52+62=86. b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81
=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35. 故线性回归方程为y ^=0.7x +0.35.
(3)根据回归方程的预测,现在生产 100 吨产品消耗的标准煤的数量为:0.7×100+0.35=70.35(吨), 故耗能减少了 90-70.35=19.65(吨).
1.下列两个变量之间的关系哪个不是函数关系( )
A .角度和它的余弦值
B .正方形边长和面积
C .正 n 边形的边数和它的内角和
D .人的年龄和身高
2.有关线性回归的说法,不正确的是( )
A .相关关系的两个变量是非确定关系
B .散点图能直观地反映数据的相关程度
C .回归直线最能代表线性相关的两个变量之间的关系
D .散点图中的点越集中,两个变量的相关性越强
3.(2011 辽宁)调查某地若干户家庭的年收入 x (单位:万元)和年饮食支出 y (单位:万元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程: =0.254x +0.321. 由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加_______万元.
4.已知 x ,y 之间的一组数据如下:则线性回归方程y ^=b ^x +a ^所表示的直线必经过点_______
5. 对变量 x ,y 有观测数据(xi ,yi )(i =1,2,…,10),得散点图 15-2-5(1);对变量 u ,v 有观测数据((ui ,vi )(i =1,2,…,10),得散点图 15-2-5(2). 由这两个散点图可以判断( )
A .变量 x 与 y 正相关,u 与 v 正相关
B .变量 x 与 y 正相关,u 与 v 负相关
C .变量 x 与 y 负相关,u 与 v 正相关
D .变量 x 与 y 负相关,u 与 v 负相关
y ^。

相关文档
最新文档