2020高考数学大一轮复习第十一章统计与统计案例3第3讲变量间的相关关系统计案例练习理含解析
高考数学(理)一轮复习课件:统计与概率-3变量间的相关关系与统计案例(人教A版)

第3课时 变量间的相关关系与统计案例
考纲下载 1.会作两个有关联变量的数据的散点图,会利用散点 图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方 程系数公式建立线性回归方程.
3.了解独立性检验(只要求 2×2 列联表)的基本思想、 方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
y2 总计
x1
a
x2
2
总计 b
21 73 25 27 46
则表中a、b处的值分别为( )
A.94、96
B.52、50
C.52、54
D.54、52
答案:C 解析:a=73-21=52,b=a+2=54,故选C.
5. [原创]某医疗研究所为了了解某种血清预防感冒的 作用,把 500 名使用过血清的人与另外 500 名未使用血清 的人一年中的感冒记录作比较,提出假设 H0:“这种血清 不能起到预防感冒的作用”,利用 2×2 列联表计算得 K2 ≈3.918,经查临界值表知 P(K2≥3.841)≈0.05.则下列结论 中,正确结论的序号是________.
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
随机变量 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d), 其中 n=a+b+c+d 为样本容量.
(3)独立性检验 利用随机变量 K2 来确定在多大程度上可以认为“两
个分分类类变变量量有有关关系系”的方法称为两个分类变量的独立性
nn
(xi - x )(y i- y )
ii==11
为:^b=
, ^a=y-y---^b^bx-x- .
高三数学(文)一轮复习课件:变量间的相关关系、统计案例

某商品销售量 y(件)与销售价格 x(元/件)负相关,
则其回归方程可能是( )
A. yˆ 10x 200
B. yˆ 10x 200
C. yˆ 10x 200
D. yˆ 10x 200
【解析】 ∵商品销售量 y(件)与销售价格 x(元/件)负相 关,∴a<0,排除 B,D.又∵x=0 时,y>0 ,∴排除 C,答案为 A. 【答案】 A
10.3 变量间的相关关系、统计案例
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从 左下角 到 右上角 的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 左上角 到 右下角 的区域,对于 两个变量的这种相关关系,我们将它称为负相关.
2/18/2020
和b为模型的_未__知__参__数___,_e__称为随机误差.
2/18/2020
(4)相关系数
n
xi- x yi- y
i=1
n
n
xi- x 2 yi- y 2
i=1
i=1
①r=____________________________;
②当r>0时,表明两个变量__正__相__关__; 当r<0时,表明两个变量__负__相___关__.
2/18/2020
有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,85
分以下为非优秀统计成绩后,得到如下的列联表.
优秀
非优秀
总计
甲班
10
乙班
30
合计 105
已知从全部 105 人中随机抽取 1 人为优秀的概率为 2 . 7
(1)请完成上面的列联表;
2020届高考数学理一轮考点测试变量间的相关关系与统计案例

z= ln c+ kx.因为 z= 0. 3x+4,所以 ln c= 4,所以 c= e4.
二、高考小题
7.(2017 ·山东高考 ) 为了研究某班学生的脚长 x( 单位:厘米 ) 和身高 y( 单位:厘米 ) 的关系,从该班随机抽
取 10 名学生,根据测量数据的散点图可以看出
y 与 x 之间有线性相关关系.设其回归直线方程为
i=1
10i =1
10
1 10
∵ yi = 1600,∴
i=1
y
=
10
i
=
yi
1
=
160
.
又b^= 4,∴ a^= y - b^ x = 160-4×22. 5= 70.
∴回归直线方程为 y^= 4x+ 70. 将 x= 24 代入上式得 y^=4×24+ 70= 166. 故选 C. 8.(2017 ·全国卷Ⅲ ) 某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2016 年 12 月期间月接待游客量 ( 单位:万人 ) 的数据,绘制了下面的折线图.
2014 年 1 月至
根据该折线图,下列结论错误的是 (
)
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在 7, 8 月
D.各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳
答案 A
解析 对于选项 A,由图易知月接待游客量每年 7, 8 月份明显高于 12 月份,故 A 错;对于选项 B,观察折线
A, B 两变量有更强的线性相关性.故选 D.
4.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有
2020届高考数学一轮课件:11.3 变量的相关性、统计案例

从而可以用线性回归模型拟合y与t的关系.
考点114 考点115
考情概览
试题类编
(2)由������ = 9.732≈1.331 及(1)得
^7
������
=
������=∑1(ti-t)(yi-y)
7
∑
(������������-������)2
=
22.889≈0.103,
i=1
^^
������ = ������ − ������ ������≈1.331-0.103×4≈0.92.
������=∑������1(������������-������)2������=∑������1(������������-������)2
回归方程^������
=
^
������
+
^
������t
^
中斜率和截距最小二乘估计公式分别为������
=
^ ^ ������
������=∑1(������������-������)(������������-������)
������=1
������=1
^
������
=
������������������ ������������������
=
1120=1.2,^������
=
������
−
^
������ ������=7.2-1.2×3=3.6,故所求回归方程为
^������=1.2t+3.6.
考点114 考点115
纯收入.
^
附:回归直线的斜率和截距的最小二乘估计公式分别为������ =
^ ^ n
i=∑1(������������-������)(������������-������) ������=∑������1(������������-������)2
第3讲 变量间的相关关系与统计案例

K
2
a b a c c d b d
n ad bc
2
[审题视点] 第(2)问由a=40,b=30,c=160,d=270,代 入公式可求K2,由K2的值与6.635比较断定.第(3)问从抽样 方法说明.
6.独立性检验 (1)用变量的不同“值”表示个体所属的不同类别,这种变量 称为分类变量.例如:是否吸烟,宗教信仰,国籍等. (2)列出的两个分类变量的频数表,称为列联表. (3)一般地,假设有两个分类变量X和Y,它们的值域分别为 {x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 2×2列联表 y1 y2 总计 x1 a b a+b x2 总计 c a+c c+d b+d a+b+c+d d
解析 从散点图看,散点图的分布成团状,无任 何规律,所以两个变量不具有线性相关关系.
考向二
独立性检验
【例2】(2010·全国新课标)为调查某地区老年人是否需要志愿者 提供帮助,用简单随机抽样方法从该地区调查了500位老年人, 结果如下: 性别
是否需要志愿者 需要 不需要 男 女 40 160 30 270
从散点图上看,点散布在从左下角到右上角的区域内,对 于两个变量的这种相关关系,我们将它称为正相关;点散 布在从左上角到右下角的区域内,两个变量的这种相关关 系称为负相关. 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条 直线附近,则称这两个变量之间具有线性相关关系,这 条直线叫回归直线.
5.线性回归模型 (1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误 差. (2)相关指数 用相关指数R2来刻画回归的效果,其计算公式是:
R2
y
n i 1 n i 1
2020版高考数学大一轮复习第十一章统计与统计案例第3讲变量间的相关关系、统计案例课件理新人教A版

x
0
1
3
4
y
2.2
4.3
4.8
6.7
解析:由已知得-x =2,-y =4.5,因为回归方程经过点(-x ,-y ), 所以^a=4.5-0.95×2=2.6. 答案:2.6
相关关系的判断 [典例引领]
已知变量 x 和 y 满足关系 y=-0.1x+1,变量 y 与 z 正相 关.下列结论中正确的是( ) A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关
[通关练习] 1.对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点 图如图①,对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10), 得散点图如图②.由这两个散点图可以判断( )
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关
某校为了研究学生的性别和对待某一活动的态度(支持和不
支持两种态度)的关系,运用 2×2 列联表进行独立性检验,经
计算 K2=7.069,则所得到的统计学结论是:有多少的把握认为
“学生性别与支持该活动有关系”.( )
附:
P(K2≥k0) 0.100 0.050 0.025 0.010 0.001
பைடு நூலகம்
k0 A.0.1%
2.706
3.841 5.024 B.1%
6.635
10.828
C.99%
D.99.9%
解析:选 C.因为 7.069 与附表中的 6.635 最接近,所以得到的 统计学结论是:有 1-0.010=0.99=99%的把握认为“学生性 别与支持该活动有关系”.
高考数学大一轮复习第十一章统计与统计案例11_3变量间的相关关系、统计案例教师用书理新人教版
第十一章统计与统计事例11.3变量间的有关关系、统计事例教师用书理新人教版1.两个量的性有关(1)正有关在散点中,点分布在从左下角到右上角的地区,于两个量的种有关关系,我将它称正有关.(2)有关在散点中,点分布在从左上角到右下角的地区,两个量的种有关关系称有关.(3)性有关关系、回直假如散点中点的分布从整体上看大概在一条直邻近,就称两个量之拥有性有关关系,条直叫做回直.2.回方程(1)最小二乘法求回直,使得本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)回方程^^^方程 y = b x+ a 是两个拥有性有关关系的量的一数据( x,y ) ,( x,y ) ,⋯, ( x,1122n ^^y n)的回方程,此中 a ,b 是待定参数.n n∑ x i- xy i- y∑ x i y i-n x y^b =i =1i = 1,n=n∑x i- x22- n x2∑ x ii =1i = 1^^a = y -b x .3.回剖析(1)定:拥有有关关系的两个量行剖析的一种常用方法.(2)本点的中心于一拥有性有关关系的数据( x1,y1) ,( x2,y2) ,⋯, ( x n,y n) ,此中 ( x,y ) 称本点的中心.(3)有关系数当r >0时,表示两个变量正有关;当 r <0时,表示两个变量负有关.r 的绝对值越靠近于1,表示两个变量的线性有关性越强.r 的绝对值越靠近于0,表示两个变量之间几乎不存在线性有关关系.往常| r | 大于 0.75 时,以为两个变量有很强的线性有关性.4.独立性查验(1)分类变量:变量的不一样“值”表示个体所属的不一样类型,像这种变量称为分类变量.(2) 列联表:列出两个分类变量的频数表,称为列联表.假定有两个分类变量X 和,它们的Y可能取值分别为 { x1,x2} 和{ y1,y2} ,其样本频数列联表( 称为 2×2列联表 ) 为2×2列联表y1y2总计x 1a b+a bx2c d c+d总计a+ c b+ d a+ b+c+ dn ad- bc 2结构一个随机变量2=,此中=+++d 为样本容K a+ b c+ d a+ c b+ d n a b c量.(3) 独立性查验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性查验.【思虑辨析】判断以下结论能否正确( 请在括号中打“√”或“×”)(1)有关关系与函数关系都是一种确立性的关系,也是一种因果关系.(×)(2)“名师出高徒”能够解说为教师的教课水平与学生的水平成正有关关系.(√ )(3)只有两个变量有有关关系,所获得的回归模型才有展望价值.(√)^(4)某同学研究卖出的热饮杯数y 与气温 x(℃)之间的关系,得回归方程y =-2.352 x +147.767 ,则气温为 2℃时,必定可卖出 143 杯热饮. (×)(5)事件 X, Y 关系越亲密,则由观察数据计算获得的K2的观察值越大. (√)(6)由独立性查验可知,有 99%的掌握以为物理成绩优异与数学成绩有关,某人数学成绩优异,则他有 99%的可能物理优异. (× )^1.(2015 ·湖北 ) 已知变量x 和 y 知足关系 y =-0.1 x+1,变量 y 与 z 正有关.以下结论中正确的选项是 ()A.x与y正有关,x与z负有关B.x与y正有关,x与z正有关C.x与y负有关,x与z负有关D.x与y负有关,x与z正有关答案C^^^分析因为 y =-0.1x+1,-0.1<0,所以 x 与 y 负有关.又 y 与 z 正有关,故可设 z = b y^^^^^^^+ a ( b >0),所以 z =-0.1 b x+b + a ,-0.1 b <0,所以 x 与 z 负有关.应选 C.2. ( 教材改编 ) 下边是 2×2列联表:则表中a, b 的值分别为()y1y2共计x1a2173x2222547共计b46120A. 94,72 B . 52,50 C . 52,74 D . 74,52答案C分析∵ a+21=73,∴ a=52.又 a+22= b,∴ b=74.3.(2016 ·河南八市质检 ) 为了研究某大型商场当日销售额与开业天数的关系,随机抽取了 5天,其当日销售额与开业天数的数据以下表所示:开业天数 x1020304050当日销售额 y/万元62758189^依据上表供给的数据,求得y 对于 x 的线性回归方程为y=0.67 x+54.9,因为表中有一个数据模糊看不清,请你推测出该数据的值为()A.67 B .68 C .68.3 D .71答案B分析设表中模糊看不清的数据为10+ 20+ 30+ 40+ 50m,因为 x == 30,5^又样本中心点( x,y ) 在回归直线y= 0.67 x+ 54.9 上,m+307所以 y ==0.67×30+54.9,得m=68,应选 B.54.(2017 ·湖南三校联考) 某产品在某零售摊位的零售价x(单位:元)与每日的销售量y(单位:个 ) 的统计资料以下表所示:x16171819y50344131^^^^15 元时,每日的销售由上表可得线性回归方程y= bx+ a中的 b=-4,据此模型展望零售价为量为 ()A.51 个 B .50个 C .49个 D .48个答案C分析由题意知x= 17.5 ,y= 39,代入线性回归方程得^a=109,109-15×4=49,应选 C.Y 能否有关系,经过查阅5.(2016 ·玉溪一中月考) 利用独立性查验来判断两个分类变量X和下表来确立“X 和Y 有关系”的可信度.为了检查用电脑时间与视力降落能否有关系,现从某地网民中抽取100 位居民进行检查.经过计算得K2≈3.855,那么就有________%的掌握认为用电脑时间与视力降落有关系.P( K2≥ k0)0.050.0250.0100.0050.001k0 3.841 5.024 6.6357.87910.828答案95分析依据表格发现 3.855>3.841,3.841对应的是0.05 ,所以依据独立性查验原理可知有95%的掌握以为用电脑时间与视力降落有关系.题型一有关关系的判断例 1 (1) 四名同学依据各自的样本数据研究变量x, y之间的有关关系,并求得线性回归方程,分别获得以下四个结论:^①y 与 x 负有关且 y=2.347 x-6.423;^②y 与 x 负有关且 y=-3.476 x+5.648;^③y 与 x 正有关且 y=5.437 x+8.493;^④y 与 x 正有关且 y=-4.326 x-4.578.此中必定不正确的结论的序号是()A.①②B.②③C.③④D.①④(2) x 和 y 的散点 如 所示, 以下 法中所有正确命 的序号 ________.① x ,y 是 有关关系;^^^②在 有关关系中,若用y = c 1e c 2 x 合 的有关系数的平方2r 1,用 y = bx + a 合 的有关系数的平方222r 2, r 1 >r 2;③ x 、y 之 不可以成立 性回 方程.答案(1)D(2) ①②^^^^^分析(1) 由 性回 方程 y = bx +a 知当 b >0 ,y 与 x 正有关,当b <0 ,y 与 x 有关,∴①④必定 .^ ^^(2) ① 然正确;由散点 知,用 y = c 1e c 2x 合的成效比用 y = b x + a 合的成效要好,故②正确; x , y 之 能成立 性回 方程,只不 精度不高,故③不正确.思 升 判断两个 量正、 有关性的方法(1) 画散点 :点的分布从左下角到右上角,两个 量正有关;点的分布从左上角到右下角,两个 量 有关.(2) 有关系数: r >0 ,正有关; r <0 , 有关.^^(3) 性回 方程中: b >0 ,正有关; b <0 , 有关.(1) 在一 本数据 ( x 1,y 1) , ( x 2, y 2) ,⋯, ( x n ,y n )( n ≥2, x 1, x 2,⋯, x n 不1全相等 ) 的散点 中,若所有 本点( x i , y i )( i = 1,2 ,⋯, n ) 都在直 y = 2x + 1 上,本数据的 真有关系数()1A .-1B .0C. 2 D .1(2) 量 X 与 Y 相 的一 数据(10,1) ,(11.3,2),(11.8,3) ,(12.5,4),(13,5) ; 量U 与 V 相 的一 数据(10,5) ,(11.3,4) ,(11.8,3),(12.5,2) ,(13,1).r 1 表示 量 Y 与 X 之 的 性有关系数, r 2 表示 量 V 与 U 之 的 性有关系数, ()A . r 2<r 1< 0B . 0< r 2<r 1C . r 2<0< r 1D . r 2= r 1答案 (1)D (2)C分析 (1) 所有点均在直 上, 真有关系数最大,即1,故 D.(2) 于 量 Y 与 X 而言, Y 随 X 的增大而增大,故Y 与 X 正有关,即 r 1> 0; 于 量V 与U而言, V 随U的增大而减小,故V 与U负有关,即r 2<0,应选 C.题型二线性回归剖析例2(2016 ·全国丙卷) 以下图是我国2008 年至2014 年生活垃圾无害化办理量( 单位:亿吨)的折线图.注:年份代码17 分别对应年份2008- 2014.(1) 由折线图看出,可用线性回归模型拟合y 与 t 的关系,请用有关系数加以说明;(2)成立 y 对于 t 的回归方程(系数精准到0.01),展望2016年我国生活垃圾无害化办理量.附注:777参照数据:y i=9.32,t i y i=40.17,y i- y2= 0.55 , 7≈2.646.i = 1i =1i = 1nt i- t y i- yi= 1参照公式:有关系数r =,n nt i- t2y i- y2i = 1i = 1^^^回归方程 y= a+bt 中斜率和截距的最小二乘预计公式分别为:nt i- t y i- y^i = 1^^b=, a= y -b t .n2t i- ti= 1解 (1) 由折线图中数据和附注中参照数据得77t =4,( t i-t ) 2= 28,y i- y2= 0.55.i =1i = 1777( t i-t)( y i-y ) =t i y i-t y i=40.17-4×9.32 = 2.89 ,i = 1i = 1i =12.89所以r≈0.55 ×2×2.646≈0.99.因为 y 与 t 的有关系数近似为0.99 ,说明y与t的线性有关程度相当高,进而能够用线性回模型合y 与 t 的关系.7t i- t y i- y9.32^i = 1 2.89(2) 由y=7≈1.331 及(1) 得b=7=28≈0.103 ,t i- t2i =1^^a= y - b t ≈1.331-0.103×4≈0.92.^所以 y 对于 t 的回方程 y=0.92+0.10 t .^将 2016 年的t =9代入回方程得y=0.92+0.10×9=1.82.所以2016 年我国生活垃圾无害化理量将 1.82 吨.思升性回剖析的型及解方法(1)求性回方程^^①利用公式,求出回系数b, a.②待定系数法:利用回直本点的中心求系数.(2)利用回方程行,把性回方程看作一次函数,求函数.^(3) 利用回直判断正、有关;决定正有关是有关的是系数b.(4) 回方程的合成效,能够利用有关系数判断,当| r | 越近于 1 ,两量的性有关性越.(2015 · 全国Ⅰ ) 某公司确立下一年度投入某种品的宣,需认识年宣 x(位:千元)年售量y(位:t)和年利 z(位:千元)的影响,近8 年的年宣 x i和年售量 y i( i =1,2,⋯,8)数据作了初步理,获得下边的散点及一些量的.x y w8888( x i-( w i-( x i-x ) ·(y i-( w i-w ) ·(y i-i =1i = 1i =1i = 1x )2w )2y )y )46.6563 6.8289.8 1.6 1 469108.8表中=x,w=1 8w.8i=1(1)依据散点判断,y =+与y=c+d x哪一个适合作年售量y对于年宣x的a bx回方程型? ( 出判断即可,不用明原因)(2)依据 (1)的判断果及表中数据,成立y 对于 x 的回方程;(3)已知种品的年利 z 与 x, y 的关系 z=0.2 y- x.依据(2)的果回答以下:①年宣 x=49,年售量及年利的是多少?②年宣x 何,年利的最大?^^^附:于一数据( u1,v1) , ( u2,v2) ,⋯, ( u n,v n) ,其回直v=α+βu的斜率和截距的最小二乘估分nu i- u v i- v^i =1^^β=,α=v-β u.n2u i- ui= 1解 (1) 由散点能够判断,y=c+d x适合作年售量y对于年宣x的回方程型.(2) 令w=x,先成立 y 对于 w的性回方程,因为8w i- w· y i- y^i = 1108.8d === 68,8 1.6w i- wi= 1^^2c= y - d w =563-68×6.8=100.6,^^所以 y 对于 w的性回方程y =100.6+68w,所以 y 对于 x 的回方程 y =100.6+68x.(3) ①由 (2) 知,当x= 49 ,^年售量 y 的 y =100.6+6849= 576.6 ,^年利 z 的 z =576.6×0.2-49=66.32.②依据 (2) 的果知,年利z 的^z =0.2(100.6+68x)- x=- x+13.6 x+20.12.13.6^所以当 x== 6.8 ,即x= 46.24 ,z获得最大.2故年宣46.24千元,年利的最大.题型三独立性查验例 3 (2016 ·福建厦门三中模拟 ) 某大型公司人力资源部为了研究公司职工工作踊跃性和对待公司改革的关系,随机抽取了100 名职工进行检查,此中支持公司改革的检查者中,工作踊跃的有 46 人,工作一般的有 35 人,而不太同意公司改革的检查者中,工作踊跃的有 4 人,工作一般的有 15 人.(1) 依据以上数据成立一个2×2列联表;(2) 对于人力资源部的研究项目, 依据以上数据能否能够以为公司的全体职工对待公司改革的态度与其工作踊跃性有关系?参照公式: K 2=a + b( 2≥)0.50 0.40P K kk 00.45 0.70 58解 (1) 依据题设条件,得工作踊跃工作一般总计n ad -bc 2( 此中n= + + +)c +d a + cb + da bcd0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 1.32 2.0722.703.84 5.0246.6357.87910.8236182×2列联表以下:支持公司改革不太同意公司改革总计46 450 35 15 508119100(2) 提出假定:公司的全体职工对待公司改革的态度与其工作踊跃性没关.依据 (1) 中的数据,能够求得22100× 15×46-35×4K =≈7.862>6.6 35,所以有 99%的掌握以为抽样职工对待公司改革的态度与工作踊跃性有关,进而以为公司的全体职工对待公司改革的态度与其工作踊跃性有关.思想升华(1) 比较几个分类变量有关系的可能性大小的方法①经过计算 K 2 的大小判断: K 2 越大,两变量有关系的可能性越大.②经过计算 | ad - bc | 的大小判断: | ad - bc | 越大,两变量有关系的可能性越大.(2) 独立性查验的一般步骤①依据样本数据制成 2×2列联表.n ad -bc22++2k .②依据公式 K =b +cb+dc 计算 K 的观察值a ad③比较 k 与临界值的大小关系,作统计推测.(2017 ·衡阳联考 )2016 年 9 月 20 日是第 28 个全国爱牙日,为了迎接此节日,某地域卫生部门成立了检查小组,检查“常吃零食与患蛀牙的关系”,对该地域小学六年级800名学生进行检查,按患蛀牙和不患蛀牙分类,并汇总数据:不常吃零食且不患蛀牙的学生有 60 名,常吃零食但不患蛀牙的学生有100 名,不常吃零食但患蛀牙的学生有140 名.(1)可否在出错误的概率不超出0.001 的前提下,以为该地域学生常吃零食与患蛀牙有关系?(2)4 名卫生部门的工作人员随机分红两组,每组 2 人,一组负责数据采集,另一组负责数据办理,求工作人员甲分到采集数据组,工作人员乙分到办理数据组的概率.n ad- bc 2附: K2=b+ da+ b c+ d a+ cP( K2≥ k0)0.0100.0050.001k0 6.6357.87910.828解 (1) 由题意可得 2×2列联表以下:不常吃零食常吃零食总计不患蛀牙60100160患蛀牙140500640总计200600800依据 2×2列联表中数据,得K2的观察值为800× 60×500-100×1402≈16.667>10.828.k=160×640×200×600∴能在出错误的概率不超出0.001 的前提下,以为该地域学生常吃零食与患蛀牙有关系.(2)设其余工作人员为丙和丁, 4 人分组的所有状况以下表 .小组123456采集数据甲乙甲丙甲丁乙丙乙丁丙丁办理数据丙丁乙丁乙丙甲丁甲丙甲乙由表可知,分组的状况共有 6 种,工作人员甲负责采集数据且工作人员乙负责办理数据的有2 种,故工作人员甲分到采集数据组,工作人员乙分到办理数据组的概率为21== . P6324.求线性回归方程的方法技巧典例(12 分 ) 某地近来十年粮食需求量逐年上涨,下表是部分统计数据:年份20062008201020122014需求量 / 万吨236246257276286^^^(1)利用所给数据求年需求量与年份之间的线性回归方程y= bx+a;(2) 利用 (1) 中所求出的线性回归方程展望该地2016 年的粮食需求量.思想方法指导回归剖析是办理变量有关关系的一种数学方法.主要解决: (1) 确立特定量之间能否有有关关系,假如有就找出它们之间切近的数学表达式;(2)依据一组观察值,展望变量的取值及判断变量取值的变化趋向;(3)求出线性回归方程.规范解答解 (1) 由所给数据看出,年需求量与年份之间近似直线上涨,下边来求线性回归方程,先将数据办理以下表 .年份- 2010- 4- 2024需求- 257- 21- 1101929对办理的数据,简单算得x =0, y =3.2,[4 分]^-4 × - 21 +- 2 × - 11 +2×19+4×29-5×0×3.2b=- 422222+- 2+2+ 4-5×0260=40=6.5 ,^^a= y - b x =3.2.[6分]由上述计算结果,知所求线性回归方程为^y-257=6.5( x-2010)+3.2 ,^即 y=6.5( x-2010)+260.2.[8分](2) 利用所求得的线性回归方程,可展望2016 年的粮食需求量大概为 6.5 ×(2016 - 2010) +260.2 =6.5 ×6+ 260.2=299.2(万吨 ) .[12 分]1.(2016 ·衡水质检 ) 拥有线性有关关系的变量x, y 知足一组数据以下表所示.若y 与 x 的^3线性回归方程为y=3x-2,则 m的值是()x0123y- 11m89A.4B. 2C.5 D.6答案A3m分析由已知得 x =2, y =4+ 2,^3x-3上,又因为点 ( x,y ) 在直线y=2m 3 3所以4+ 2=3×2-2,得m= 4.2.(2017 ·武汉质检) 依据以下样本数据x345678y 4.0 2.5- 0.50.5- 2.0- 3.0^^^获得的回归方程为y= bx+a,则()^^^^A. a>0,b>0B. a>0,b<0^^^^C. a<0,b>0D. a<0,b<0答案B分析作出散点图以下:^^^^察看图象可知,回归直线y= bx+ a的斜率 b<0,^^^^当 x=0时, y= a>0.故 a>0, b<0.3.(2017 ·泰安月考 ) 为了普及环保知识,加强环保意识,某大学从理工类专业的A班和文史类专业的 B 班各抽取20 名同学参加环保知识测试.统计获得成绩与专业的列联表:优异非优异总计A班14620B班71320总计211940附:参照公式及数据:2+n ad - bc 2+ ( n = a + b + c + d ) .(1) 统计量: K =c +d+ba b a c d(2) 独立性查验的临界值表:20.0500.010P ( K ≥ k )k 03.841 6.635则以下说法正确的选项是( )A .有 99%的掌握以为环保知识测试成绩与专业有关B .有 99%的掌握以为环保知识测试成绩与专业没关C .有 95%的掌握以为环保知识测试成绩与专业有关D .有 95%的掌握以为环保知识测试成绩与专业没关答案C2分析因为K 2=40×14×13-7×6≈4.912 ,20×20×21×193. 841<K 2<6.635 ,所以有 95%的掌握以为环保知识测试成绩与专业有关.4.已知 x 与 y 之间的几组数据以下表:x1 2 3 4 5 6 y21334^ ^ ^假定依据上表数据所得线性回归方程为 y =b x + a ,若某同学依据上表中的前两组数据(1,0)和 (2,2) 求得的直线方程为y = b ′ x + a ′,则以下结论正确的选项是 ()^^^^A. b > ′, a >′B. b > ′, a < a ′ bab^ ^^^C. b < b ′, a > a ′D. b < b ′, a < a ′答案C6x i - xy i - y^i =1分析b ′= 2,a ′=- 2,由公式 b =6,求得x i - x 2i =1^5^^13 5 71^^b =7, a = y - b x = 6 -7× 2=- 3,∴ b < b ′, a > a ′.5.有甲、乙两个班级进行数学考试,依据大于等于85 分为优异, 85 分以下为非优异统计成绩,获得以下所示的列联表:优异 非优异 总计甲班10b乙班c30共计附:P( K2≥ k0)0.050.0250.0100.005k0 3.841 5.024 6.6357.879已知在所有105 人中随机抽取 1 人,成绩优异的概率为27,则以下说法正确的选项是()A.列联表中 c 的值为30, b 的值为35B.列联表中 c 的值为15, b 的值为50C.依据列联表中的数据,若按97.5%的靠谱性要求,能以为“成绩与班级有关系”D.依据列联表中的数据,若按97.5%的靠谱性要求,不可以以为“成绩与班级有关系”答案C分析由题意知,成绩优异的学生数是30,成绩非优异的学生数是75,所以c=20,b= 45,选项 A、 B 错误.依据列联表中的数据,2获得K2=105×10×30-20×45≈6.109>5.024,55×50×30×75所以有 97.5%的掌握以为“成绩与班级有关系”.6.(2016 ·合肥二模 ) 某市居民2010~ 2014 年家庭年均匀收入x(单位:万元)与年均匀支出y(单位:万元)的统计资料以下表所示:年份20102011201220132014收入 x11.512.11313.315支出 y 6.88.89.81012依据统计资料,居民家庭年均匀收入的中位数是______,家庭年均匀收入与年均匀支出有________有关关系. ( 填“正”或“负”)答案13正分析中位数是13. 由有关性知识,依据统计资料能够看出,当年均匀收入增加时,年均匀支出也增加,所以二者之间拥有正有关关系.7.以下四个命题,此中正确的序号是________.①从匀速传达的产品生产流水线上,质检员每20 分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量有关性越强,则有关系数的绝对值越靠近于1;^^③在线性回归方程 y =0.2 x+12中,当解说变量 x 每增添一个单位时,预告变量 y 均匀增添0.2 个单位;④对分类变量 X 与 Y 的随机变量 K2的观察值 k 来说, k 越小,“ X 与 Y 有关系”的掌握程度越大.答案②③分析①是系统抽样;对于④,随机变量K2的观察值 k 越小,说明两个有关变量有关系的把握程度越小.8.(2016 ·长春模拟 ) 在一次考试中, 5 名学生的数学和物理成绩以下表:( 已知学生的数学和物理成绩拥有线性有关关系)学生的编号 i12345数学成绩 x8075706560物理成绩 y7066686462^^现已知其线性回归方程为 y= 0.36 x+a,则依据此线性回归方程预计数学得90 分的同学的物理成绩为 ______( 四舍五入到整数 ) .答案73分析x =60+65+ 70+75+ 805= 70,y =62+ 64+ 66+ 68+ 705= 66,^^所以 66=0.36 ×70+a,a= 40.8 ,^即线性回归方程为y =0.36 x+40.8.^当 x=90时, y =0.36×90+40.8=73.2≈73.9.某公司有两个分厂生产某种部件,按规定内径尺寸( 单位: mm)的值落在 [29.94,30.06)的部件为优良品.从两个分厂生产的部件中各抽出了500 件,量其内径尺寸,得结果以下表:甲厂:[29.86 ,[29.90 ,[29.94 ,[29.98, [30.02[30.06[30.10,分组29.90)29.94)29.98)30.02)30.06),,30.10)30.14]频数12638618292614乙厂:[29.86 ,[29.90 ,[29.94 ,[29.98 ,[30.02 ,[30.06[30.10,分组29.90)29.94)29.98)30.02)30.06)30.10),30.14]频数297185159766218(1)试分别预计两个分厂生产的部件的优良品率;(2)由以上统计数据填下边 2×2列联表,问能否有 99%的掌握以为“两个分厂生产的部件的质量有差别”?甲厂乙厂共计优良品非优良品共计附P( K2≥ k0)0.050.01k0 3.841 6.635解(1) 甲厂抽查的500 件产品中有360 件优良品,进而预计甲厂生产的部件的优良品率为×100%= 72%;360 500320乙厂抽查的500 件产品中有320 件优良品,进而预计乙厂生产的部件的优良品率为500×100%= 64%.(2)达成的 2×2列联表以下:甲厂乙厂共计优良品360320680非优良品140180320共计5005001 000由表中数据计算得K2的观察值21 000 ×360×180-320×140k=≈7.353>6.635,500×500×680×320所以有 99%的掌握以为“两个分厂生产的部件的质量有差别”.10.某百货公司 1~ 6 月份的销售量x 与收益 y 的统计数据以下表:月份123456销售量 x(万件)1011131286收益 y ( 万元 )222529261612^ ^^(1) 依据 2~ 5 月份的数据,画出散点图,求出y 对于 x 的线性回归方程 y = b x +a ;(2) 若由线性回归方程获得的预计数据与剩下的查验数据的偏差均不超出 2 万元,则以为获得的线性回归方程是理想的,试问所得线性回归方程能否理想?解 (1) 依据表中 2~ 5 月份的数据作出散点图,以下图:计算得 x = 11, y = 24,5∑ x i y i =11×25+13×29+12×26+8×16= 1092,i = 2522222=11∑ x i+13 +12+ 8= 498,i = 25^∑ i y i - 4 xyi =2 x则 b =522∑ x i - 4 xi = 21 092 -4×11×24 18 =498-4×11 2= 7 ,^^1830a = y - bx = 24- 7 ×11=- 7 .^1830故y 对于x的线性回归方程为y=- .7x7^1830 150(2) 当 x = 10 时, y = 7 ×10- 7 = 7 ,150此时 |7 - 22|<2 ;^ 18×6-30= 78,此时 |78- 12|<2.当 x =6 时, y =7777故所得的线性回归方程是理想的.。
人教版高三数学一轮复习精品课件3:11.3 变量间的相关关系、统计案例
【规范解答】(1)因为P(K2≥3.841)=0.05,4.844>3.841, 所以判断出错的可能性不超过5%. 答案:不超过5% (2)①将2×2列联表中的数据代入计算公式, 得K2= 100(6010-2010)2 100 4.762,
70 3080 20 21
由于4.762>3.841,所以在犯错误的概率不超过5%的前提下认为“南方 学生和北方学生在选用甜品的饮食习惯方面有差异”.
【规范解答】(1)选A.因为 b =2>0,所以变量x,y呈线性正相关关系.
(2)选D.在验证两个变量之间的线性相关关系时,相关系数的绝对值越 接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方 和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果 体现了A,B两变量有更强的线性相关性,故选D.
考点2 独立性检验 【典例2】(1)某高校“统计初步”课程的教师随机调查了选该课程的 一些学生的情况,具体数据如表:
性别
专业
男 女
非统计专业
13 7
统计专业
10 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
50 (13 20 10 7)2
K2= 23 27 20 30 ≈4.844. 因为K2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出
②K2统计量:
K2=
a
n ad bc2 bc da c(b
d)
(其中n=a+b+c+d为样本容量).
2. (1)从散点图看相关性: 正相关:样本点分布在从_左__下__角__到__右__上__角__的区域内; 负相关:样本点分布在从_左__上__角__到__右__下__角__的区域内.
2020版高考数学大一轮复习第十一章统计、统计案例第3讲变量间的相关关系、统计案例分层演练文
第 3 讲变量间的有关关系、统计事例1.某商品的销售量y(件)与销售价钱x(元/件)存在线性有关关系.依据一组样本数据( x i,y i )( i= 1,2,,n) ,用最小二乘法成立的回归方程为^y=-5x+150,则以下结论正确的是 ()A.y与x拥有正的线性有关关系B.若r表示y与x之间的线性有关系数,则r =-5C.当销售价钱为10元时,销售量为100 件D.当销售价钱为10元时,销售量为100 件左右分析:选 D. 由回归直线方程知,y与x拥有负的线性有关关系, A 错,若r表示y与x之间的线性有关系数,则| r | ≤ 1, B 错.当销售价钱为 10^元时, y=-5×10+150=100,即销售量为100 件左右, C 错,应选 D.2.(2019 ·湖南湘中名校联考 ) 利用独立性查验来考虑两个分类变量X 和 Y 能否有关系时,经过查阅下表来确立“X 和 Y 有关系”的可信度.假如k>3.841,那么有掌握以为“ X 和 Y 有关系”的百分比为()P( K2≥ k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.828A.5%B.75%C. 99.5%D.95%分析:选 D. 由图表中数据可得,当k>3.841时,有95%的掌握以为“ X和 Y 有关系”,应选 D.3.在一次对人体脂肪含量和年纪关系的研究中,研究人员获取了一组样本数据,并制作成以下图的人体脂肪含量与年纪关系的散点图.依据该图,以下结论中正确的选项是()A.人体脂肪含量与年纪正有关,且脂肪含量的中位数等于20%B.人体脂肪含量与年纪正有关,且脂肪含量的中位数小于20%C.人体脂肪含量与年纪负有关,且脂肪含量的中位数等于20%D.人体脂肪含量与年纪负有关,且脂肪含量的中位数小于20%分析:选 B. 由于散点图表现上涨趋向,故人体脂肪含量与年纪正有关;由于中间两个数据大概介于15%到 20%之间,故脂肪含量的中位数小于20%.4.(2019 ·湖北七市 ( 州 ) 联考 ) 广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额 y 进行统计,获取统计数据以下表( 单位:万元 ) :广告费 x23456销售额 y2941505971由上表可得回归方程为^= 10.2x +^,据此模型,展望广告费为10万元时销售额约为y a()A. 101.2 万元万元C. 111.2 万元D.118.2 万元分析:选 C. 依据统计数据表,可得-1-1x=×(2 + 3+ 4+ 5+ 6) = 4,y=×(29 + 41+ 50 55+59^^^+ 71) = 50,而回归直线y= 10.2 x+a经过样本点的中心(4 ,50) ,所以 50= 10.2 × 4+a,解得^= 9.2 ,所以回归方程为^= 10.2x+ 9.2 ,所以当x= 10 时,=10.2 ×10+ 9.2 = 111.2 ,a y y应选 C.5.以下说法错误的选项是()A.自变量取值一准时,因变量的取值带有必定随机性的两个变量之间的关系叫做有关关系B.在线性回归剖析中,有关系数r 的值越大,变量间的有关性越强C.在残差图中,残差点散布的带状地区的宽度越狭小,其模型拟合的精度越高D.在回归剖析中,R2为0.98的模型比 R2为0.80的模型拟合的成效好分析:选 B. 依占有关关系的观点知 A 正确;当r >0时, r 越大,有关性越强,当r <0时, r 越大,有关性越弱,故 B 不正确;对于一组数据的拟合程度的利害的评论,一是残差点散布的带状地区越窄,拟合成效越好.二是R 2 越大,拟合成效越好,所以 R 2 为 0.98 的模型比 R 2 为 0.80 的模型拟合的成效好, C 、D 正确,应选 B.6.经检查某地若干户家庭的年收入x ( 万元 ) 和年饮食支出 y ( 万元 ) 拥有线性有关关系,并获取 y 对于 x 的回归直线方程: ^家庭年收入每 y = 0.245 x +0.321 ,由回归直线方程可知, 增添 1 万元,年饮食支出均匀增添________万元.^x +1) + 0.321 = 0.245 x + 0.321 + 0.245 ,所以家庭年收分析: x 变成 x + 1, y =0.245( 入每增添 1 万元,年饮食支出均匀增添0.245 万元.答案: 0.2457.在 2018 年 1 月 15 日那一天,某市物价部门对本市的5 家商场的某商品的一天销售量及其价钱进行检查, 5 家商场的售价x 元和销售量 y 件之间的一组数据以下表所示:价钱 x 9 9.5m10.5 11销售量 y11n865由散点图可知,销售量y 与价钱 x 之间有较强的线性有关关系,其线性回归方程是^y =- 3.2 x + 40,且 m +n = 20,则 n = ________.-9+ 9.5 + + 10.5 + 11m11+ +8+6+5nmn分析: x =5= 8+ 5, y =5= 6+ 5,回归直线必定-nm经过样本中心 ( x , y ) ,即 6+5=- 3.28++ 40,5 即 3.2 m + n = 42.3.2 m + n =42, m = 10,又由于 m + n = 20,即 + = 20,解得 = 10, 故 n =10.m nn答案: 108.已知 x , y 之间的一组数据以下表:x 2 3 4 5 6 y346898 2 3对于表中数据, 现给出以下拟合直线: ① y =x + 1;②y = 2x - 1;③ y = 5x - 5;④y = 4x .此中正确的选项是________.- 2+3+4+5+6 - 3+4+6+8+ 9分析:由数据可知 x = 5 = 4, y = 5= 6. 那么拟合直线必过点(4 , 6) ,经考证可知,知足该点的方程为③.答案:③9.某公司的广告费支出x(单位:万元)与销售额 y(单位:万元)之间有以下对应数据:x24568y3040605070(1)画出散点图,并判断广告费与销售额能否拥有有关关系;^^ ^(2)依据表中供给的数据,求出 y 与 x 的回归方程 y=bx+ a;(3)展望销售额为 115 万元时,大概需要多少万元广告费.解: (1) 散点图如图.由图可判断:广告费与销售额拥有有关关系.(2)-1-1x=×(2+4+5+ 6+ 8) = 5,y=×(30 + 40+ 60+50+ 70) = 50,555∑ x i y i=2×30+4×40+5×60+6×50+8×70=1380,i =15222222∑i =2+4+ 5+ 6+8 =145,i =1x5--∑ x i y i ^=- 5 x y 1 380 -5×5×50i =1=6.5 ,5=2b2-2145-5×5∑ x i- 5 xi= 1^-^-a= y- b x =50-6.5×5=17.5.^所以线性回归方程为y=6.5 x+17.5.(3) 由题得y= 115 时, 6.5 x+ 17.5 = 115,得x= 15.故展望销售额为115 万元时,大概需要15 万元的广告费.10.(2019 ·郑州第一次质量展望 ) 最近几年来郑州空气污染较为严重,现随机抽取一年 (365 天) 内 100 天的空气中 PM2.5 指数的检测数据,统计结果以下:PM2.5[0 , 50](50 ,100](100 ,(150 ,(200 ,(250 ,>300指数150]200]250]300]空气优良稍微污染轻度污染中度污染中度重重度污染质量污染天数413183091115记某公司每日由空气污染造成的经济损失为( 单位:元 ) ,PM2.5 指数为x . 当x在区间S[0 ,100]内时对公司没有造成经济损失;当 x 在区间(100,300]内时对公司造成的经济损失成直线模型 ( 当 PM2.5 指数为 150 时造成的经济损失为500 元,当 PM2.5 指数为 200 时,造成的经济损失为700 元 ) ;当 PM2.5 指数大于300 时造成的经济损失为 2 000元.(1)试写出 S( x)的表达式;(2)试预计在今年内随机抽取一天,该天经济损失 S 大于500元且不超出900元的概率;(3)若本次抽取的样本数占有 30 天是在供暖季,此中有 8 天为重度污染,达成下边列联表,并判断能否有 95%的掌握以为郑州市今年度空气重度污染与供暖有关?非重度污染重度污染共计供暖季非供暖季共计100附:P( K2≥ k0)0.250.150.100.050.0250.0100.0050.001 k0 1.323 2.072 2.706 3.841 5.024 6.6357.87910.8282n( ad- bc)2,此中 n= a+b+ c+ d.K=a+b)( c+d)( a+c)( b+d)(0,x∈ [0 , 100]解: (1)依题意,可得() = 4 -100,x∈( 100, 300].S x2 000 ,x∈( 300,+∞)(2) 设“在今年内随机抽取一天,该天经济损失S 大于500元且不超出900 元”为事件A,39由 500<S≤900,得 150<x≤250,频数为 39,P( A) =100.(3) 依据题中数据获取以下 2×2列联表:非重度污染重度污染共计供暖季22830非供暖季63770共计85151002K2 的观察值k=100×(63×8-22×7)≈4.575>3.841,85× 15×30× 70所以有 95%的掌握以为空气重度污染与供暖有关.1.甲、乙、丙、丁四位同学各自对A、B 两变量的线性有关性做试验,并用回归剖析方法分别求得有关系数r 与残差的平方和m以下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果表现A、 B 两变量有更强的线性有关性()A.甲 B. 乙C.丙D.丁分析:选 D. 有关系数r越靠近于 1 和残差平方和m越小,两变量 A,B 的线性有关性越强.应选 D.2.某观察团对 10 个城市的员工人均薪资x(千元)与居民人均花费 y(千元)进行检查统计,得出 y 与 x 拥有线性有关关系,且回归方程为^x+1.2.若某城市员工人均薪资为y=0.65 千元,预计该城市人均花费额占人均薪资收入的百分比为()A. 66% B.67%C. 79%D.84%分析:选 D. 由于y与x拥有线性有关关系,知足回归方程^= 0.6 x+ 1.2 ,该城市居民y人均薪资为 x=5,所以能够预计该城市的员工人均花费水平^y=0.6×5+1.2=4.2,所以可4.2以预计该城市人均花费额占人均薪资收入的百分比为5= 84%.3.春节时期,“厉行节俭,反对浪费”之风悄悄吹开,某市经过随机咨询100 名性别不同的居民能否能做到“光盘”行动,获取以下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下边的正确结论是 ()A.有 90%以上的掌握以为“该市居民可否做到‘光盘’与性别有关”B.在出错误的概率不超出1%的前提下,以为“该市居民可否做到‘光盘’与性别无关”C.在出错误的概率不超出1%的前提下,以为“该市居民可否做到‘光盘’ 与性别有关”D.有 90%以上的掌握以为“该市居民可否做到‘光盘’与性别没关”分析:选 A. 由 2×2列联表获取= 45,=10,=30,= 15,则+= 55,c +=a b c d a b d45 ,a+c= 75 ,b+d= 25 ,ad= 675 ,bc= 300 ,n= 100 ,计算得K2的观察值k =2100×( 675- 300)≈3.030. 由于 2.706<3.030<3.841,所以有90%以上的掌握以为“该市居民可否做到‘光盘’与性别有关”.4.(2019 ·湖南湘东五校联考) 某兴趣小组欲研究日夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄写了1 月份至 6 月份每个月10 号的日夜温差状况与因患感冒而就诊的人数,获取以下数据:1 月2 月3 月4 月5 月6 月日期10 日10 日10 日10 日10 日10 日日夜温11131286 10差 x/ ℃就诊人2529261612 22数 y/个该兴趣小组确立的研究方案是:先从这 6 组数据中选用 2 组,用剩下的 4 组数据求线性回归方程,再用被选用的 2 组数据进行查验.(1)求选用的 2 组数据恰巧是相邻两个月的概率;(2)若选用的是 1 月份与 6 月份的两组数据,请依据 2 月份至 5 月份的数据,求出y关于x 的线性回归方程^=^+^;y bx a(3)若由线性回归方程获取的预计数据与所选出的查验数据的偏差均不超出2,则以为获取的线性回归方程是理想的,试问该小组所得线性回归方程能否理想?参照公式:参照数据: 11×25+13×29+12×26+8×16= 1 092 ,112+ 132+122+ 82= 498.解: (1) 设选到相邻两个月的数据为事件. 由于从 6 组数据中选用 2组数据共有15 种A状况,且每种状况都是等可能的,此中,选到相邻两个月的数据的状况有 5 种,所以P( A) 51== .153-= 11-24 ,(2) 由表中 2 月份至 5 月份的数据可得x, y =^18-^-^,所以 b==7,则 a= y-b x =30- 7 ,^ 18 30所以 y 对于 x 的线性回归方程为 y = 7 x - 7 .^ 150 150 (3) 当 x = 10 时, y = 7 , 7- 22<2;^ 7878当 x =6 时, y = 7 , 7 -12 <2.所以,该小组所得线性回归方程是理想的.。
2020版高考数学第十一章统计、统计案例第3讲变量间的相关关系、统计案例课件文
【解析】 因为 y=-0.1x+1 的斜率小于 0, 故 x 与 y 负相关. 因 ^ ^ ^ ^ ^ ^ 为 y 与 z 正相关,可设 z= b y+ a ,b >0,则 z= b y+ a =-0.1 b x ^ ^ + b + a ,故 x 与 z 负相关.
【答案】
C
判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关; 点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r>0 时,正相关;r<0 时,负相关. ^ ^ (3)线性回归方程中: b >0 时,正相关; b <0 时,负相关.
参考数据: (xi-11) (yi-3)=74.5, (xi-11)2=340,
i= 1 i= 1 8
8
8
i= 1
(yi-3)2=16.5, 340≈18.44, 16.5≈4.06,其中 xi,yi 分别
为第 i 个月的促销费用和产品销量,i=1,2,3,…,8. 参考公式: (i) 样本 (xi , yi)(i = 1 , 2 ,…, n) 的相关系数 r = - - ( x - x )( y - y) i i .
某校为了研究学生的性别和对待某一活动的态度 (支持和不 支持两种态度)的关系,运用 2×2 列联表进行独立性检验,经 计算 K2=7.069, 则所得到的统计学结论是: 有多少的把握认为 “学生性别与支持该活动有关系” .( 附: P(K2≥k0) k0 A.0.1% C.99% 0.100 2.706 0.050 3.841 0.025 5.024 0.010 6.635 0.001 10.828 )
线性相关关系 , 图中心的一条直线附近,称两个变量之间具有_____________ 回归直线 . 这条直线叫____________
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3讲 变量间的相关关系、统计案例[基础题组练]1.根据如下样本数据:x 3 4 5 6 7 8 y4.02.50.50.50.40.1得到的线性回归方程为y =b x +a ,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:选B.根据给出的数据可发现:整体上y 与x 呈现负相关,所以b ^<0,由样本点(3,4.0)及(4,2.5)可知a ^>0,故选B.2.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )A .66%B .67%C .79%D .84%解析:选D.因为y 与x 具有线性相关关系,满足回归方程y ^=0.6x +1.2,该城市居民人均工资为x =5,所以可以估计该城市的职工人均消费水平y ^=0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%.3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解析:选D.所有点均在直线上,则样本相关系数最大,即为1,故选D.4.(2019·黑龙江哈尔滨模拟)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:根据上表可得回归方程y =b x +a 中的b 为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为( )A .111B .117C .118D .123解析:选B.因为x -=53,y -=103.5,所以a ^=y --b ^x -=103.5-1.35×53=31.95,所以回归直线方程为y ^=1.35x +31.95.当x =63时,代入解得y ^=117,故选B.5.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=n (a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关”解析:选C.因为K 2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.6.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的回归直线方程:y ^=0.245x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x 变为x +1,y ^=0.245(x +1)+0.321=0.245x +0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2457.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号 1 2 3 4 5 6 7 8 数学成绩 60 65 70 75 80 85 90 95 物理成绩7277808488909395根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为________.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.答案:18.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i =13,∑6i =1x 2i =21,则实数b 的值为________.解析:令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -13,此时t -=∑6i =1x 2i 6=7 2,y-=∑6i=1y i6=136,代入y=bt-13,得136=b×72-13,解得b=57.答案:579.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)(2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.参考公式与临界值表:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解:(1)(2)K2=110×(10×30-20×50)260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.10.(2019·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:分析,得到如图所示的残差图及一些统计量的值:(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由. (2)残差绝对值大于2的数据被认为是异常数据,需要剔除;(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入量x =18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2,a ^=y --b ^x -.解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(ⅰ)剔除异常数据,即3月份的数据后,得x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64.∑i =15x i y i =1 464.24-6×31.8=1 273.44,∑i =15x 2i =364-62=328.b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5x-2=1 273.44-5×7.2×29.64328-5×7.2×7.2=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.所以y 关于x 的回归方程为y ^=3x +8.04.(ⅱ)把x =18代入(ⅰ)中所求回归方程得y ^=3×18+8.04=62.04, 故预报值为62.04万元.[综合题组练]1.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄 [15,25)[25,35)[35,45)[45,55)[55,65]支持“延迟 退休”的人数155152817(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计 支持 不支持 总计(2)若以458人参加某项活动.现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率; ②记抽到45岁以上的人数为X ,求随机变量X 的分布列及数学期望. 参考数据及公式:P (K 2≥k 0)0.100 0.050 0.010 0.001K 2=(a +b )(c +d )(a +c )(b +d )解:(1)列联表如下:因为K 2=10050×50×80×20=4=6.25>3.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.(2)从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.①抽到1人是45岁以下的概率为68=34,抽到1人是45岁以下且另一人是45岁以上的概率为C 16C 12C 28=37.故所求概率为3734=47.②X =0,1,2.P (X =0)=C 26C 28=1528,P (X =1)=C16C 12C 28=1228=37,P (X =2)=C 22C 28=128.可得随机变量X 的分布列为故E (X )=1×7+2×28=2.2.(2019·洛阳第一次联考)随着移动互联网的快速发展,基于互联网的共享单车应运而生.某市场研究人员为了了解共享单车运营公司M 的经营状况,对该公司6个月内的市场占有率进行了统计,并绘制了相应的折线图.(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y 与月份代码x 之间的关系.求y 关于x 的线性回归方程,并预测M 公司2017年4月份(即x =7时)的市场占有率.(2)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1 000元/辆和1 200元/辆的A ,B 两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆使用年限各不相同.考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用年限频数表如下:使用年限车型1年 2年 3年 4年 总计 A 20 35 35 10 100 B10304020100假设每辆单车的使用年限都是整数,且以频率作为每辆单车使用年限的概率.如果你是M 公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?参考公式:回归直线方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x - y -∑ni =1x 2i -n x -2,a ^=y --b ^x -. 解:(1)由数据计算可得x -=1+2+3+4+5+66=3.5,y -=11+13+16+15+20+216=16.由公式计算可得,b ^=2,a ^=16-2×3.5=9.所以月度市场占有率y 与月份代码x 之间的线性回归方程为y ^=2x +9. 当x =7时,y ^=2×7+9=23.故M 公司2017年4月份的市场占有率预计为23%.(2)法一:由频率估计概率,每辆A 款车可使用1年,2年,3年和4年的概率分别为0.2,0.35,0.35和0.1,所以每辆A 款车产生利润的期望值为E(X)=(500-1 000)×0.2+(1 000-1 000)×0.35+(1 500-1 000)×0.35+(2 000-1 000)×0.1=175(元).由频率估计概率,每辆B款车可使用1年,2年,3年和4年的概率分别为0.1,0.3,0.4和0.2,所以每辆B款车产生利润的期望值为E(Y)=(500-1 200)×0.1+(1 000-1 200)×0.3+(1 500-1 200)×0.4+(2 000-1 200)×0.2=150(元).所以E(X)>E(Y),所以应该采购A款单车.法二:由频率估计概率,每辆A款车可使用1年,2年,3年和4年的概率分别为0.2,0.35,0.35和0.1,所以每辆A款车可使用年限的期望值为E(X)=1×0.2+2×0.35+3×0.35+4×0.1=2.35(年),所以每辆A款车产生利润的期望值为2.35×500-1 000=175(元).由频率估计概率,每辆B款车可使用1年,2年,3年和4年的概率分别为0.1,0.3,0.4和0.2,所以每辆B款车可使用年限的期望值为E(Y)=1×0.1+2×0.3+3×0.4+4×0.2=2.7(年),所以每辆B款车产生利润的期望值为2.7×500-1 200=150(元).所以应采购A款单车.。