高中数学复习考点知识专题讲解与练习55---变量间的相关关系、统计案例

合集下载

2021年高考数学总复习:变量间的相关关系与统计案例

2021年高考数学总复习:变量间的相关关系与统计案例

第 1 页 共 11 页 2021年高考数学总复习:变量间的相关关系与统计案例
一、选择题
1.(2019·泉州模拟)在下列各图中,两个变量具有相关关系的是( )
(1) (2) (3) (4)
A .(1)(2)
B .(1)(3)
C .(2)(4)
D .(2)(3)
D [(1)是函数关系,(4)不具有相关关系,排除A ,B ,C ,故选D.]
2.(2019·肇庆模拟)如图是相关变量x ,y 的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y =b
1x +a 1,相关系数为r 1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y =b 2x +a 2,相关系数为r 2.则( )
A .0<r 1<r 2<1
B .0<r 2<r 1<1
C .-1<r 1<r 2<0
D .-1<r 2<r 1<0
D [根据相关变量x ,y 的散点图知,变量x ,y 具有负线性相关关系,且点(10,21)是离群值;
方案一中,没剔除离群值,线性相关性弱些,成负相关;
方案二中,剔除离群值,线性相关性强些,也是负相关.
所以相关系数-1<r 2<r 1<0.故选D.]
3.(2019·石家庄二模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:。

最新高考数学总复习——第9章 第3节 变量间的相关关系与统计案例

最新高考数学总复习——第9章 第3节 变量间的相关关系与统计案例

i=1
yyii--y^yi22=1-94×118=1-18=78=0.875,
所以“污水净化量的差异”有87.5%是由年份引起的,这说明
回归方程预报的效果是良好的.
在线性回归分析中,只需利用公式求出回归直线方程 并利用其进行预测即可(注意回归直线过样本点的中心( x , y )),利 用回归方程进行预测,常把线性回归方程看作一次函数,求函数 值.
i=1
ti-
t
2∑ i=1
yi- y 2
线性回归方程y^=^a+b^t,
n
∑ b^=i=1
ti-
n
t
yi-
y
,^a=
y
-b^
t


i=1
ti- t 2
n
∑ 反映回归效果的公式为:R2=1-i=n1
yi-y^i2 ,

i=1
yi- y 2
其中R2越接近于1,表示回归的效果越好.
[解](1)由折线图中的数据得,
高考数学总复习
9.3 变量间的相关关 系与统计案例
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从 左下角 到 右上角 的区域,对于两个 变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 左上角 到 右下角 的区域,两个变量 的这种相关关系称为负相关.
(3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 一条直线
4.某同学家里开了一个小卖部,为了研究气温对某种冷饮销售
量的影响,他收集了一段时间内这种冷饮每天的销售量 y(杯)与当天
最高气温 x(℃)的有关数据,通过描绘散点图,发现 y 和 x 呈线性相
关关系,并求得其回归方程^y=2x+60.如果气象预报某天的最高气温

高考文数考点解析变量间的相关关系、统计案例

高考文数考点解析变量间的相关关系、统计案例

考点42 变量间的相关关系、统计案例一、选择题1.(2016·山东高考文科·T3)同(2016·山东高考理科·T3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140.【解题指南】看清频率分布直方图横纵坐标表示的含义,算出所求问题所占的频率,然后乘以样本容量,便可求解.【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的学生所占频率为2.5×(0.16+0.08+0.04)=0.7,所以每周自习时间不少于22.5小时的学生人数为200×0.7=140.二、解答题2.(2016·全国卷Ⅰ高考文科·T19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n=19,求y 与x 的函数解析式.(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值.(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?【解题指南】(1)分x ≤19和x>19分别求解析式.(2)通过频率大小进行比较.(3)分别求出n=19,n=20时所需要的费用的平均数确定. 【解析】(1)当x ≤19时,y=3800;当x>19时,y=3800+500(x-19)=500x-5700, 所以y 与x 的函数解析式为 y=3800,x 19,500x 5700,x 19,⎧≤⎨->⎩ (x ∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3800×70+4300×20+4800×10)=4000. 若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000,10台的费用为4500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4000×90+4500×10)=4050. 比较两个平均数可知,购买1台机器的同时应购买19个易损零件.3.(2016·全国卷Ⅲ·文科·T18)与(2016·全国卷3·理科·T18)相同(本小题满分12分)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明.(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:7i 1=∑ y i =9.32,7i 1=∑ t i y i =40.17,2.646.参考公式:相关系数r=()()nii tt y y --∑回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:()()ni i i 1n2ii 1tt y y (tt)b ==--=-∑∑,a=y-b t【解析】(1)由折线图中的数据和附注中参考数据得()()()72i i 177ii i iii 1i 1i 1t 4,t t 0.55.tt y y t yty40.1749.32 2.89,2.89所以r 0.99.0.552 2.646=====-==--=-=-⨯=≈≈⨯⨯∑∑∑∑因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.32y 7==1.331及(1)得()()()7ii i 172ii 1tt y y 2.8928tt b ==--==-∑∑≈0.103, a=y-b t ≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y =0.92+0.10t.将2016年对应的t=9代入回归方程得:y =0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.4.(2016·四川高考理科·T16)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值.(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由. (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由. 【解题指南】根据频率分布直方图的有关知识求解.【解析】(1)由概率统计相关知识,各组频率之和的值为1,因为频率=(频率/组距)×组距,所以0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,得a=0.3.(2)由图可知,全市居民中月均用水量不低于3吨的人数所占百分比为0.5×(0.12+0.08+0.04)=12%,所以全市月均用水量不低于3吨的人数为:30×12%=3.6(万).(3)由图可知,月均用水量小于2.5吨的居民人数所占百分比为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73,即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨,故2.5<x<3,假设月均用水量平均分布,则x=2.5+0.5×()85%73%0.50.3-÷=2.9(吨).注:本次估计默认组间是平均分布,与实际可能会产生一定误差.5.(2016·四川高考文科·T16)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值.(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由. (3)估计居民月均用水量的中位数.【解题指南】(1)由高×组距=频率,计算每组中的频率,根据所有频率之和为1,计算出a 的值. (2)利用高×组距=频率,先计算出每人月均用水量不低于3吨的频率,再利用频率×样本总数=频数,计算所求人数.(3)将前5组的频率之和与前4组的频率之和进行比较,得出中位数在[2,2.5)上,再进行计算. 【解析】(1)由概率统计相关知识,各组频率之和的值为1,因为频率=(频率/组距)×组距,所以0.5×(0.08+0.16+0.42+0.5+0.12+0.08+0.04+2a )=1,得a=0.3.(2)由图可知,全市居民中月均用水量不低于3吨的人数所占百分比为0.5×(0.12+0.08+0.04)=12%,所以全市月均用水量不低于3吨的人数为:30×12%=3.6(万).(3)设中位数为x吨,因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5,由0.5×=0.5-0.48,解得x=2.04,故可估计居民月均用水量的中位数为2.04吨.。

高中数学变量间的相关关系、统计案例共51页文档

高中数学变量间的相关关系、统计案例共51页文档
1、不要轻言放弃,否则对不起自己。
2、ห้องสมุดไป่ตู้冒一次险!整个生命就是一场冒险。走得最远的人,常是愿意 去做,并愿意去冒险的人。“稳妥”之船,从未能从岸边走远。-戴尔.卡耐基。
梦 境
3、人生就像一杯没有加糖的咖啡,喝起来是苦涩的,回味起来却有 久久不会退去的余香。
高中数学变量间的相关关系、统计案例 4、守业的最好办法就是不断的发展。 5、当爱不能完美,我宁愿选择无悔,不管来生多么美丽,我不愿失 去今生对你的记忆,我不求天长地久的美景,我只要生生世世的轮 回里有你。
END
16、业余生活要有意义,不要越轨。——华盛顿 17、一个人即使已登上顶峰,也仍要自强不息。——罗素·贝克 18、最大的挑战和突破在于用人,而用人最大的突破在于信任人。——马云 19、自己活着,就是为了使别人过得更美好。——雷锋 20、要掌握书,莫被书掌握;要为生而读,莫为读而生。——布尔沃

高考数学复习统计与统计案例概率第3节变量间的相关关系与统计案例课件文新人教A版

高考数学复习统计与统计案例概率第3节变量间的相关关系与统计案例课件文新人教A版

解析 对于A选项,由图知从2007年到2021年二氧化硫排放量 下降得最多,故A正确.对于B选项,由图知,由2006年到2007 年矩形高度明显下降,因此B正确.对于C选项,由图知从2006 年以后除2021年稍有上升外,其余年份都是逐年下降的,所 以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相 关,D不正确. 答案 D
3.回归分析
(1)定义:对具有相关关系
的两个变量进展统计分析的
一种常用方法. (2)样(本-x,点-y) 的中心:对于一组具有线性相关关系的数据(x1,y1)
,(x2,y2),…,(xn,yn),其中
称为样本点的中心.
(3)相关系数
当r>0时,说明两个正变相量关

当r<0时,说明两个负变相量关
.
4.独立性检验
(1)利用随机变量K2来判断“两个分有类关变系量
〞的
方法称为独立性检验.
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设
有两个分类变量X和Y,它y1们的可y2能取值分总别计为{x1,x2}和{y1 ,y2},其样本频数x列1 联表a(2×2列b 联表)为a+b
x2 c
d
c+d
r的绝对值越接近于1,说明两个变量的线越性强相关性
.
r的0绝.75对值越接近于0,说明两个变量之间几乎不存在线性相关
关系.通常|r|大于
n

(时yi,-y^认i)为2 两个变量有很强的线性相关性.
1-i=n1
∑ (yi--y)2
n
i=1
∑ (yi-y^i)2
i=1
(4)相关指数:R2=
.其中
是残差平
(3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回答下列问

高考数学总复习 专题09 第3节 变量间的相关关系与统计案例课件 文

高考数学总复习 专题09 第3节 变量间的相关关系与统计案例课件 文

题型二 独立性检验的判断 【例2】 (原创题)新星药厂新发明了一种抗感冒药,在一家 医院做了临床试验, 下图是对用这种药与不用这种药,感冒病 好与未好进行统计的等高条形图: 若此次统计中,统计用药的患者50人,未用药的患者为20 人.则你认为感冒病好与用药有关的把握为( ) A.90% B.95% C. 97.5% D. 9- x yi- y
r= i=1 ,用它来衡量两个变量间的线 n n 2 xi- x yi- y 2 i=1 i=1
n
性相关关系.
(1)当 r>0 时,表明两个变量 正相关 ; (2)当 r<0 时,表明两个变量 负相关 ; (3)r 的绝对值越接近 1,表明两个变量的线性相关性 越强 ;r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关 关系.通常当|r|>0.75 时,认为两个变量有很强的线性相关关 系.
回归直线

3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离平方和 最 小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据: ^ x+a ^,则 (x1,y1),(x2,y2),„,(xn,yn),其回归方程为^ y=b
其中,b 是回归方程的 斜率 ,a 是在 y 轴上的截距.
典例分析
题型一 相关关系的判断 【例1】 在下列各量之间的关系中,是相关关系的为( ①正方体的体积与棱长间的关系; ②一块农田的水稻产量与施肥量之间的关系; ③人的身高与年龄的关系; ④家庭的支出与收入的关系; ⑤某户家庭用电量与水价间的关系. A. ①③ B. ①④ C. ④⑤ D. ②③④
)
解析:由于①是函数关系,⑤用电量与水价间不具有函数关系, 也不具有相关关系,②③④中两变量具有相关关系,故选D.

高三总复习52变量间的相关关系与统计案例PPT课件


课前自主回顾 课堂互动探究
课时作业
与名师对话
高考总复习 ·课标版 ·数学(理)
课前自主回顾 课堂互动探究
课时作业
与名师对话
高考总复习 ·课标版 ·数学(理)
问题探究 1:相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:(1)函数关系是一种确定的关系,相关关系是一种 非确定的关系.(2)函数关系是一种因果关系,而相关关系不一 定是因果关系,也可能是伴随关系.
= n11+n12+n21+n22 为样本容量.
,其中 n
利用随机变量 χ2 来判断“两个分类变量有关系”的方法称
为独立性检验.
课前自主回顾 课堂互动探究
课时作业
与名师对话
高考总复习 ·课标版 ·数学(理)
问题探究 2:根据独立性检验的基本思想,得出的两个分 类变量有关系,这样的结论一定是正确的吗?
课时作业
与名师对话
高考总复习 ·课标版 ·数学(理)
2.回归方程 (1)最小二乘法 求回归直线,使“离差平方和为最小”的方法叫做最小二 乘法. (2)回归方程 方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据 (x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参 数.
提示:在实际问题中,独立性检验的结论仅仅是一种数学 关系,得出的结论也可能犯错误,比如:在推测吸烟与肺癌是 否有关时,通过收集、整理、分析数据,我们得到“吸烟与患 肺癌有关”的结论,并且有超过 99%的把握说明吸烟与患肺癌 有关系,或者这个结论出错的概率为 0.01 以下.但实际上一个 人吸烟也不一定会患肺癌,这是数学中的统计思维与确定性思 维差异的反映.
系吗?水稻产量会一直随施化肥量的增加而增长吗?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 / 11
高中数学复习考点知识专题讲解与练习
高中数学复习考点知识专题讲解与练习
55 变量间的相关关系变量间的相关关系、、统计案例
[考纲传真] 1.会作两个相关变量的数据的散点图,会利用散点图认识变量
间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建
立线性回归方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回归分
析的基本思想、方法及简单应用.

1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;
与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种
相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的这种相关
关系称为负相关.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一
条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.

(2)回归方程为y^=b^x+a^,其中b^=,a^=.
(3)通过求Q= (yi-bxi-a)
2
的最小值而得到回归直线的方法,即使得样

本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.
(4)相关系数:
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近
于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为
两个变量有很强的线性相关性.
2 / 11

(5)相关指数:R2=1-.
其中是残差平方和,其值越

小,则R2越大(接近1),模型的拟合效果越好.
3.独立性检验
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本
频数列联表(称为2×2列联表)为:
y1 y2
总计
x1 a b
a+b
x2 c d
c+d
总计 a+c b+d a+b+c+d

K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d).
[常用结论]
1.从散点图观察相关性;
(1)正相关:样本点分布在从左下角到右上角的区域;
(2)负相关:样本点分布在从左上角到右下角的区域.

2.b^的几何意义:体现平均增加或平均减少.
3.线性回归方程y^=b^x+a^一定过样本点的中心(—x,—y).
4.由回归直线求出的数据是估算值,不是精确值.
[基础自测]
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)相关关系与函数关系都是一种确定性的关系, 也是一种因果关
系.( )
(2)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )
(3)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( )
(4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优
秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )
[答案] (1)× (2)√ (3)√ (4)×
2.(教材改编)为调查中学生近视情况,测得某校男生150名中有80名近视,

相关文档
最新文档