2020版高考数学一轮复习课后限时集训56变量间的相关关系与统计案例理含解析新人教A版201907123117
2020高考数学 总复习 10.4 变量间的相关关系、统计案例

A.0.01
B.0.025
C.0.10 D.0.05
知识梳理 考点自测
K2=502×7(×1283××1254-8××296)2
-12-
-13-
知识梳理 考点自测
5.(2018辽宁葫芦岛二模,15改编)下列说法:
①线性回归方程^������ = ^bx+^������必过点(������, ������);
-1-
知识梳理 考点自测
1.变量间的相关关系
(1)定义:常见的两变量之间的关系有两类:一类是函数关系,另一
类是 相关关系
.当自变量取值一定时,因变量的取值带
有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不
同,相关关系是一种 非确定性关系
.
(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做
^
������
=
∑ (������������
������=1
-������)(������������-������)
������
∑
(������������-������)2
������=1
=
������∑=1������������������������-������������ ������ ������∑=������1���������2��� -������������2
.
������=∑������1(������������-������)2������=∑������1(������������-������)2
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对 值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常 当|r|大于0.75时,认为两个变量有很强的线性相关性.
2020高考数学一轮复习课时规范练54变量间的相关关系统计案例理新人教B版-精装版

教学资料范本2020高考数学一轮复习课时规范练54变量间的相关关系统计案例理新人教B版-精装版编辑:__________________时间:__________________【精选】20xx最新高考数学一轮复习课时规范练54变量间的相关关系统计案例理新人教B版基础巩固组1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心()C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg2.根据如下样本数据:x 3 4 5 6 7 8y4.0 2.5 -0.5 0.5 -2.0 -3.0得到的回归方程为x+,则( )A.>0,>0B.>0,<0C.<0,>0D.<0,<03.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若χ2的值为6.635,则有99%的把握认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若在统计量中求出有99%的把握认为吸烟与患肺病有关系,是指有1%的可能性使得推断出现错误D.以上三种说法都不正确4.两个随机变量x,y的取值如下表:x0 1 3 4y2.2 4.3 4.8 6.7若x,y具有线性相关关系,且x+2.6,则下列结论错误的是( )A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y大约增加0.95个单位D.样本点(3,4.8)的残差为0.565.20xx年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男45 10女30 15则下面的结论正确的是( )A.没有足够的理由认为“该市居民能否做到‘光盘’与性别有关”B.有99%的把握认为“该市居民能否做到‘光盘’与性别无关”C.有99%的把握认为“该市居民能否做到‘光盘’与性别有关”D.有95%的把握认为“该市居民能否做到‘光盘’与性别无关”6.(20xx山东潍坊二模,理12)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元 4 5 6 7 8 9销量y/件90 84 83 80 75 68由表中数据,求得线性回归方程为=-4x+,当产品销量为76件时,产品定价大致为元.7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,=720.(1)求家庭的月储蓄对月收入x的线性回归方程x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.〚导学号21500770〛综合提升组8.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:男女总计爱好40 20 60不爱好20 30 50总计60 50 110附表:P(χ2>k) 0.050 0.010k3.841 6.635参照附表,得到的正确结论是( )A.有99%的把握认为“爱好该项运动与性别有关”B.有99%的把握认为“爱好该项运动与性别无关”C.有95%的把握认为“爱好该项运动与性别有关”D.有95%的把握认为“爱好该项运动与性别无关”9.已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y0 2 1 3 3 4假设根据上表数据所得线性回归直线方程x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( )A.>b',>a'B.>b',<a'C.<b',>a'D.<b',<a'10.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.11.(20xx宁夏石嘴山第三中学模拟)为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图,记成绩不低于70分者为“成绩优良”.(1)分别计算甲、乙两班20个样本中,化学成绩前十的平均分,并据此判断哪种教学方式的教学效果更佳;(2)由以上统计数据填写下面2×2列联表,并判断能否有95%的把握认为“成绩优良与教学方式有关”?甲班乙班总计成绩优良成绩不优良总计附:χ2=,P(χ2>k) 0.050 0.010k3.841 6.63512.某贫困地区20xx年至20xx年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份20xx 20xx 20xx 20xx 20xx 20xx 20xx年份代号t 1 2 3 4 5 6 7人均纯收入y2.9 3.3 3.6 4.4 4.8 5.2 5.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析20xx年至20xx年该地区农村居民家庭人均纯收入的变化情况,并预测该地区20xx年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:.创新应用组13.某地10户家庭的年收入和年饮食支出的统计资料如表所示:年收入x/万元 2 4 4 6 6 6 7 7 8 10年饮食支出y/万元0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;(2)如果某家庭年收入为9万元,预测其年饮食支出.14.(20xx福建南平一模改编)某单位N名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.下面是年龄的分布表区间[25,30) [30,35) [35,40) [40,45) [45,50]人数28 a b(1)求正整数a,b,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工分别抽多少?(3)为了了解该单位员工的阅读习惯,对第1,2,3组中抽出的42人是否喜欢阅读国学类书籍进行了调查,调查结果如下表所示:(单位:人)喜欢阅读国学类不喜欢阅读国学类合计男16 4 20女8 14 22合计24 18 42根据表中数据,是否有99%的把握认为该单位员工“是否喜欢阅读国学类书籍和性别有关系”?附:χ2=,P(χ2>k) 0.050 0.010k3.841 6.635参考答案课时规范练54 变量间的相关关系、统计案例1.D 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点中心(),因此B正确;由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确;当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.2.B 由题表中数据画出散点图,如图,由散点图可知<0,>0,故选B.3.C 独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.4.D 由表格中的数据可知选项A正确;∵(0+1+3+4)=2,(2.2+4.3+4.8+6.7)=4.5,∴4.5=2+2.6,解得=0.95,∴=0.95x+2.6.当x=6时,=0.95×6+2.6=8.3,故选项B正确;由=0.95+2.6可知选项C正确;当x=3时,=0.95×3+2.6=5.45,残差是5.45-4.8=0.65,故选项D错误.5.A 由2×2列联表得到n11=45,n12=10,n21=30,n22=15,则n11+n12=55,n21+n22=45,n11+n21=75,n12+n22=25,n11n22=675,n12n21=300,n=100,计算χ2=≈3.030.因为3.030<3.841,所以没有足够的理由认为“该市居民能否做到‘光盘’与性别有关”,故选A.6.7.5 ∵=6.5,=80,∴=80-(-4)×6.5,解得=106,∴回归方程为=-4x+106.当y=76时,76=-4x+106,∴x=7.5,故答案为7.5.7.解 (1)由题意知n=10,xi==8,yi==2,又=720-10×82=80,xiyi-10=184-10×8×2=24,由此得=0.3,=2-0.3×8=-0.4,故所求线性回归方程为=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(=0.3>0),因此x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).8.A 依题意,由χ2=,得χ2=≈7.8>6.635.所以有99%的把握认为“爱好该项运动与性别有关”,故选A.9.C 由题意可知,b'=2,a'=-2,.=-,故<b',>a',故选C.10.185 由题意,得父亲身高x cm与儿子身高y cm对应关系如下表:x173 170 176y170 176 182则=173,=176,(xi-)(yi-)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,(xi-)2=(173-173)2+(170-173)2+(176-173)2=18.∴=1.∴=176-173=3.∴线性回归直线方程x+=x+3.∴可估计孙子身高为182+3=185(cm).11.解 (1)甲班化学成绩前十的平均分(72+74+74+79+79+80+81+85+89+96)=80.9;乙班化学成绩前十的平均分(78+80+81+85+86+93+96+97+99+99)=89.4.∵,∴大致可以判断新课堂教学的教学效果更佳.(2)甲班乙班总计成绩优良10 16 26成绩不优良10 4 14总计20 20 40根据2×2列联表中的数据,得χ2=≈3.956>3.841,∴有95%的把握认为“成绩优良与教学方式有关”.12.解 (1)由所给数据计算得(1+2+3+4+5+6+7)=4,(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(ti-)2=9+4+1+0+1+4+9=28,(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,=0.5,=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.(2)由(1)知,=0.5>0,故20xx年至20xx年该地区农村居民家庭人均纯收入逐年增加,平均每年约增加0.5千元.将20xx年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区20xx年农村居民家庭人均纯收入为6.8千元.13.解 (1)由题意,得年收入x为解释变量,年饮食支出y为预报变量,作散点图如图.从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.因为=6,=1.83,=406,xiyi=117.7,所以≈0.172,x≈1.83-0.172×6=0.798.从而得到线性回归方程为=0.172x+0.798.(2)=0.172×9+0.798=2.346(万元).所以某家庭年收入为9万元时,可以预测其年饮食支出为2.346万元.14.解 (1)总人数N==280,a=280×0.02×5=28.第3组的频率是1-5×(0.02+0.02+0.06+0.02)=0.4,所以b=280×0.4=112.(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28×=7(人),第2组抽取的人数为28×=7(人),第3组抽取的人数为112×=28(人),所以第1,2,3组分别抽7人、7人、28人.(3)假设H0:“是否喜欢阅读国学类书籍和性别无关系”,根据表中数据,求得χ2=≈8.145>6.635.从而有99%的把握认为该单位的员工“是否喜欢阅读国学类书籍和性别有关系”.。
2020高考数学总复习课时作业:变量间的相关性与统计案例 含解析

3
4
5
6
y
2.5
3
4
4.5
A.0.25B.0.35
C.0.45D.0.55
解析:B[由题设有 =4.5, =3.5,故3.5=0.7×4.5+ ,解得 =0.35,故选B.]
3.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
60
70
根据上表可得回归方程 = x+ ,计算得 =7,则当投入10万元广告费时,销售额的预报值为()
附:K2= ,其中n=a+b+c+d.
P(K2≥k0)
0.050
0.025
0.010
0.001
k0
3.841
5.024
6.635
10.828
解:(1)补充2×2列联表如下:
在家里感到最幸福
在其他场所感到最幸福
合计
中国高中生
22
55
美国高中生
9
36
45
合计
31
69
100
∵K2= = ≈4.628>3.841,
∴有95%的把握认为是否“恋家”与国别有关.
(2)用分层抽样的方法选出4人,其中在“朋友聚集的地方”感到最幸福的有3人,分别记为a1,a2,a3,在“个人空间”感到最幸福的有1人,记为b,则所有的基本事件为(a1,a2),(a1,a3),(a1,b),(a2,a3),(a2,b),(a3,b),共6个.
天数x(天)
3
4
5
6
7
繁殖个数y(千个)
2
2020年高考数学一轮复习专题6.5相关系数及回归方程练习(含解析)

6.5 相关系数及回归方程两个变量间的相关关系:①有关概念:相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.如果一个变量的值由小变大时另一个变量的值由小变大,这种相关称为正相关;如果一个变量的值由小变大时另一个变量的值由大变小,这种相关称为负相关;如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系.②回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数. 的计算公式.考向一 样本中心【例1-1】某种产品的广告费支出与销售额之间有如下对应数据(单位:百万元),根据下表求出关于的线性回归方程为,则表中的值为( )A. B. C. D.y bx a =+1122()()()n n x y x y x y ,,,,,,a b 、a b 、1122211()()()()nni i i ii i nni ii i x x y y x y nx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑x y y x 6.5175ˆ.yx =+a 505456.564【答案】B【解析】根据规律知道回归直线一定过样本中心,故得到,将坐标代入方程得到的值为.故答案为:B. 【例1-2】已知表中数据y 与x 有较好的线性关系,通过计算得到y 关于x 的线性回归方程为ˆˆ1.05yx a =+,则相应于下列各点的残差中绝对值最小的是( )A .(2,4)B .(4,6)C .(8,10)D .(10,12.5)【答案】D【解析】ˆˆˆ6,8.3,8.3 1.056,2, 1.052x y aa y x ==∴=⨯+∴=∴=+, 相应于点(2,4),(4,6),(8,10),(10,12.5)的残差分别为0.1,0.2,0.4,0---,故选D.【举一反三】1.“关注夕阳、爱老敬老”—某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x 年(2013年是第一年)与捐赠的现金y (万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程.ˆ035ymx =+,则预测2019年捐赠的现金大约是( ) A .5万元B .5.2万元C .5.25万元D .5.5万元【答案】C5,196x y a ==+6.5175ˆ.yx =+a 54【解析】由已知得,29t =, 所以样本点的中心点的坐标为(4.5,3.5),代入.ˆ035ymx =+, 得3.5 4.50.35m =+,即0.7m =,所以0.7035ˆ.x y=+, 取7x =,得ˆ0.770.35 5.25y=⨯+=, 预测2019年捐赠的现金大约是5.25万元.2.某同学将收集到的6组数据对,制作成如图所示的散点图(各点旁的数据为该点坐标),并由这6组数据计算得到回归直线l :y bx a =+$$$和相关系数r .现给出以下3个结论:①0r >;②直线l 恰过点D ;③1b >. 其中正确结论的序号是( )A .①②B .①③C .②③D .①②③【答案】A【解析】由图像可得,从左到右各点是上升排列的,变量具有正相关性,所以0r >,①正确; 由题中数据可得: 1.5 2.4 3.54 5.8 6.846x +++++==, 2.1 2.8 3.3 3.5 4.35 3.56y +++++==,所以回归直线过点(4,3.5)D ,②正确;又61621()()10.360.514120.14()iii ii x x yy b x x ==--==≈<-∑∑,③错误.故选A 3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱【答案】A【解析】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选:A.考向二回归方程【例2】某人经营淡水池塘养草鱼,根据过去40期的养殖档案,该池塘的养殖重量X (百斤)都在20百斤以上,其中不足40百斤的有8期,不低于40百斤且不超过60百斤的有20期,超过60百斤的有12期.根据统计,该池塘的草鱼重量的增加量y (百斤)与使用某种饵料的质量x (百斤)之间的关系如图所示.(1)根据数据可知y 与x 具有线性相关关系,请建立y 关于x 的回归方程ˆˆˆybx a =+;如果此人设想使用某种饵料10百斤时,草鱼重量的增加量须多于5百斤,请根据回归方程计算,确定此方案是否可行?并说明理由.(2)养鱼的池塘对水质含氧量与新鲜度要求较高,某商家为该养殖户提供收费服务,即提供不超过3台增氧冲水机,每期养殖使用的冲水机运行台数与鱼塘的鱼重量X 有如下关系:若某台增氧冲水机运行,则商家每期可获利5千元;若某台冲水机未运行,则商家每期亏损2千元.视频率为概率,商家欲使每期冲水机总利润的均值达到最大,应提供几台增氧冲水机? 附:对于一组数据()()()1122,,,,n n x y x y x y ,其回归方程ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为1221ˆni ii ni i x y nxy bx nx ==-=-∑∑()()()121,niii ni i x x y y x x ==--=-∑∑ˆˆay bx =- 【答案】(1)337y 1313x =+$当10x =时,此方案可行.(2)应提供2台增氧冲水机 【解析】(1)依题意,5,4,x y ==()()5126iii x x y x =--=∑()()()515213ˆ,13iii i i x x y y bx x ==--∴==-∑∑337ˆ451313a y bx =-=-⨯=$所以3371313y x =+$当10x =时,67ˆ513y=>,故此方案可行. (2)设盈利为Y ,安装1台时,盈利5000Y =, 安装2台时,12040,3000,5X Y p <<==;440,10000,5X Y p ==…. 14()300010000860055E Y ∴=⨯+⨯=安装3台时,12040,1000,5X Y p <<==; 4060,8000,X Y =剟3;5P =160,15000,5X Y P >==. 13()1000800055E Y ∴=⨯+⨯11500080005+⨯=.86008000>,故应提供2台增氧冲水机.【举一反三】1.李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据(),(1,2,,6)i i x y i =,如表所示:已知611606i i y y ===∑.(1)若变量,x y 具有线性相关关系,求产品销量y (百件)关于试销单价x (千元)的线性回归方程ˆˆˆy bx a =+;(2)用(1)中所求的线性回归方程得到与i x 对应的产品销量的估计值i y .当销售数据(),i i x y 对应的残差的绝对值ˆ1i i y y -≤时,则将销售数据(),i i x y 称为一个“好数据”.现从6个销售数据中任取3个子,求“好数据”个数ξ的分布列和数学期望()E ξ.(参考公式:线性回归方程中ˆˆ,ba 的估计值分别为1221ˆˆˆ,)ni ii nii x y nxyb ay bx xnx =-=-==--∑∑. 【答案】(1) ˆ482yx =-+ (2)见解析 【解析】(1)由611606i i y y ===∑,可求得48t =,故11910ni ii x y==∑,=1980nx y ,21199ni i x ==∑,2=181.5nx ,代入可得122119101980704199181.517.5ni ii ni i x y nx yb x nx==---====---∑∑,ˆˆ604 5.582ay bx =-=+⨯=, 所以所求的线性回归方程为ˆ482yx =-+. (2)利用(1)中所求的线性回归方程ˆ482yx =-+可得,当13x =时,170y =;当24x = 时,266y =;当35x =时,362y =;当46x =时,458y =;当57x =时,554y =;当68x =时,650y =.与销售数据对比可知满足||1(1,2,,6)i i y y i -≤=的共有4个“好数据”:(3,70)、(4,65)、(5,62)、(6,59) 于是ξ的所有可能取值为1,2,31242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,3042361(3)5C C P C ξ===, ∴ξ 的分布列为:所以1232555E ξ=⨯+⨯+⨯=.考向三 非线性回归【例3】近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,y a bx =+与(,xy c d c d =⋅均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表l 中的数据,求y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表所示:已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客,享受7折优惠的概率为16,享受8折优惠的概率为13,享受9折优惠的概率为12.根据所给数据以事件发生的频率作为相应事件发生的概率,估计一名乘客一次乘车的平均费用. 参考数据:其中lg i i u y =,7117i i u u ==∑.【答案】(1)xy c d =⋅适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)y 关于x 的回归方程式为:0.25ˆ 3.4710xy=⨯,第8天使用扫码支付的人次为347人次;(3)1.66元.【解析】(1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)由(1)知回归方程为x y c d =⋅,两边同时取常用对数得:()lg lg lg lg xy c dc d x =⋅=+⋅,设lg y u =,lg lg u c d x ∴=+⋅,又4x =, 1.54u =,721140i i x ==∑,7172221750.1274 1.547lg 0.2514074287i ii i i x u xu d x x==--⨯⨯∴====-⨯-∑∑,把样本中心点()4,1.54代入lg lg u c d x =+⋅,即1.54lg 0.254c =+∙,解得:4ˆl 0.5gc=, 0.5405ˆ.2ux ∴=+, lg 0.540.25y x ∴=+,y ∴关于x 的回归方程式为:()0.540.250.540.250.2510101040ˆ 3.71xx x y +==⨯=⨯,把8x =代入上式得,23.4734ˆ107y=⨯=, 活动推出第8天使用扫码支付的人次为347人次;(3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4, 则()20.1P Z==,()11.80.30.152P Z ==⨯=, ()11.60.60.30.73P Z ==+⨯=,()11.40.30.056P Z ==⨯=; 分布列为:所以,一名乘客一次乘车的平均费用为:20.1 1.80.15 1.60.7 1.40.05 1.66⨯+⨯+⨯+⨯=(元). 【举一反三】1.为方便市民出行,倡导低碳出行.某市公交公司推出利用支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,在推广期内采用随机优惠鼓励市民扫码支付乘车.该公司某线路公交车队统计了活动推广期第一周内使用扫码支付的情况,其中 (单位:天)表示活动推出的天次, (单位:十人次)表示当天使用扫码支付的人次,整理后得到如图所示的统计表1和散点图. 表1:(1)由散点图分析后,可用作为该线路公交车在活动推广期使用扫码支付的人次关于活动推出天次的回归方程,根据表2的数据,求此回归方程,并预报第8天使用扫码支付的人次(精确到整数).表2:表中,.(2)推广期结束后,该车队对此期间乘客的支付情况进行统计,结果如表3.表3:统计结果显示,扫码支付中享受5折支付的频率为,享受7折支付的频率为,享受9折支付的频率为.已知该线路公交车票价为1元,将上述频率作为相应事件发生的概率,记随机变量为在活动期间该线路公交车搭载乘客一次的收入(单位:元),求的分布列和期望.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为参考数据:,,.【答案】(1) ,人次为2447 (2)见解析【解析】(1)由题意得,,,关于的线性回归方程为,关于的回归方程为,当时,,第8天使用扫码支付的人次为2447;(2)由题意得的所有取值为0.5,0.7,0.9,1,,,,,的分布列为:1.有下列说法:①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为5350y x =-+,当销售价格为10元时,销售量一定为300件;②线性回归直线y bx a =+$$$一定过样本点中心(,)x y ;③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好;其中正确的结论有几个( ) A .1 B .2C .3D .4【答案】B【解析】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误; ②由最小二乘法可知,回归直线必过(),x y ,②正确;③若两个随机变量为负相关,若线性相关性越强,相关系数r 越接近1-,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数2R 越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个本题正确选项:B2.已知下表为x 与y 之间的一组数据,若y 与x 线性相关,则y 与x 的回归直线y bx a =+必过点( )A .(2,2)B .(1.5,0)C .(1,2)D .(1.5,4)【答案】D【解析】由题可得32x =,4y =, 22223333(0)(14)(1)(34)(2)(54)(3)(74)102222ˆ233335(0)(1)(2)(3)2222b --+--+--+--===-+-+-+-,3ˆ4212a=-⨯=,则回归方程为ˆ21yx =+,将A ,B ,C ,D 四项分别代入方程,只有(1.5,4)这个点在直线上,故选D 。
高考数学人教版(理科)一轮复习课件:第9章第3讲变量间的相关关系与统计案例课后作业5

∑ yi- y 2
i=1
解析
R2 恰好等于相关系数 r 的平方,显然,R2 取值越大,意味着残差平方和越小, 也就是模型的拟合效果越好,④正确;回归直线方程y^=0.1x+10 中,当解释 变量 x 每增加一个单位时,预报变量y^增加 0.1 个单位,⑤正确.
解析
10.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所
答案
(ⅰ)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散 布在直线 y=-30.4+13.5t 上下,这说明利用 2000 年至 2016 年的数据建 立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010 年 相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据 对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额 的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模 型y^=99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化 趋势,因此利用模型②得到的预测值更可靠.
答案 C
答案
解析 k≈9.616>6.635,∴有 99%以上的把握认为“生育意愿与城市级 别有关”.故选 C.
解析
5.(2018·河南天一大联考)已知变量 x,y 之间满足线性相关关系y^=1.3x
-1,且 x,y 之间的相关数据如下表所示:
x123
4
y 0.1 m 3.1
4
则 m=( )
A.0.8 B.1.8 C.0.6 D.1.6
⑤在回归直线方程y^=0.1x+10 中,当解释变量 x 每增加一个单位时, 预报变量y^增加 0.1 个单位.
2020版高考数学理科人教B版一轮温习课时标准练54变量间的相关关系统计案例

课时标准练54 变量间的相关关系、统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程y ^=3+,当变量x 每增加一个单位时,y 的转变情形正确的选项是( )平均增加约个单位 平均增加约3个单位 平均减少约个单位 平均减少约3个单位2.(2018黑龙江模拟十,6)以下表格所示的五个散点,本来数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为y ^=,后因某未知缘故使第5组数据的y 值模糊不清,此位置数据记为m (如下表所示),那么利用回归方程可求得实数m 的值为( )3.(2018广东佛山二模,5)某同窗用搜集到的6组数据对(x i ,y i )(i=1,2,3,4,5,6)制作成如下图的散点图(点旁的数据为该点坐标),并由最小二乘法计算取得回归直线l 的方程为y ^=b ^x+a ^,相关系数为r.现给出以下3个结论:①r>0;②直线l 恰好于点D ;③b ^>1.其中正确结论是( )A.①②B.①③C.②③D.①②③4.(2018辽南协作校一模,3)^^^a ^=,则x=6时y ^的估量值是 ( )黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生利用智能电话对学习的阻碍.附表:P (χ2≥k 0) k 0经计算χ2>10,那么以下选项正确的选项是( ) A.有99%的把握以为利用智能电话对学习有阻碍 B.有99%的把握以为利用智能电话对学习无阻碍 C.有99%的把握以为利用智能电话对学习有阻碍 D.有99%的把握以为利用智能电话对学习无阻碍6.(2018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事前拟订的价钱进行试销,由表中数据求得线性回归方程y ^=-4x+a ,则x=10元时预测销量为 件.7.(2018河南商丘模拟,19):(1)请依照上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x+a ^,并估量当x=20时y 的值;(2)将表格中的数据看做五个点的坐标,那么从这五个点中随机抽取两个点,求恰有1个点落在直线2x-y-4=0右下方的概率. 参考公式:b ^=∑i=1nx i y i -nx y∑i=1n x i 2-nx2,a ^=y −b ^x .综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i=1,2,…,8),回归直线方程为y ^=12x+a ,若OA 1⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA 8⃗⃗⃗⃗⃗⃗⃗⃗ =(6,2)(O 为原点),则a=( ) A.18 18C.14149.(2018安徽合肥一中最后1卷,13)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,依照测量数据的散点图能够看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x+a ^.已知∑i=110x i =225,∑i=110y i =1 600,b ^=4.该班某学生的脚长为24厘米,据此估量其身高为 厘米.10.(2018山东日照5月校际联考,19)为了减缓日趋拥堵的交通状况,很多城市实施车牌竞价策略,以操纵车辆数量.某地车牌竞价的大体规那么是:①“盲拍”,即所有参与竞拍的人都要网络报价一次,每一个人不知晓其他人的报价,也不明白参与当期竞拍的总人数;②竞价时刻截止后,系统依照当期车牌配额,依照竞拍人的出价从高到低分派名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,(1).请用最小二乘法求出y 关于t 的线性回归方程y ^=b ^t+a ^,并预测2018年5月份参与竞拍的人数. (2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价(i)求a 、b 的值及这200位竞拍人员中报价大于5万元的人数;(ii)若2018年5月份车牌配额数量为3 000,假设竞拍报价在各区间散布是均匀的,请你依照以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价. 参考公式及数据:①y ^=b ^x+a ^,其中b ^=∑i=1nx i y i -nx y∑i=1nx i 2-nx2,a ^=y −b ^x ;②∑i=15t i 2=55,∑i=15t i y i =创新应用组11.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大振兴的中国梦奠定坚实基础,哈三中踊跃响应国家号召,不断加大拔尖人材的培育力度,据依照上表可得回归方程y ^=b ^x+a ^中的b ^为,我校2018届同窗在学科竞赛中获省级一等奖以上学生人数为63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为( )12.(2018湖北七校联盟2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确信下一个时段鸡舍的操纵温度,某企业需要了解鸡舍的温度x (单位:℃)对某种鸡的时段产蛋量y (单位:t)和时段投入本钱z (单位:万元)的阻碍,为此,该企业搜集了7个鸡舍的时段操纵温度x i 和产蛋量y i (i=1,2,…,7)的数据,对数据初步处置后取得了如下图的散点图和表中的统计量的值.其中k i =ln y i ,k =17∑i=17k i . (1)依照散点图判定,y=bx+a 与y=c 1e c 2x 哪个更适宜作为该种鸡的时段产蛋量y 关于鸡舍时段操纵温度x 的回归方程类型?(给判定即可,没必要说明理由)(2)假设用y=c 1e c 2x 作为回归方程模型,依照表中数据,成立y 关于x 的回归方程;(3)已知时段投入本钱z 与x ,y 的关系为z=那时段操纵温度为28 ℃时,鸡的时段产蛋量及时段投入本钱的预报值别离是多少?附:①关于一组具有线性相关关系的数据(u i ,υi )(i=1,2,3,…,n ),其回归直线υ=βu+α的斜率和截距的最小二乘估量别离为β^=∑i=1n(u i -u )(υi -υ)∑i=1n(u i -u )2,α^=υ−β^u .②课时标准练54 变量间的相关关系、统计案例令x=a ,y ^=3+,令x=a+1,则y ^=3+(a+1)=+,因此当变量x 每增加一个单位时,则y 平均增加约个单位,应选A .由题意可得:x =196+197+200+203+204=200,y=1+3+6+7+m=17+m,回归方程过样本点的中心,则17+m5=×200-155,解得m=8,应选D .由题图可知这些点散布在一条斜率大于零的直线周围,因此为正相关,即相关系数r>0.因为x =0+1+2+3+5+76=3,y =1.5+2+2.3+3+5+4.26=3,因此回归直线l 的方程必过点(x,y )=(3,3),即直线l 恰好于点D.因为直线l 的斜率接近于直线AD 的斜率,而k AD =3-1.53=12<1,因此③错误,综上正确结论是①②,应选A .自变量x 的平均数x =4+2+3+54=,自变量y 的平均数y =49+26+39+544=42. ∵线性回归直线方程y ^=b ^x+a ^过样本点的中心(x,y ),其中a ^=,∴42=b ^×+,即b ^=9. ∴当x=6时,y ^=9×6+=,应选C .由于χ2=10>,据此结合独立性查验的思想可知,有99%的把握以为利用智能电话对学习有阻碍,应选A .由已知得x =16(4+5+6+7+8+9)=132,y =16(90+84+83+80+75+68)=80,∴a ^=80+4×132=106,∴x=10时,y ^=106-40=66,故答案为66.7.解 (1)x =15(2+4+6+8+10)=6,y =15(3+6+7+10+12)=, ∑i=15x i 2=4+16+36+64+100=220,∑i=15x i y i =6+24+42+80+120=272, b ^=∑i=15x i y i -5x y∑i=15x i 2-5x2=272-5×6×7.6220-5×62=4440=,∴a ^=×=1,∴回归直线方程为y ^=+1,故当x=20时,y=23.(2)能够判定,落在直线2x-y-4=0右下方的点知足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),共有10种取法,知足条件的有6种,因此P=610=35. 因为OA 1⃗⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +……+OA ⃗⃗⃗⃗⃗ 8=(x 1+x 2+…+x 8,y 1+y 2+…+y 8)=(8x ,8y )=(6,2),因此8x =6,8y =2⇒x =34,y =14,因此14=12×34+a ,即a=-18,应选B .由∑i=110x i =225,∑i=110y i =1 600,利用平均值公式求得x =,y =160,∵b ^=4,∴a ^=160-4×=70,∴当x=24时,y=4×24+70=166,故答案为166. 10.解 (1)易知t =1+2+3+4+55=3,y =0.5+0.6+1+1.4+1.75=,b ^=∑i=15t i y i -5t y∑i=15t i 2-5t2=18.8-5×3×1.0455-5×32=,a ^=y −b ^t =则y 关于t 的线性回归方程为y ^=+,当t=6时,y ^=,即2018年5月份参与竞拍的人数估量为2万人.(2)(i)由a200=,解得a=40.由频率和为1,得×2++2b++×1=1,解得b=,200位竞拍人员报价大于5万元的人数为++×200=60人.(ii)2018年5月份实际发放车牌数量为3 000,依照竞价规那么,报价在最低成交价以上人数占总人数比例为3 00020 000×100%=15%.又由频率散布直方图知竞拍报价大于6万元的频率为+=,因此,依照统计思想(样本估量整体)可预测2018年5月份竞拍的最低成交价为6万元.由题意得x =51+49+55+574=53,y =103+96+108+1074=. ∵数据的样本点的中心在线性回归直线上,y ^=b ^x+a ^中的b ^为,∴=×53+a ^,即a ^=,∴线性回归方程是y=+.∵2018届同窗在学科竞赛中获省级一等奖以上学生人数为63人,∴今年被清华、北大等世界名校录取的学生人数为×63+=117,应选C . 12.解 (1)y=c 1e c 2x 适宜.(2)由y=c 1e c 2x 得ln y=c 2x+ln c 1,令ln y=k ,c 2=β,ln c 1=α,由题中图表中的数据可知β^=35140=14,α^=-34,∴k ^=14x-34,∴y 关于x 的回归方程为y=e x 4-34=e x4.(3)当x=28时,由回归方程得y ^=×1 ≈,z ^=×即鸡舍的温度为28 ℃时,鸡的时段产量的预报值为,投入本钱的预报值为.。
2020版高考理科数学(人教版)一轮复习课时跟踪检测:(七十四) 变量间的相关关系、统计案例 Word版含解析
课时跟踪检测(七十四) 变量间的相关关系、统计案例一、题点全面练1.根据如下样本数据:得到的线性回归方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:选B 根据给出的数据可发现:整体上y 与x 呈现负相关,所以b ^<0,由样本点(3,4.0)及(4,2.5)可知a ^>0,故选B.2.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,正确的结论是( A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关” B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关” C.有99%以上的把握认为“生育意愿与城市级别有关” D.有99%以上的把握认为“生育意愿与城市级别无关”解析:选C ∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.3.(2018·哈尔滨一模)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:根据上表可得回归方程y =b x +a 中的b 为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为( )A.111B.117C.118D.123解析:选B 因为x =53,y =103.5,所以a ^=y -b ^x =103.5-1.35×53=31.95,所以回归直线方程为y ^=1.35x +31.95.当x =63时,代入解得y ^=117,故选B.4.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且线性回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )A.66%B.67%C.79%D.84%解析:选D ∵y 与x 具有线性相关关系,且满足回归方程y ^=0.6x +1.2,该城市居民人均工资为x =5,∴可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%.5.某炼钢厂废品率x (%)与成本y (元/吨)的线性回归直线方程为y ^=105.492+42.569x .当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).解析:因为176.5=105.492+42.569x ,解得x ≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.答案:16.686.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)现已知其线性回归方程为y ^=0.36x +a ^,则根据此线性回归方程估计数学得90分的同学的物理成绩为________.(四舍五入到整数)解析:x =60+65+70+75+805=70,y =62+64+66+68+705=66,所以66=0.36×70+a ^,即a ^=40.8, 即线性回归方程为y ^=0.36x +40.8.当x =90时,y ^=0.36×90+40.8=73.2≈73. 答案:737.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的线性回归直线方程:y ^=0.245x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x 变为x +1,y ^=0.245(x +1)+0.321=0.245x +0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2458.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为________.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.答案:19.(2019·泉州一模)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试,测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子停下所需要的距离),无酒状态与酒后状态下的试验数据分别列于下表.表1(1)求a ,b 的值,并估计驾驶员无酒状态下停车距离的平均数; (2)根据最小二乘法,由表2的数据计算y 关于x 的回归方程y ^=b ^x +a ^;(3)该测试团队认为:若驾驶员酒后驾车的平均“停车距离”y 大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?附:回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2,a ^=y -b ^x .解:(1)依题意,得610a =50-26,解得a =40.又a +b +36=100,解得b =24,故停车距离的平均数为 15×26100+25×40100+35×24100+45×8100+55×2100=27.(2)依题意,可知x =50,y =60,∑i =15x i y i =10×30+30×50+50×60+70×70+90×90=17 800,∑i =15x 2i =102+302+502+702+902=16 500,所以b ^=17 800-5×50×6016 500-5×502=0.7,a ^=60-0.7×50=25, 所以回归直线方程为y ^=0.7x +25.(3)由(1)知当y >81时,认定驾驶员是“醉驾”. 令y ^>81,得0.7x +25>81,解得x >80,则当每毫升血液酒精含量大于80毫克时认定为“醉驾”.10.(2018·豫南九校联考)下表为2015年至2018年某百货零售企业的线下销售额(单位:万元),其中年份代码x =年份—2014.(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程,并预测2019年该百货零售企业的线下销售额;(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调查平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?参考公式及数据:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x ,K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解:(1)由题意得x =2.5,y=200,∑i =14x 2i =30,∑i =14x i y i =2 355,所以b ^=∑i =14x i y i -4x y∑i =14x 2i -4x2=2 355-4×2.5×20030-4×2.52=71,所以a ^=y -b ^x =200-71×2.5=22.5, 所以y 关于x 的线性回归方程为y ^=71x +22.5.由于2 019-2 014=5,所以当x =5时,y ^=71×5+22.5=377.5,所以预测2019年该百货零售企业的线下销售额为377.5万元.(2)由题可得2×2列联表如下:故K 2=105×(10×30-45×20)255×50×30×75≈6.109.由于6.109>5.024,所以可以在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.二、专项培优练(一)易错专练——不丢怨枉分1.(2019·济南诊断)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动,得到如下的列联表.由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )并参照附表,得到的正确结论是()附表:A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”解析:选A 因为K 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”.2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得的线性回归方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^< b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C 由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑i =16x i y i -6x ·y ∑i =16x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′. 3.为了研究某班学生的脚长x (单位:cm)和身高y (单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y^=b ^x +a ^.已知∑i =110x i =225,∑i =110y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A.160B.163C.166D.170解析:选C ∵∑i =110x i =225,∴x =110∑i =110x i =22.5.∵∑i =110y i =1 600,∴y =110∑i =110y i =160.又b ^=4,∴a ^=y -b ^x =160-4×22.5=70. ∴线性回归方程为y ^=4x +70.将x =24代入上式,得y ^=4×24+70=166. (二)素养专练——学会更学通4.[数学运算]某高中学校对全体学生进行体育达标测试,每人测试A ,B 两个项目,每个项目满分均为60分.从全体学生中随机抽取了100人,分别统计他们A ,B 两个项目的测试成绩,得到A 项目测试成绩的频率分布直方图和B 项目测试成绩的频数分布表如下:B 项目测试成绩频数分布表(1)在抽取的100人中,求A 项目等级为优秀的人数;(2)已知A 项目等级为优秀的学生中女生有14人,A 项目等级为一般或良好的学生中女生有34人,试完成下列2×2列联表,并分析是否有95%以上的把握认为“A 项目等级为优秀”与性别有关?(3)将样本的概率作为总体的概率,并假设A项目和B项目测试成绩互不影响,现从该校学生中随机抽取1人进行调查,试估计其A项目等级比B项目等级高的概率.参考数据:参考公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解:(1)由A项目测试成绩频率分布直方图,得A项目等级为优秀的频率为0.04×10=0.4,所以A项目等级为优秀的人数为0.4×100=40.(2)由(1)知A项目等级为优秀的学生中,女生数为14人,男生数为26人.A项目等级为一般或良好的学生中,女生数为34人,男生数为26人.作出如下2×2列联表:则K2=100×(26×34-26×14)240×60×48×52≈4.514.由于4.514>3.841,所以有95%以上的把握认为“A项目等级为优秀”与性别有关.(3)设“A项目等级比B项目等级高”为事件C.记“A项目等级为良好”为事件A1,“A项目等级为优秀”为事件A2,“B项目等级为一般”为事件B0,“B项目等级为良好”为事件B1.于是P(A1)=(0.02+0.02)×10=0.4,P(A2)=0.4.由频率估计概率得P(B0)=2+3+5100=0.1,P(B1)=15+40100=0.55.因为事件A i与B j相互独立,其中i=1,2,j=0,1,所以P(C)=P(A1B0+A2B0+A2B1)=0.4×0.1+0.4×0.1+0.4×0.55=0.3.所以随机抽取一名学生,其A项目等级比B项目等级高的概率为0.3.5.[数据分析]下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,学生答出其中任意一种或其他合理理由均可得分)。
2020版高考数学理科(人教B版)一轮复习课时规范练54 变量间的相关关系、统计案例 含解析
课时规范练54变量间的相关关系、统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程=3+1.2x,当变量x每增加一个单位时,y的变化情况正确的是()A.y平均增加约1.2个单位B.y平均增加约3个单位C.y平均减少约1.2个单位D.y平均减少约3个单位2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为=0.8x-155,后因某未知原因使第5组数据的y值模糊不清,此位置数据记为m(如下表所示),x196197200203204y1367mA.8.3B.8.2C.8.1D.83.(2018广东佛山二模,5)某同学用收集到的6组数据对(x i,y i)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为x+,相关系数为r.现给出以下3个结论:①r>0;②直线l恰好过点D;③>1.其中正确结论是()A.①②B.①③C.②③D.①②③4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程x+,其中=10.5,则x=6时的估计值是()x4235y49263954A.57.5B.61.5C.64.5D.67.55.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表使用智能手机不使用智能手机总计学习成绩优秀4812学习成绩不优秀16218总计201030附表:P(χ2≥k0)0.050.010k03.8416.635经计算χ2>10,则下列选项正确的是()A.有99%的把握认为使用智能手机对学习有影响B.有99%的把握认为使用智能手机对学习无影响C.有99%的把握认为使用智能手机对学习有影响D.有99%的把握认为使用智能手机对学习无影响6.(2018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,由表中数据求得线性回归方程=-4x+a,则x=10元时预测销量为件.7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量x,y之间的几组数据如下表所示:x246810y3671012(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x+,并估计当x=20时y的值;(2)将表格中的数据看作五个点的坐标,则从这五个点中随机抽取两个点,求恰有1个点落在直线2x-y-4=0右下方的概率.-.参考公式:-综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量x,y,设其样本点为A i(x i,y i)(i=1,2,…,8),回归直线方程为x+a,若+…+=(6,2)(O为原点),则a=()A. B.-C. D.-9.(2018安徽合肥一中最后1卷,13)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x+.已知x i=225,y i=1 600,=4.该班某学生的脚长为24厘米,据此估计其身高为厘米.10.(2018山东日照5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,月份2017.122018.012018.022018.032018.04月份编号t12345竞拍人数y(万人) 0.50.611.41.7(1).请用最小二乘法求出y关于t的线性回归方程t+,并预测2018年5月份参与竞拍的人数. (2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价报价区间(万元) [1,2)[2,3)[3,4)[4,5)[5,6)[6,7)[7,8)频数1030a60302010(i)求a、b的值及这200位竞拍人员中报价大于5万元的人数;(ii)若2018年5月份车牌配额数量为3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价.参考公式及数据:①x+,其中--;②=55,t i y i=18.8创新应用组11.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,年份(届)2014201520162017学科竞赛获省级一等奖及以上学生人数x51495557被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程x+中的为1.35,我校2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为() A.111 B.115C.117D.12312.(2018湖北七校联盟2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x(单位:℃)对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度x i和产蛋量y i(i=1,2,…,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.17.4082.303.6140(x i-)(y i-)(x i-)(k i-)9.7 2 935.135.0其中k i=ln y i,k i.(1)根据散点图判断,y=bx+a与y=c1哪一个更适宜作为该种鸡的时段产蛋量y关于鸡舍时段控制温度x的回归方程类型?(给判断即可,不必说明理由)(2)若用y=c1作为回归方程模型,根据表中数据,建立y关于x的回归方程;(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?附:①对于一组具有线性相关关系的数据(u i,υi)(i=1,2,3,…,n),其回归直线υ=βu+α的斜率和截距的最--.小二乘估计分别为-②e-2.5e-0.75e e3e70.080.472.7220.091096.63课时规范练54变量间的相关关系、统计案例1.A令x=a,=3+1.2a,令x=a+1,则=3+1.2(a+1)=4.2+1.2a,所以当变量x每增加一个单位时,则y 平均增加约1.2个单位,故选A.2.D由题意可得:=200,,回归方程过样本点的中心,则=0.8×200-155,解得m=8,故选D.3.A由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r>0.因为=3,=3,所以回归直线l的方程必过点()=(3,3),即直线l恰好过点D.因为直线l的斜率接近于直线AD的斜率,而k AD=-<1,所以③错误,综上正确结论是①②,故选A.4.C自变量x的平均数=3.5,自变量y的平均数=42.∵线性回归直线方程x+过样本点的中心(),其中=10.5,∴42=3.5+10.5,即=9.∴当x=6时,=9×6+10.5=64.5,故选C.5.A由于χ2=10>6.635,据此结合独立性检验的思想可知,有99%的把握认为使用智能手机对学习有影响,故选A.6.66由已知得(4+5+6+7+8+9)=(90+84+83+80+75+68)=80,=80+4=106,∴x=10时,=106-40=66,故答案为66.7.解(1)(2+4+6+8+10)=6,(3+6+7+10+12)=7.6,=4+16+36+64+100=220,x i y i=6+24+42+80+120=272,----=1.1,=7.6-6×1.1=1,∴回归直线方程为=1.1x+1,故当x=20时,y=23.(2)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),共有10种取法,满足条件的有6种,所以P= 8.B因为+……+=(x1+x2+…+x8,y1+y2+…+y8)=(8,8)=(6,2),所以8=6,8=2,因此+a,即a=-,故选B.9.166由x i=225,y i=1 600,利用平均值公式求得=22.5,=160,=4,=160-4×22.5=70,∴当x=24时,y=4×24+70=166,故答案为166.10.解(1)易知=3,=1.04,----=0.32,=1.04-0.32×3=0.08,则y关于t的线性回归方程为=0.32t+0.08,当t=6时,=2.00,即2018年5月份参与竞拍的人数估计为2万人.(2)(i)由=0.20,解得a=40.由频率和为1,得(0.05×2+0.10+2b+0.20+0.30)×1=1,解得b=0.15,200位竞拍人员报价大于5万元的人数为(0.05+0.10+0.15)×200=60人.(ii)2018年5月份实际发放车牌数量为3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为100%=15%.又由频率分布直方图知竞拍报价大于6万元的频率为0.05+0.10=0.15,所以,根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元.11.C由题意得=53,=103.5.∵数据的样本点的中心在线性回归直线上,x+中的为1.35,∴103.5=1.35×53+,即=31.95,∴线性回归方程是y=1.35x+31.95.∵2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,∴今年被清华、北大等世界名校录取的学生人数为1.35×63+31.95=117,故选C.12.解(1)y=c1适宜.(2)由y=c1得ln y=c2x+ln c1,令ln y=k,c2=β,ln c1=α,由题中图表中的数据可知=-,x-,∴y关于x的回归方程为y=-=0.47(3)当x=28时,由回归方程得=0.47×1 096.63≈515.4,=0.08×515.4-2.8+10=48.432,即鸡舍的温度为28 ℃时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432.。
江苏省南京市高考数学一轮复习:56 变量间的相关关系与统计案例
江苏省南京市高考数学一轮复习:56 变量间的相关关系与统计案例姓名:________ 班级:________ 成绩:________一、单选题 (共12题;共24分)1. (2分)(2017·葫芦岛模拟) 广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如表(单位:万元):广告费x23456销售额y2941505971由表可得到回归方程为 =10.2x+ ,据此模型,预测广告费为10万元时的销售额约为()A . 101.2B . 108.8C . 111.2D . 118.22. (2分) (2019高三上·吉林月考) 对两个变量进行回归分析,给出如下一组样本数据:,,,,下列函数模型中拟合较好的是()A .B .C .D .3. (2分) (2016高二上·张家界期中) 已知一个线性回归方程为 =1.5x+45,其中x的取值依次为1,7,5,13,19,则 =()A . 58.5B . 46.5C . 60D . 754. (2分)(2020·湖南模拟) 已知某一组散点数据对应的线性回归方程为,数据中心点为,则的预报值是()A . 0.9B .C . 1D .5. (2分) (2017高二下·和平期末) 在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C (3,4),D(4,5),则y与x之间的线性回归方程为()A . =x﹣1B . =x+2C . =2x+1D . =x+16. (2分) (2017高二下·故城期中) 设(x1 , y1),(x2 , y2),…,(xn , yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A . x和y的相关系数在﹣1和0之间B . x和y的相关系数为直线l的斜率C . 当n为偶数时,分布在l两侧的样本点的个数一定相同D . 所有样本点(xi , yi)(i=1,2,…,n)都在直线l上7. (2分) (2016高一下·永年期末) 某研究机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:记忆能力x46810识图能力y3568由表中数据,求得线性回归方程为,若某儿童的记忆能力为12时,则他的识图能力为()A . 9.2B . 9.5C . 9.8D . 108. (2分)在回归分析中,相关指数R2的值越大,说明残差平方和()A . 越大B . 越小C . 可能大也可能小D . 以上均错9. (2分)下面是一个2×2列联表,则表中a、b的值分别为()y1y2合计x1a2173x222527合计b46100A . 94、96B . 52、50C . 52、54D . 54、5210. (2分)判断两个分类变量时彼此相关还是相互独立的常用方法中,最为精确的是()A . 2×2列联表B . 独立性检验C . 登高条形图D . 其他11. (2分) (2018高一下·蚌埠期末) 某企业里工人的工资与其生产利润满足线性相关关系,现统计了100名工人的工资(元)与其生产利润(千元)的数据,建立了关于的回归直线方程为,则下列说法正确的是()A . 工人甲的生产利润为1000元,则甲的工资为130元B . 生产利润提高1000元,则预计工资约提高80元C . 生产利润提高1000元,则预计工资约提高130元D . 工人乙的工资为210元,则乙的生产利润为2000元12. (2分) (2019高二下·固镇月考) 在独立性检验中,统计量有三个临界值:2.706,3.841和6.635.当时,有90%的把握说明两个事件有关;当时,有95%的把握说明两个事件有关,当时,有99%的把握说明两个事件有关,当时,认为两个事件无关.在一项打鼾与心脏病的调查中,共调查了2000人,经计算 .根据这一数据分析,认为打鼾与患心脏病之间()A . 有95%的把握认为两者有关B . 约95%的打鼾者患心脏病C . 有99%的把握认为两者有关D . 约99%的打鼾者患心脏病二、填空题 (共5题;共5分)13. (1分) (2019高二下·宁夏月考) 已知x与y之间的一组数据:则y与x的线性回归方程为y=bx+a 必过点________。
2020版高考数学(文)一轮复习变量间的相关关系与统计案例
第三节变量间的相关关系与统计案例 一、基础知识批注——理解深一点1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.体现的不一定是因果关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为y ^=b ^x +a ^,其中b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2, a ^=y -b ^x .回归直线y ^=b ^x +a ^必过样本点的中心(x ,y ),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据. (3)通过求Q =∑i =1n(y i -bx i -a )2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验 (1)2×2列联表设X ,Y 为两个变量,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)如下:y 1 y 2 总计 x 1aba +bx 2 c d c +d 总计a +cb +da +b +c +d(2)独立性检验利用随机变量K 2(也可表示为χ2)的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c+d 为样本容量)来判断“两个变量有关系”的方法称为独立性检验.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.二、常用结论汇总——规律多一点(1)求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ).(2)根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变量有关的把握越大.(3)根据回归方程计算的y ^值,仅是一个预报值,不是真实发生的值.三、基础小题强化——功底牢一点(一)判一判(对的打“√”,错的打“×”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.( )(2)回归直线方程y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点.( ) (3)若事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越小.( ) (4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.( ) 答案:(1)√ (2)× (3)× (4)√ (二)选一选1.已知变量x 和y 满足关系y ^=-0.1x +1,变量y ^与z 正相关.则下列结论中正确的是( )A .x 与y ^负相关,x 与z 负相关 B .x 与y ^正相关,x 与z 正相关 C .x 与y ^正相关,x 与z 负相关 D .x 与y ^负相关,x 与z 正相关 答案:A2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1的相关指数R 2为0.98B .模型2的相关指数R 2为0.80C .模型3的相关指数R 2为0.50D .模型4的相关指数R 2为0.25 答案:A (三)填一填3.已知x ,y 的取值如下表,从散点图可以看出y 与x 具有线性相关关系,且回归方程为y ^=0.95x +a ^,则a ^=________.x 0 1 3 4 y2.24.34.86.7解析:∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.答案:2.64.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析:K 2的观测值k ≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%考点一 回归分析考法(一) 求线性回归方程[典例] (2019·湘东五校联考)已知具有相关关系的两个变量x ,y 的几组数据如下表所示:x2 4 6 8 10y 3 6 7 10 12(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x =20时y 的值.参考公式:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .[解] (1)散点图如图所示:(2)依题意,x =15×(2+4+6+8+10)=6,y =15×(3+6+7+10+12)=7.6,∑i =15x 2i =4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,∴b ^=∑i =15x i y i -5 x y∑i =15x 2i -5 x2=272-5×6×7.6220-5×62=4440=1.1, ∴a ^=7.6-1.1×6=1,∴线性回归方程为y ^=1.1x +1,故当x =20时,y =23.考法(二) 相关系数及应用[典例] 如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明. 参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55, 7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2.[解] 由折线图中数据和参考数据及公式得t =4,∑i=17(t i -t)2=28,∑i =17(y i -y )2=0.55,∑i =17(t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.[解题技法]1.线性回归分析问题的类型及解题方法 (1)求线性回归方程:①利用公式,求出回归系数b ^,a ^.②待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b ^.2.模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好. (2)相关指数R 2越大,模型的拟合效果越好.(3)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强.[题组训练]1.(2019·惠州调研)某商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x /℃ 17 13 8 2 月销售量y /件24334055由表中数据算出线性回归方程y ^=b ^x +a ^中的b ^=-2,气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣销售量约为( )A .46件B .40件C .38件D .58件解析:选A 由题中数据,得x =10,y =38,回归直线y ^=b ^x +a ^过点(x ,y ),且b ^=-2,代入得a ^=58,则回归方程y ^=-2x +58,所以当x =6时,y =46,故选A.2.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次,统计数据如下表:x 1 2 3 4 5 6 7 y601102103406601 0101 960根据以上数据,绘制了散点图.参考数据:yv∑i =17x i y i∑i =17x i v i100.54其中v i =lg y i ,v =17∑i =17v i .(1)根据散点图判断,在推广期内,y =a +bx 与y =c ·d x (c ,d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及上表中数据,建立y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^μ的斜率和截距的最小二乘估计公式分别为β=∑i =1nu i v i -n u v∑i =1nu 2i -n u2,α^=v -β^U .解:(1)根据散点图可以判断,y =c ·d x 适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型.(2)y =c ·d x 两边同时取常用对数,得lg y =lg(c ·d x )=lg c +x lg d , 设lg y =v ,则v =lg c +x lg d . ∵x =4,v =2.54,∑i =17x 2i =140,∴lg d =∑i =17x i v i -7 x v∑i =17x 2i -7 x2≈78.12-7×4×2.54140-7×42=0.25,把(4,2.54)代入v =lg c +x lg d ,得lg c =1.54, ∴v ^=1.54+0.25x ,∴y ^=101.54+0.25x =101.54·(100.25)x .把x =8代入上式,得y ^=101.54+0.25×8=103.54=103×100.54=3 470,∴y 关于x 的回归方程为y ^=101.54·(100.25)x ,活动推出第8天使用扫码支付的人次为3 470.考点二 独立性检验[典例] (2018·全国卷Ⅲ节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式 第二种生产方式(2)根据(1)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),[解] (1)由茎叶图知m =79+812=80.列联表如下:超过m 不超过m第一种生产方式 15 5 第二种生产方式515(2)因为K 2=40(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.[解题技法]2个明确(1)明确两类主体; (2)明确研究的两个问题 2个关键(1)准确画出2×2列联表; (2)准确求解K 23个步骤(1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算K 2的值;(3)查表比较K 2与临界值的大小关系,作统计判断[题组训练]1.(2019·沧州模拟)某班主任对全班50名学生进行了作业量的调查,数据如表:认为作业量大认为作业量不大总计 男生 18 9 27 女生 8 15 23 总计262450已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025,P (K 2≥6.635)≈0.010.则________(填“有”或“没有”)97.5%的把握认为“学生的性别与认为作业量大 有关”.解析:因为K 2=50×(18×15-8×9)226×24×27×23≈5.059>5.024,所以有97.5%的把握认为“学生的性别与认为作业量大有关”. 答案:有2.为考察某种疫苗预防疾病的效果,进行动物试验,得到统计数据如下:未发病 发病 总计 未注射疫苗 20 x A 注射疫苗 30 y B 总计5050100现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为25.(1)求2×2列联表中的数据x ,y ,A ,B 的值.(2)绘制发病率的条形统计图,并判断疫苗是否影响到了发病率?(3)能否在犯错误的概率不超过0.001的前提下认为疫苗有效?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .临界值表:P (K 2≥k 0)0.05 0.01 0.005 0.001 k 03.8416.6357.87910.828解:(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”为事件M , 由已知得P (M )=y +30100=25, 所以y =10,则B =40,x =40,A =60. (2)未注射疫苗发病率为4060=23≈0.67,注射疫苗发病率为1040=14=0.25.发病率的条形统计图如图所示,由图可以看出疫苗影响到了发病率.(3)因为K 2=100×(20×10-40×30)260×40×50×50≈16.67>10.828.所以能在犯错误的概率不超过0.001的前提下认为疫苗有效.[课时跟踪检测]A 级——保大分专练1.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图如图①,对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图如图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x 与y 负相关,u 与v 正相关.2.(2019·长沙模拟)为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计表:购买食品的年支出费用x /万元 2.092.152.502.842.92购买水果和牛奶的年支出费用y /万元1.251.301.501.701.75根据上表可得回归方程y =b x +a ,其中b =0.59,a =y -b x ,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( )A .1.795万元B .2.555万元C .1.915万元D .1.945万元解析:选A x =15×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),y =15×(1.25+1.30+1.50+1.70+1.75)=1.50(万元),其中b ^=0.59,则a ^=y -b ^ x =0.025,y ^=0.59x +0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为y ^=0.59×3.00+0.025=1.795(万元).3.下面四个命题中,错误的是( )A .从匀速传递的产品生产流水线上,质检员每15分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样B .对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大C .两个随机变量相关性越强,则相关系数的绝对值越接近于0D .在回归直线方程y ^=0.4x +12中,当解释变量x 每增加一个单位时,预报变量平均增加0.4个单位解析:选C 两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故C 错误.4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:选A 由列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k = n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.5.为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:有________以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”. 解析:由2×2列联表可知,K 2=100×(25×30-10×35)240×60×35×65≈2.93,因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.答案:90%6.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:则y 关于t 的回归方程是________________.解析:由表中数据得n =5,t =1n ∑i =1n t i =155=3,y =1n ∑i =1n y i =365=7.2.又∑i =1nt 2i -n t 2=55-5×32=10, ∑i =1nt i y i -n t y =120-5×3×7.2=12.从而b ^=∑i =1nt i y i -n t y∑i =1nt 2i -n t2=1210=1.2, a ^=y -b ^t =7.2-1.2×3=3.6, 故所求回归方程为y ^=1.2t +3.6. 答案:y ^=1.2t +3.67.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x (万元)和销售量y (万台)的数据如下:(2)若用y =c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z =200y -x .根据(2)的结果,求当广告费x =20时,销售量及利润的预报值.参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .参考数据:5≈2.24.解:(1)∵x =8,y =4.2,∑i =17x i y i =279.4,∑i =17x 2i =708,∴b ^=∑i =17x i y i -7x y∑i =17x 2i -7x2=279.4-7×8×4.2708-7×82=0.17,a ^=y -b ^x =4.2-0.17×8=2.84, ∴y 关于x 的线性回归方程为y ^=0.17x +2.84.(2)∵0.75<0.88且R 2越大,反映残差平方和越小,模型的拟合效果越好, ∴选用y ^=1.63+0.99x 更好.(3)由(2)知,当x =20时,销售量的预报值y ^=1.63+0.9920≈6.07(万台),利润的预报值z =200×(1.63+0.9920)-20≈1 193.04(万元).B 级——创高分自选1.(2018·江门一模)为探索课堂教学改革,江门某中学数学老师用“传统教学”和“导学案”两种教学方式分别在甲、乙两个平行班进行教学实验.为了解教学效果,期末考试后,分别从两个班级各随机抽取20名学生的成绩进行统计,得到如下茎叶图.记成绩不低于70分者为“成绩优良”.(1)请大致判断哪种教学方式的教学效果更佳,并说明理由;(2)构造一个教学方式与成绩优良的2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.临界值表:P(K2≥k0)0.100.050.0250.010k0 2.706 3.841 5.024 6.635解:(1)“导学案”教学方式教学效果更佳.理由1:乙班样本数学成绩大多在70分以上,甲班样本数学成绩70分以下的明显更多.理由2:甲班样本数学成绩的平均分为70.2;乙班样本数学成绩的平均分为79.05.理由3:甲班样本数学成绩的中位数为68+722=70,乙班样本数学成绩的中位数为77+782=77.5.(2)2×2列联表如下:甲班乙班总计成绩优良101626成绩不优良10414总计202040由上表数据可得K2=40×(10×4-10×16)220×20×26×14≈3.956>3.841,所以能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.2.(2019·广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y (千克)与使用某种液体肥料的质量x (千克)之间的对应数据为如图所示的折线图.(1)依据折线图计算相关系数r (精确到0.01),并据此判断是否可用线性回归模型拟合y 与x 的关系;(若|r |>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X 限制,并有如下关系:元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.若商家安装了3台光照控制仪,求商家在过去50周的周总利润的平均值.相关系数公式:r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,参考数据:0.3≈0.55,0.9≈0.95. 解:(1)由已知数据可得x =2+4+5+6+85=5,y =3+4+4+4+55=4.因为∑i =15(x i -x )(y i -y )=(-3)×(-1)+0+0+0+3×1=6,∑i =15(x i -x )2=(-3)2+(-1)2+02+12+32=25,∑i =15(y i -y )2=(-1)2+02+02+02+12=2,所以相关系数r =∑i =15(x i -x )(y i -y )∑i =15(x i -x)2 ∑i =15(y i -y )2=625×2=0.9≈0.95. 因为|r |>0.75,所以可用线性回归模型拟合y 与x 的关系. (2)由条件可得在过去50周里,当X >70时,共有10周,此时只有1台光照控制仪运行,每周的周总利润为1×3 000-2×1 000=1 000(元).当50≤X≤70时,共有35周,此时有2台光照控制仪运行,每周的周总利润为2×3 000-1×1 000=5 000(元).当30<X<50时,共有5周,此时3台光照控制仪都运行,每周的周总利润为3×3 000=9 000(元).所以过去50周的周总利润的平均值为1 000×10+5 000×35+9 000×550=4 600(元),所以商家在过去50周的周总利润的平均值为4 600元.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课后限时集训(五十六) 变量间的相关关系与统计案例(建议用时:60分钟) A 组 基础达标一、选择题1.(2019·泉州模拟)在下列各图中,两个变量具有相关关系的图是( )(1) (2) (3) (4)A .(1)(2)B .(1)(3)C .(2)(4)D .(2)(3)D [(1)是函数关系,(4)不具有相关关系,排除A ,B ,C ,故选D.] 2.(2019·成都模拟)已知x ,y 的取值如下表所示.由表格分析y 与x 的线性关系,且y =0.95x +a ,则a =( ) A .2.2 B .2.6 C .3.36D .1.95B [由表格数据计算得x =2,y =4.5,又由公式a ^=y -b ^x ,得a ^=2.6,故选B.] 3.据统计表明,某城市每月的雾霾天数与该城市每月的汽车出行量呈线性相关关系,已知该城市10~12月份的数据统计如下表:内.线性回归方程有关公式:y ^=b ^x +a ^,b ^=∑ni =1x i y i -n x y ∑n i =1x 2i -n x2,a ^=y -b ^xA .4B .5C .6D .7A [由题意可知,x =5,y =15,b ^=5×15+3×8+7×22-3×5×1525+9+49-3×25=3.5,所以a ^=-2.5,所以线性回归方程为y ^=3.5x -2.5,又雾霾天数不超过11.5天,所以3.5x -2.5≤11.5,解得x ≤4,故选A.]4.设某大学女生的体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学女生的身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生的身高为170 cm ,则可断定其体重必为58.79 kgD [回归方程是通过最小二乘法求得的一种等量关系,借助它可以对变量进行估值,但不能求其准确值,故D 项错误.]5.(2019·洛阳模拟)学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量K 2=a +bc +d a +cb +d,并参考以下临界数据:( ) A .0.10 B .0.05 C .0.025 D .0.01A [由题意可得K 2=-245×55×75×25≈3.030>2.706,由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”出错的概率不超过0.10,故选A.] 二、填空题6.(2018·成都二诊)如图是调查某学校高三年级男、女学生是否喜欢篮球运动的等高条形图,阴影部分的高表示喜欢该项运动的频率.已知该年级男生、女生各500人(假设所有学生都参加了调查),现从所有喜欢篮球运动的同学中按分层抽样的方式抽取32人,则抽取的男生人数为________.24 [由条形图可得喜欢篮球运动的女生有100人,喜欢篮球运动的男生有300人,所以抽取的男生人数为32×34=24.]7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.68 [由x =30,得y =0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,即a =68.]8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.① [K 2≈3.918≥3.841,而P (K 2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.] 三、解答题9.经调查,3个成年人中就有一个高血压,那么什么是高血压?血压多少是正常的?经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的正常值变化情况如表所示.其中b ^=∑i =1x i y i -n x y ∑n i =1x 2i -n x2,a ^=y -b ^x ,∑8i =1x 2i =17 232,∑8i =1x i y i =47 384.(1)请画出表中数据的散点图;(2)表根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(a ^,b ^的值精确到0.01)(3)若规定,一个人的收缩压为标准值的0.9~1.06倍,则为血压正常人群;收缩压为标准值的1.06~1.12倍,则为轻度高血压人群;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为180 mm Hg 的70岁的老人,属于哪类人群?[解] (1)画出表中数据的散点图如图所示.(2)x =28+32+38+42+48+52+58+628=45,y =114+118+122+127+129+135+140+1478=129,∴b ^=∑8i =1x i y i-8x y ∑8i =1x 2i -8x2=47 384-8×45×12917 232-8×452=118129≈0.91, a ^=y -b ^x =129-0.91×45=88.05, ∴回归直线方程y ^=0.91x +88.05.(3)根据回归直线方程的预测,年龄为70岁的老人标准收缩压为0.91×70+88.05=151.75(mgHg),∵180151.75≈1.19,且1.12<1.19<1.20,∴收缩压为180 mm Hg的70岁老人为中度高血压人群.10.从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,将用电量的数据绘制成频率分布直方图如图所示.(1)求频率分布直方图中x的值并估计这50户用户的平均用电量;(2)若将用电量在[50,150)内的用户记为A类用户,标记为低用电家庭,用电量在[250,350)内的用户记为B类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,并将打分数据绘制成茎叶图如图所示.①从B类用户中任意抽取3户,求恰好有2户打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意与否与用电量高低有关”?K2=a +b c+d a+c b+d,n=a+b+c+d.[解](1)x=150-(0.006+0.003 6+0.002 4×2+0.001 2)=0.004 4,按用电量从低到高的六组用户数分别为6,9,15,11,6,3,所以估计这50户用户的平均用电量为150×(6×75+9×125+15×175+11×225+6×275+3×325)=186度.(2)①B 类用户共9人,打分超过85分的有6人,所以从B 类用户中任意抽取3户,恰好有2户打分超过85分的概率为C 26C 13C 39=1528.②K 2=15×9×12×12=1.6<3.841,所以没有95%的把握认为“满意与否与用电量高低有关”.B 组 能力提升1.(2019·大连模拟)在对具有线性相关的两个变量x 和y 进行统计分析时,得到如下数据:由表中数据求得y 关于x 的回归方程为y =0.65x -1.8,则(4,1),(m,2),(8,3)这三个样本点中落在回归直线下方的有( ) A .1个 B .2个 C .3个D .0个B [由表中数据,得x =15×(4+m +8+10+12)=34+m5, y =15×(1+2+3+5+6)=3.4,代入回归方程y ^=0.65x -1.8中, 得3.4=0.65×34+m5-1.8,计算得出m =6.所以x =4时,y ^=0.65×4-1.8=0.8<1,点(4,1)在回归直线y ^=0.65x -1.8上方;x =6时,y ^=0.65×6-1.8=2.1>2,点(6,2)在回归直线y ^=0.65x -1.8下方;x =8时,y ^=0.65×8-1.8=3.4>3,点(8,3)在回归直线y ^=0.65x -1.8下方. 综上,(4,1),(6,2),(8,3)这三个样本点中落在回归直线下方的有2个.故选B.] 2.下表是我国某城市在2018年1月份至10月份期间各月最低温度与最高温度(单位:℃)的数据一览表.A.最低温度与最高温度为正相关B.每月最高温度与最低温度的平均值在前8个月逐月增加C.月温差(最高温度减最低温度)的最大值出现在1月D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大B[将最高温度、最低温度、温差列表如下,平均值在前8个月不是逐月增加,B项错;月温差的最大值出现在1月,C项正确;1月至4月的月温差相对于7月至10月,波动性更大,D项正确.故选B.]3.为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:90%[K2=-260×40×35×65≈2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.]4.(2019·哈尔滨模拟)某单位为了提高员工的业务水平,举办了一次“岗位技能”大赛,从参赛的青年技师(35岁及35岁以下的技师)和中老年技师(35岁以上的技师)的成绩中各抽取20个进行研究.满分为100分,且均保留到小数点后一位,如95.3.具体成绩如茎叶图所示(以成绩的整数部分为茎,小数部分为叶),并将这40个成绩分成四组,第一组[95,96);第二组[96,97);第三组[97,98);第四组[98,99].(1)根据以上数据写出抽取的20名青年技师成绩的中位数,并补全上面的频率分布直方图; (2)从成绩在[95,97)之间的技师中随机抽取2个,求其中2人成绩在[95,96)之间的概率; (3)研究发现从业时间与岗位技能水平之间具有线性相关关系,从上述抽取的40名技师中抽取5名技师的成绩,数据如下表.其中x =15,y =97.1.用最小二乘法求得的回归方程为y ^=0.16x +a ^,请完成下表,并根据下表判断该线性回归模型对该组数据的拟合效果.(通常相关指数R 2>0.80时认为线性回归模型对该组数据是有效的)附:R 2=1-∑i =1y i -y i 2∑ni =1y i -y2.[解] (1)将数据按从小到大的顺序排列,第10名和第11名青年技师的成绩分别为97.2和97.4,所以中位数是97.3. 频率分布直方图如图所示.(2)设所求事件为A ,由已知得成绩在[95,97)之间的技师共有12名,成绩在[95,96)之间的技师共有4名,则P (A )=C 24C 212=111. (3)因为a ^=y -0.16x =94.7, 所以y ^=0.16x +94.7. 补全统计表如表,所以该线性回归模型对该组数据是有效的.。