2019版高考数学总复习第十章算法初步统计统计案例58变量间的相关关系与统计案例课时作业文20180
课时作业 58 变量间的相关关系与统计案例
一、选择题
1.(2018·石家庄模拟(一))下列说法错误的是( ) A .回归直线过样本点的中心(x -,y -
)
B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C .对分类变量X 与Y ,随机变量K 2
的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小
D .在回归直线方程x ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^
平均增加0.2个单位
解析:本题考查命题真假的判断.根据相关定义分析知A ,B ,D 正确;C 中对分类变量
X 与Y 的随机变量K 2的观测值k 来说,k 越大,判断“X 与Y 有关系”的把握程度越大,故
C 错误,故选C.
答案:C
2.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y --b ^x -
.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A .11.4万元
B .11.8万元
C .12.0万元
D .12.2万元
解析:∵x -=10.0,y -=8.0,b ^=0.76,∴a ^=8-0.76×10=0.4,∴回归方程为y ^
=0.76x +0.4,把x =15代入上式得,y ^
=0.76×15+0.4=11.8(万元).
答案:B
3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 合计 爱好 40 20 60 不爱好 20 30 50 合计
60
50 110
由K 2
=
n ad -bc 2a +b
c +
d a +c
b +d
,
算得K 2
=
110×40×30-20×20
2
60×50×60×50
≈7.8.
附表
P (K 2≥k 0)
0.050 0.010 0.001 k 0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C .有99%以上的把握认为“爱好该项运动与性别有关”
D .有99%以上的把握认为“爱好该项运动与性别无关”
解析:根据独立性检验的定义,由K 2
≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
答案:C
4.(2017·山东卷)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y ^=b ^x +a ^.已知∑i =1
10
x i =225,∑i =1
10
y i =1 600,b ^
=4.该班某学生的脚长
为24,据此估计其身高为( )
A .160
B .163
C .166
D .170
解析:∵ ∑i =110
x i =225,∴ x =110∑i =1
10
x i =22.5.
∵ ∑i =1
10
y i =1 600,∴ y =110∑i =1
10
y i =160.
又b ^=4,∴ a ^=y -b ^
x =160-4×22.5=70. ∴ 回归直线方程为y ^
=4x +70.
将x =24代入上式得y ^
=4×24+70=166. 故选C. 答案:C
5.(2018·河南安阳二模)已知变量x 与y 的取值如下表所示,且2.5 x 2 3 4 5 y 6.5 m n 2.5 A.y ^=0.8x +2.3 B.y ^ =2x +0.4 C.y ^=-1.5x +8 D.y ^ =-1.6x +10 解析:由2.5 4×(6.5 +m +n +2.5)∈(3.5,5.5), 分别代入选项C ,D ,可得D 满足.故选D. 答案:D 6.(2018·陕西汉中一模)已知两个随机变量x ,y 之间的相关关系如下表所示: x -4 -2 1 2 4 y -5 -3 -1 -0.5 1 根据上述数据得到的回归方程为y ^=b ^x +a ^ ,则大致可以判断( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0 D.a ^<0,b ^<0 解析:由题意知x -=0.2,y - =-1.7, ∴b ^=28-5×0.2×-1.7 41-5×0.22 =29.740.8≈0.73>0, ∴a ^ =-1.7-0.73×0.2≈-1.85<0,故选C. 答案:C 二、填空题 7.某炼钢厂废品率x (%)与成本y (元/t )的线性回归方程为y ^ =105.492+42.569x .当成本控制在176.5元/t 时,可以预计生产的1 000t 钢中,约有________t 钢是废品. 解析:因为176.5=105.492+42.569x ,所以x ≈1.668,即成本控制在176.5元/t 时,废品率为1.668%. 所以生产的1 000 t 钢中,约有1 000×1.668%=16.68 t 钢是废品. 答案:16.68 8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2 ≈3.918,经查临界值表知P (K 2 ≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①有95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%. 解析:K 2 ≈3.918≥3.841,而P (K 2 ≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆. 答案:① 9.(2018·青岛检测)已知变量x ,y 具有线性相关关系,它们之间的一组数据如下表所示,若y 关于x 的线性回归方程为y ^ =1.3x -1,则m =________. x 1 2 3 4 y 0.1 1.8 m 4 解析:本题考查线性回归方程.由题意得x -=1 4(1+2+3+4)=2.5,代入线性回归方程 得y - =1.3×2.5-1=2.25,所以2.25=14 (0.1+1.8+m +4),解得m =3.1. 答案:3.1 三、解答题 10.(2018·合肥检测(二))某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人. (1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数; (2)依据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关? 选择自然科学类 选择社会科学类 合计 男生 女生 合计 附:K 2 = n ad -bc 2 a +b c + d a +c b +d ,其中n =a +b +c +d . P (K 2 ≥k 0) 0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001 k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解析:(1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为45105=37,女生选择社会科学类的频率为4575=3 5 . 由题意,男生总数为1 200×105 180=700(人), 女生总数为1 200×75 180=500(人), 所以估计选择社会科学类的人数为 700×37+500×3 5=600(人). (2)根据统计数据,可得列联表如下: 选择自然科学类 选择社会科学类 合计 男生 60 45 105 女生 30 45 75 合计 90 90 180 则K 2 = 180×60×45-30×452 105×75×90×90=36 7 ≈5.142 9>5.024, 所以在犯错误的概率不超过0.025的前提下能认为科类的选择与性别有关. 11.(2018·四川四市一模)张三同学从7岁起到13岁每年生日时对自己的身高测量后记录如下表: 年龄x (岁) 7 8 9 10 11 12 13 身高y (cm) 121 128 135 141 148 154 160 (1)求身高y 关于年龄x 的线性回归方程; (2)利用(1)中的线性回归方程,分析张三同学7岁至13岁身高的变化情况,如17岁之前都符合这一变化,请预测张三同学15岁时的身高. 附:回归直线的斜率和截距的最小二乘法估计公式分别为: b ^= ∑n i =1 x i -x y i -y ∑n i =1 x i -x 2 ,a ^=y -b ^ x . 解析:(1)由题意得x -=1 7(7+8+9+10+11+12+13)=10. y -=1 7(121+128+135+141+148+154+160)=141, ∑7 i =1 (x i -x -)2 =9+4+1+0+1+4+9=28, ∑7 i =1 (x i -x -)(y i -y - )=(-3)×(-20)+(-2)×(-13)+(-1)×(-6)+0×0+1×7+2×13+3×19=182, 所以b ^= ∑7 i =1 x i -x y i -y ∑7 i =1 x i -x 2 =18228=132,a ^=y -b ^ x =141-132 ×10=76,所求回归方程为y ^=13 2 x +76.. (2)由(1)知,b ^=13 2>0,故张三同学7岁至13岁的身高每年都在增高,平均每年增高 6.5 cm. 将x =15代入(1)中的回归方程,得y ^=13 2×15+76=173.5,故预测张三同学15岁的身 高为173.5 cm. [能力挑战] 12.(2017·新课标全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: 旧养殖法 新养殖法 (1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量<50 kg 箱产量≥50 kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附: K 2 = n ad -bc 2a +b c + d a +c b +d . 解析:(1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表 箱产量<50 kg 箱产量≥50 kg 旧养殖法 62 38 新养殖法 34 66 K 2 的观测值= 200×62×66-34×38 2 100×100×96×104 ≈15.705. 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.