高中数学:变量间的相关关系与统计案例练习
高中数学:变量间的相关关系与统计案例练习
1.(辽宁丹东教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有 的把握认为“学生性别与支持该活动没有关系”.( C )
附:
P (K 2≥k )
0.100 0.050 0.025 0.010 0.001 k
2.706
3.841 5.024
6.635
10.828
C .1%
D .0.1%
解析:因为6.635<6.705<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”,故选C.
2.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关
解析:由y =-0.1x +1,知x 与y 负相关,即y 随x 的增大而减小,又y 与z 正相关,所以z 随y 的增大而增大,减小而减小,所以z 随x 的增大而减小,x 与z 负相关,故选C.
3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=1
3x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^
的值是( B )
A.116 B .18 C.14
D .12
解析:依题意可知样本点的中心为? ??
??
34,38,则38=13×34+a ^,解得a ^
=18.
4.为考察A 、B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:
根据图中信息,在下列各项中,说法正确的是( C ) A .药物A 、B 对该疾病均没有预防效果 B .药物A 、B 对该疾病均有显著的预防效果 C .药物A 的预防效果优于药物B 的预防效果 D .药物B 的预防效果优于药物A 的预防效果
解析:根据两个等高条形图知,药物A 实验显示不服药与服药时患病的差异较药物B 实验显示明显大,
∴药物A 的预防效果优于药物B 的预防效果.故选C. 5.(河南焦作一模)已知变量x 和y 的统计数据如下表:
x 3 4 5 6 7 y
2.5
3
4
4.5
6
根据上表可得回归直线方程为y =b x -0.25,据此可以预测当x =8时,y ^
=( C ) A .6.4 B .6.25 C .6.55 D .6.45
解析:由题意知x =
3+4+5+6+7
5
=5,
y =2.5+3+4+4.5+65
=4,
将点(5,4)代入y ^=b ^x -0.25,解得b ^=0.85,则y ^
=0.85x -0.25, 所以当x =8时,y ^
=0.85×8-0.25=6.55,故选C.
6.(南昌模拟)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.
附表:
由K 2
=(a +b )(c +d )(a +c )(b +d )算得,K 2
=58×42×35×65≈9.616,参照附表,
得到的正确结论是( C )
A .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别有关”
B .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别无关”
C .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”
D .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关”
解析:由题意K 2的观测值≈9.616>6.635,所以在犯错误的概率不超过0.01的前提下认为“生育意愿与城市级别有关”.
7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^
=0.77x +52.9.
解析:由已知可计算求出x =30,而线性回归方程必过点(x ,y ),则y =0.77×30+52.9=76,设模糊数字为a ,则
a +62+75+80+90
5
=76,计算得a =73.
8.(赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:
人)
0.025 .
附表:
解析:由列联表计算K 2
的观测值k =30×20×20×30≈5.556>5.024,∴推断犯错误的
概率不超过0.025.
9.(安徽蚌埠段考)为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:
有
解析:由2×2列联表可知,K 2
=100×(25×30-10×35)2
40×60×35×65
≈2.93,因为2.93>2.706,所以
有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.
10.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:
由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^
=-3.2x +40,且m +n =20,则其中的n = 10 .
解析:x =
9+9.5+m +10.5+115=8+m 5,y =11+n +8+6+55=6+n
5,回归直线一定经
过样本点中心(x ,y ),即6+n 5=-3.2? ?
?
??8+m 5+40,即3.2m +n =42.
又因为m +n =20,即??? 3.2m +n =42,m +n =20,解得???
m =10,
n =10,
故n =10. 11.(重庆调研)某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:
(1)5人中任选2人,求被选中的恰好是男、女用户各1人的概率;
(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.
注:K 2
=(a +b )(c +d )(a +c )(b +d )
,n =a +b +c +d .
解:(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为550=1
10. 所以在满意产品的用户中应抽取女用户20×110=2(人),男用户30×1
10=3(人).
抽取的5人中,三名男用户记为a ,b ,c ,两名女用户记为r ,s ,则从这5人中任选2人,共有10种情况:ab ,ac ,ar ,as ,bc ,br ,bs ,cr ,cs ,rs .
其中恰好是男、女用户各1人的有6种情况:ar ,as ,br ,bs ,cr ,cs . 故所求的概率为P =6
10=0.6. (2)由题意,得K 2的观测值为
k =80(30×20-20×10)2(30+20)(10+20)(30+10)(20+20)=16
3
≈5.333>5.024.
又P(K2≥5.024)=0.025.
故有97.5%的把握认为“产品用户是否满意与性别有关”.
12.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2008~2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:∑
i=1
7
y i=9.32,∑
i=1
7
t i y i=40.17,
∑
i=1
7
(y i-y)2=0.55,7≈2.646.
参考公式:相关系数r=
∑
i=1
n
(t i-t)(y i-y)
∑
i=1
n
(t i-t)2∑
i=1
n
(y i-y)2
,
回归方程y
^
=a
^
+b
^
t中斜率和截距的最小二乘估计公式分别为:b
^
=
∑
i=1
n
(t i-t)(y i-y)
∑
i=1
n
(t i-t)2
,a
^
=
y -b ^t -.
解:(1)由折线图中数据和附注中参考数据得 t =
4,∑i =1
7
(t i -t )2
=28,
∑i =17
(y i -y )2=0.55,
∑i =1
7
(t i -t )(y i -y )=∑i =1
7
t i y i -t ∑i =1
7
y i =40.17-4×9.32=2.89,
r ≈
2.89
0.55×2×2.646
≈0.99.
因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.
(2)由y =9.32
7≈1.331及(1)得b ^=
∑i =1
7
(t i -t )(y i -y )
∑i =17
(t i -t )2
=2.89
28≈0.10,
a ^=y -
b ^ t -
=1.331-0.10×4≈0.93. 所以y 关于t 的回归方程为 y ^
=0.93+0.10t .
将2016年对应的t =9代入回归方程得:y ^
=0.93+0.10×9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.
13.(湖南张家界一模)已知变量x ,y 之间的线性回归方程为y ^
=-0.7x +10.3,且变量x ,y 之间的一组相关数据如下表所示,则下列说法错误的是( C )
x 6 8 10 12 y
6
m
3
2
A.变量x ,y
B .可以预测,当x =20时,y ^
=-3.7 C .m =4
D .该回归直线必过点(9,4)
解析:由-0.7<0,得变量x ,y 之间呈负相关关系,故A 正确;当x =20时,y ^
=-0.7×20+10.3=-3.7,故B 正确;由表格数据可知x =14×(6+8+10+12)=9,y =1
4(6+m +3+2)=11+m 4,则11+m 4=-0.7×9+10.3,解得m =5,故C 错;由m =5,得y =6+5+3+24=4,
所以该回归直线必过点(9,4),故D 正确.故选C.
14.(湖南永州模拟)已知x 与y 之间的几组数据如下表:
假设根据上表数据所得的线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( C )
A.b ^>b ′,a ^
>a ′ B .b ^>b ′,a ^
<a ′ C.b ^<b ′,a ^
>a ′
D .b ^<b ′,a ^
<a ′
解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线
性回归方程的公式与已知表格中的数据,可求得b ^=∑i =1
6
x i y i -6 x ·y ∑i =16
x 2i -6 x 2
=
58-6×72×13
6
91-6×? ??
?
?722=57
,a ^=y -b ^x =136-57×72=-
13, 所以b ^<b ′,a ^
>a ′.
15.(青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作
了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的1
6,女生喜欢韩剧的人数占女生人数2
3.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有 12 人.
P (K 2≥k 0)
0.050 0.010 0.001 k 0
3.841
6.635
10.828
喜欢韩剧
不喜欢韩剧
总计 男生 x
6 5x 6 x 女生 x 3 x 6 x 2 总计
x 2
x
3x 2
则k >3.841,
即k =3x 2? ???
?x 6·x 6-5x 6·x 32x ·x 2·x 2·x =3x 8>3.841,
解得x >10.243.
因为x 6,x
2为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.
16.(包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图. 注:年份代码1~7分别对应年份2010~2016.
(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程,预测2017年该企业的污水净化量; (3)请用数据说明回归方程预报的效果.
参考数据:y -=54,∑i =1
7
(t i -t -)(y i -y -)=21,14≈3.74,
∑i =1
7
(y i -y ^
i )2=9
4.
参考公式:相关系数r =
∑i =1
n
(t i -t )(y i -y )
∑i =1
n
(t i -t )2∑i =1
n
(y i -y )2
,
线性回归方程y ^=a ^+b ^t ,b ^=∑i =1n
(t i -t )(y i -y )
∑i =1n
(t i -t )2
,a ^=y -b ^t -
.
反映回归效果的公式为:R 2=1-
∑i =1
n (y i -y ^
i )2
∑i =1
n
(y i -y )2
,其中R 2越接近于1,表示回归的效果越好.
解:(1)由折线图中的数据得,
t =4,∑i =1
7 (t i -t -)2=28,∑i =1
7
(y i -y -)2=18,
所以r =
21
28×18
≈0.935. 因为y 与t 的相关系数近似为0.935,说明y 与t 的线性相关程度相当大,所以可以用线性回归模型拟合y 与t 的关系.
(2)因为y -=54,b ^=
∑i =1
7
(t i -t )(y i -y )
∑i =17
(t i -t )2
=2128=34,
所以a ^=y -b ^
t =54-3
4×4=51,
所以y 关于t 的线性回归方程为y ^=b ^t +a ^
=3
4t +51. 将2017年对应的t =8代入得y ^=3
4×8+51=57, 所以预测2017年该企业污水净化量约为57吨.
(3)因为R 2=1-
∑i =1
7 (y i -y ^
i )2
∑i =1
7
(y i -y )2
=1-94×118=1-18=7
8=0.875,
所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.