高中数学:变量间的相关关系与统计案例练习

高中数学:变量间的相关关系与统计案例练习

1.(辽宁丹东教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有 的把握认为“学生性别与支持该活动没有关系”.( C )

附:

P (K 2≥k )

0.100 0.050 0.025 0.010 0.001 k

2.706

3.841 5.024

6.635

10.828

C .1%

D .0.1%

解析:因为6.635<6.705<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”,故选C.

2.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关

解析:由y =-0.1x +1,知x 与y 负相关,即y 随x 的增大而减小,又y 与z 正相关,所以z 随y 的增大而增大,减小而减小,所以z 随x 的增大而减小,x 与z 负相关,故选C.

3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=1

3x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^

的值是( B )

A.116 B .18 C.14

D .12

解析:依题意可知样本点的中心为? ??

??

34,38,则38=13×34+a ^,解得a ^

=18.

4.为考察A 、B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:

根据图中信息,在下列各项中,说法正确的是( C ) A .药物A 、B 对该疾病均没有预防效果 B .药物A 、B 对该疾病均有显著的预防效果 C .药物A 的预防效果优于药物B 的预防效果 D .药物B 的预防效果优于药物A 的预防效果

解析:根据两个等高条形图知,药物A 实验显示不服药与服药时患病的差异较药物B 实验显示明显大,

∴药物A 的预防效果优于药物B 的预防效果.故选C. 5.(河南焦作一模)已知变量x 和y 的统计数据如下表:

x 3 4 5 6 7 y

2.5

3

4

4.5

6

根据上表可得回归直线方程为y =b x -0.25,据此可以预测当x =8时,y ^

=( C ) A .6.4 B .6.25 C .6.55 D .6.45

解析:由题意知x =

3+4+5+6+7

5

=5,

y =2.5+3+4+4.5+65

=4,

将点(5,4)代入y ^=b ^x -0.25,解得b ^=0.85,则y ^

=0.85x -0.25, 所以当x =8时,y ^

=0.85×8-0.25=6.55,故选C.

6.(南昌模拟)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.

附表:

由K 2

=(a +b )(c +d )(a +c )(b +d )算得,K 2

=58×42×35×65≈9.616,参照附表,

得到的正确结论是( C )

A .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别有关”

B .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别无关”

C .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”

D .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关”

解析:由题意K 2的观测值≈9.616>6.635,所以在犯错误的概率不超过0.01的前提下认为“生育意愿与城市级别有关”.

7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^

=0.77x +52.9.

解析:由已知可计算求出x =30,而线性回归方程必过点(x ,y ),则y =0.77×30+52.9=76,设模糊数字为a ,则

a +62+75+80+90

5

=76,计算得a =73.

8.(赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:

人)

0.025 .

附表:

解析:由列联表计算K 2

的观测值k =30×20×20×30≈5.556>5.024,∴推断犯错误的

概率不超过0.025.

9.(安徽蚌埠段考)为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:

解析:由2×2列联表可知,K 2

=100×(25×30-10×35)2

40×60×35×65

≈2.93,因为2.93>2.706,所以

有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.

10.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:

由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^

=-3.2x +40,且m +n =20,则其中的n = 10 .

解析:x =

9+9.5+m +10.5+115=8+m 5,y =11+n +8+6+55=6+n

5,回归直线一定经

过样本点中心(x ,y ),即6+n 5=-3.2? ?

?

??8+m 5+40,即3.2m +n =42.

又因为m +n =20,即??? 3.2m +n =42,m +n =20,解得???

m =10,

n =10,

故n =10. 11.(重庆调研)某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:

(1)5人中任选2人,求被选中的恰好是男、女用户各1人的概率;

(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.

注:K 2

=(a +b )(c +d )(a +c )(b +d )

,n =a +b +c +d .

解:(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为550=1

10. 所以在满意产品的用户中应抽取女用户20×110=2(人),男用户30×1

10=3(人).

抽取的5人中,三名男用户记为a ,b ,c ,两名女用户记为r ,s ,则从这5人中任选2人,共有10种情况:ab ,ac ,ar ,as ,bc ,br ,bs ,cr ,cs ,rs .

其中恰好是男、女用户各1人的有6种情况:ar ,as ,br ,bs ,cr ,cs . 故所求的概率为P =6

10=0.6. (2)由题意,得K 2的观测值为

k =80(30×20-20×10)2(30+20)(10+20)(30+10)(20+20)=16

3

≈5.333>5.024.

又P(K2≥5.024)=0.025.

故有97.5%的把握认为“产品用户是否满意与性别有关”.

12.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

注:年份代码1~7分别对应年份2008~2014.

(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;

(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.

附注:

参考数据:∑

i=1

7

y i=9.32,∑

i=1

7

t i y i=40.17,

i=1

7

(y i-y)2=0.55,7≈2.646.

参考公式:相关系数r=

i=1

n

(t i-t)(y i-y)

i=1

n

(t i-t)2∑

i=1

n

(y i-y)2

回归方程y

^

=a

^

+b

^

t中斜率和截距的最小二乘估计公式分别为:b

^

i=1

n

(t i-t)(y i-y)

i=1

n

(t i-t)2

,a

^

y -b ^t -.

解:(1)由折线图中数据和附注中参考数据得 t =

4,∑i =1

7

(t i -t )2

=28,

∑i =17

(y i -y )2=0.55,

∑i =1

7

(t i -t )(y i -y )=∑i =1

7

t i y i -t ∑i =1

7

y i =40.17-4×9.32=2.89,

r ≈

2.89

0.55×2×2.646

≈0.99.

因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.

(2)由y =9.32

7≈1.331及(1)得b ^=

∑i =1

7

(t i -t )(y i -y )

∑i =17

(t i -t )2

=2.89

28≈0.10,

a ^=y -

b ^ t -

=1.331-0.10×4≈0.93. 所以y 关于t 的回归方程为 y ^

=0.93+0.10t .

将2016年对应的t =9代入回归方程得:y ^

=0.93+0.10×9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.

13.(湖南张家界一模)已知变量x ,y 之间的线性回归方程为y ^

=-0.7x +10.3,且变量x ,y 之间的一组相关数据如下表所示,则下列说法错误的是( C )

x 6 8 10 12 y

6

m

3

2

A.变量x ,y

B .可以预测,当x =20时,y ^

=-3.7 C .m =4

D .该回归直线必过点(9,4)

解析:由-0.7<0,得变量x ,y 之间呈负相关关系,故A 正确;当x =20时,y ^

=-0.7×20+10.3=-3.7,故B 正确;由表格数据可知x =14×(6+8+10+12)=9,y =1

4(6+m +3+2)=11+m 4,则11+m 4=-0.7×9+10.3,解得m =5,故C 错;由m =5,得y =6+5+3+24=4,

所以该回归直线必过点(9,4),故D 正确.故选C.

14.(湖南永州模拟)已知x 与y 之间的几组数据如下表:

假设根据上表数据所得的线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( C )

A.b ^>b ′,a ^

>a ′ B .b ^>b ′,a ^

<a ′ C.b ^<b ′,a ^

>a ′

D .b ^<b ′,a ^

<a ′

解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线

性回归方程的公式与已知表格中的数据,可求得b ^=∑i =1

6

x i y i -6 x ·y ∑i =16

x 2i -6 x 2

58-6×72×13

6

91-6×? ??

?

?722=57

,a ^=y -b ^x =136-57×72=-

13, 所以b ^<b ′,a ^

>a ′.

15.(青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作

了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的1

6,女生喜欢韩剧的人数占女生人数2

3.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有 12 人.

P (K 2≥k 0)

0.050 0.010 0.001 k 0

3.841

6.635

10.828

喜欢韩剧

不喜欢韩剧

总计 男生 x

6 5x 6 x 女生 x 3 x 6 x 2 总计

x 2

x

3x 2

则k >3.841,

即k =3x 2? ???

?x 6·x 6-5x 6·x 32x ·x 2·x 2·x =3x 8>3.841,

解得x >10.243.

因为x 6,x

2为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.

16.(包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图. 注:年份代码1~7分别对应年份2010~2016.

(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程,预测2017年该企业的污水净化量; (3)请用数据说明回归方程预报的效果.

参考数据:y -=54,∑i =1

7

(t i -t -)(y i -y -)=21,14≈3.74,

∑i =1

7

(y i -y ^

i )2=9

4.

参考公式:相关系数r =

∑i =1

n

(t i -t )(y i -y )

∑i =1

n

(t i -t )2∑i =1

n

(y i -y )2

线性回归方程y ^=a ^+b ^t ,b ^=∑i =1n

(t i -t )(y i -y )

∑i =1n

(t i -t )2

,a ^=y -b ^t -

.

反映回归效果的公式为:R 2=1-

∑i =1

n (y i -y ^

i )2

∑i =1

n

(y i -y )2

,其中R 2越接近于1,表示回归的效果越好.

解:(1)由折线图中的数据得,

t =4,∑i =1

7 (t i -t -)2=28,∑i =1

7

(y i -y -)2=18,

所以r =

21

28×18

≈0.935. 因为y 与t 的相关系数近似为0.935,说明y 与t 的线性相关程度相当大,所以可以用线性回归模型拟合y 与t 的关系.

(2)因为y -=54,b ^=

∑i =1

7

(t i -t )(y i -y )

∑i =17

(t i -t )2

=2128=34,

所以a ^=y -b ^

t =54-3

4×4=51,

所以y 关于t 的线性回归方程为y ^=b ^t +a ^

=3

4t +51. 将2017年对应的t =8代入得y ^=3

4×8+51=57, 所以预测2017年该企业污水净化量约为57吨.

(3)因为R 2=1-

∑i =1

7 (y i -y ^

i )2

∑i =1

7

(y i -y )2

=1-94×118=1-18=7

8=0.875,

所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.

相关文档
最新文档