高中数学选择性必修三 8 1 成对数据的相关关系-A基础练(含答案)

合集下载

高中数学新教材选择性必修第三册第八章 成对数据的统计分析 8.1 成对数据的相关关系(南开题库含详解)

高中数学新教材选择性必修第三册第八章  成对数据的统计分析 8.1  成对数据的相关关系(南开题库含详解)

第八章成对数据的统计分析 8.1 成对数据的相关关系一、选择题(共40小题;共200分)1. 下列图形中具有相关关系的两个变量是( )A. B.C. D.2. 有关线性回归的说法,不正确的是( )A. 具有相关关系的两个变量不具有因果关系B. 散点图能直观地反映数据的相关程度C. 回归直线最能代表线性相关的两个变量之间关系D. 任一组数据都有回归直线3. 下列两个变量之间的关系,不是函数关系的是( )A. 角度与它的正弦值B. 圆的半径与它的面积C. 正n边形的边数和正n边形的内角和D. 人的年龄与身高4. 下列两个变量之间的关系,不是函数关系的是( )A. 角度与它的余弦值B. 正方形的边长与面积C. 正n边形的边数与各内角的角度之和D. 人的年龄与身高5. 已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程必过( )A. 点(2,2)B. 点(1.5,0)C. 点(1,2)D. 点(1.5,4)6. 一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A. 确定性关系B. 相关关系C. 函数关系D. 无任何关系7. 下列关系属负相关的是( )A. 父母的身高与子女身高的关系B. 农作物产量与施肥的关系C. 吸烟与健康的关系D. 数学成绩与物理成绩的关系8. 如图所示,每个图的两个变量具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)9. 下列两个变量之间是相关关系的是( )A. 圆的面积与半径之间的关系B. 球的体积与半径之间的关系C. 角度与它的正弦值之间的关系D. 降雪量与交通事故的发生率之间的关系10. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),得散点图(2),由这两个散点图可以判断( )A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关11. 已知变量x和y满足关系y=−0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关12. 下列关系中,是相关关系的有( )①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A. ①②B. ①③C. ②③D. ②④13. 假设有两个分类变量X和Y的2×2列联表:YX y1y2总计x1a10a+10x2c30c+30总计6040100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )A. a=45,c=15B. a=40,c=20C. a=35,c=25D. a=30,c=3014. 对于给定的两个变量的统计数据,下列说法中正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系15. 以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件进行某项指标检测,这种抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y^=0.2x+12中,当解释变量x每增加1个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y,它们的随机变量K2的观测值k越小," X与Y有关系"的把握程度越大,其中正确的命题是( )A. ①④B. ②③C. ①③D. ②④16. 对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )A. 频率分布直方图与总体密度曲线无关B. 频率分布直方图就是总体密度曲线C. 样本容量很大的频率分布直方图就是总体密度曲线D. 如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线17. 试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( )A. B.C. D.18. 列两个变量之间的关系,不是函数关系的是( )A. 角度与它的余弦值B. 正方形的边长与面积C. 正n边形的边数与内角度数之D. 人的年龄与身高19. 单位产品成本与其产量的相关关系,单位产品成本与单位产品原材料消耗量相关关系中( )A. 前者是正相关,后者是负相关B. 前者是负相关,后者是正相关C. 两者都是正相关D. 两者都是负相关20. 在下列各图中,图中的两个变量间具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)21. 下列变量之间的关系是函数关系的是( )A. 已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量为这个函数对应方程的判别式B. 光照时间和果树亩产量C. 降雪量和交通事故的发生率D. 每亩施用肥料量和粮食亩产量22. 下列有关样本相关系数的说法不正确的是( )A. 相关系数用来衡量x与y之间的线性相关程度B. ∣r∣≤1,且∣r∣越接近0,相关程度越小C. ∣r∣≤1,且∣r∣越接近1,相关程度越大D. ∣r∣≥1,且∣r∣越接近1,相关程度越大23. 观察下列各图:其中两个变量x,y具有线性相关关系的图是( )A. ①②B. ①④C. ③④D. ②③24. 如图是根据变量x,y的观测数据(x i,y i,i=1,2,⋯,10)(得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )A. ①②B. ①④C. ②③D. ③④25. 如图是根据x,y的观测数据(x i,y i)(i=1,2,⋯,10)得到的散点图,由这些散点图可以判断变量x,y具有线性相关关系的图是( )A. ①②B. ①④C. ②③D. ③④26. 下列语句所表示的事件不具有相关关系的是( )A. 瑞雪兆丰年B. 名师出高徒C. 吸烟有害健康D. 喜鹊叫喜27. 已知变量x和y满足关系y=−0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关28. 观察下列散点图,其中两个变量的相关关系判断正确的是( )A. a为正相关,b为负相关,c为不相关B. a为负相关,b为不相关,c为正相关C. a为负相关,b为正相关,c为不相关D. a为正相关,b为不相关,c为负相关29. 在一组样本数据(x1,y1),(x2,y2),⋯,(x n,y n)(n≥2,x1,x2,⋯,x n不全相等)的散点图中,若所x+1上,则这组样本数据的样本相关系数为有样本点(x i,y i)(i=1,2,⋯,n)都在直线y=12( )D. 1A. −1B. 0C. 1230. 在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A. 100个吸烟者中至少有99人患有肺癌B. 1个人吸烟,那么这人有99%的概率患有肺癌C. 在100个吸烟者中一定有患肺癌的人D. 在100个吸烟者中可能一个患肺癌的人也没有31. 在研究打酣与患心脏病之间的关系中,通过收集数据、整理分析数据得"打酣与患心脏病有关"的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是( )A. 100个心脏病患者中至少有99人打酣B. 1个人患心脏病,则这个人有99%的概率打酣C. 100个心脏病患者中一定有打酣的人D. 100个心脏病患者中可能一个打酣的人都没有32. 有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是( )A. ①③B. ②④C. ②⑤D. ④⑤33. 对于回归分析,下列说法错误的是( )A. 在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B. 线性相关系数可以为正或负C. 回归分析中,如果r2=1或r±1,说明x与y之间完全线性相关D. 样本相关系数r∈(−1,1)34. 下图中的两个变量具有相关关系的是( )A. B.C. D.35. 下面两个变量之间是相关关系的是( )A. 出租车车费与行驶的里程B. 房屋面积与房屋价格C. 身高与体重D. 铁的大小与质量36. 对于给定的两个变量的统计数据,下列说法正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系37. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),得散点图1;对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),得散点图2.由这两个散点图可以判断( ).A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关38. 下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温∘C1813104−1杯数2434395163若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是( )A. y=x+6B. y=x+42C. y=−2x+60D. y=−3x+7839. 观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )A. B.C. D.40. 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A. r2<r1<0B. 0<r2<r1C. r2<0<r1D. r2=r1二、填空题(共30小题;共150分)41. 下列关系中带有随机性相关关系的有.①光照时间与果树的亩产量的关系;②圆柱体积与其底面直径的关系;③自由落体的物体的质量与落地时间的关系;④球的表面积与球半径之间的关系.42. 下列关系中,属于相关关系的是.①正方形的边长和面积之间的关系;②水稻产量与施肥量之间的关系;③人的身高与学习成绩之间的关系;④降雪量与交通事故的发生率之间的关系.43. 下列变量间的关系是相关关系的有,是函数关系的有.①球的表面积与体积;②光照时间和果树亩产量;③降雪量和交通事故发生率;④出租车费与行驶的里程;⑤人的身高与视力;⑥家庭的支出与收入;⑦收入水平与纳税水平.44. 在研究两个变量的关系时,可以通过残差e^1,e^2,⋯,e^n来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为分析.45. 相应于显著性水平0.05,观测值为10组的相关数临界值为.46. 自变量取值一定时,因变量的取值两个变量之间的关系叫做相关关系.与函数关系,相关关系是一种.47. 对具有的两个变量进行统计分析的方法叫回归分析.48. 现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高−130磅.其中体重与身高分别以磅和英寸为单位.如果换算为公制(1英寸≈2.5cm,1磅≈0.45kg),回归方程应该为.49. 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.50. 在分析两个分类变量之间是否有关系时,常用到的图表有.51. 据两个变量x,y之间的关系,观察数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否).52. 为了判断两个变量x,y之间是否具有相关关系,描出每一组观测值(x,y)表示的点,得到的图形称为.53. 表示具有相关关系的两个变量的一组数据的图形叫做.54. 现实世界中存在许多情况是两个变量间有密切联系,但这种关系无法用确定的函数关系式表达出来,这种变量之间的关系称.55. 在两个变量的回归分析中,作散点图的目的是.56. 判断下列结论的正误(正确的打“√”错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系.( )(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( ) 57. 已知一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1、2.…n),若e i恒为0,则R2为.58. 若有一组数据的总偏差平方和为100,相关指数为0.5,则其残差平方和为,回归平方和为.59. 许多因素都会影响贫穷,教育也是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的线性回归方程为y^=0.8x+4.6,斜率的估计值等于0.8说明,成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)60. 有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是.61. 下列四个关系中为相关关系的是.①正方形的边长与其面积的关系;②圆的面积与半径的关系;③圆柱体积与其底面半径的关系;④Rt△ABC中,锐角A的大小与斜边长度的关系.62. 某市居民2010∼2014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20102011201220132014收入x11.512.11313.315支出y 6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有相关关系.(填“正”或“负”)63. 有下列关系:①名师出高徒;②球的体积与该球的半径之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系;⑥乌鸦叫,没好兆.其中,具有相关关系的是.64. 根据你的生活经验及掌握的知识,将下列所有你认为正确的结论填入题后空中.①一般地,学生的数学成绩与物理成绩之间是正相关的;②一般地,学生的数学成绩与英语成绩是负相关的;③一块农田的水稻产量与施肥量之间是相关关系;④对于在校儿童,年龄的大小与阅读能力有很强的相关关系.以上正确的结论是.65. 有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是66. 已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是相关(填“正”或“负”)施化肥量x15202530354045水稻产量y33034536540544545045567. 下列命题中:①命题p:“∃x0∈R,x02−x0−1>0”的否定¬p“∀x∈R,x2−x−1≤0”;②汽车的重量和汽车每消耗1升汽油所行驶的平均路程成正相关关系;③命题“若a>b,则2a>2b−1”的否命题为“若a≤b,则2a≤2b−1”;④概率是随机的,在试验前不能确定.正确的有.68. 有同学在用电子邮件时发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少,为了研究国籍与邮箱名称是否与含有数字有关,于是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么认为"国籍和邮箱名称里是否含有数字有关"的把握性为.(用百分数表示)69. 某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为y^=105.492+42.569x.当成本控制在176.5元/t时,可以预计生产1000t钢中,约有t钢是废品.70. 以下四个命题,其中正确的序号是.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y^=0.2x+12中,当解释变量x每增加一个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.三、解答题(共30小题;共390分)71. 如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?72. 某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:x24568y3040605070判断这两者是否具有相关关系,如果具有的话,进一步判断是正相关还是负相关.73. 从高一(1)班中随机选出10名同学,将他们的身高、数学成绩和物理成绩列表如下:身高(m) 1.50 1.60 1.55 1.65 1.45 1.60 1.52 1.66 1.70 1.40数学成绩(分)90857888877695756870物理成绩(分)88848083787090807468试判断数学成绩与身高和物理成绩是否成线性相关关系.74. “明师出高徒”可以解释为教师的水平越高,学生的水平也越高.那么,教师的水平与学生的水平是否成相关关系?如成相关关系,是正相关,还是负相关?你能举出更多描述生活中两个变量或相关关系的成语吗?75. 5个学生的数学和物理成绩如下表(单位:分)画出散点图,并判断它们是否有相关关系.76. 在班级随机地抽取8名学生,得到一组数学成绩与物理成绩的数据:数学成绩6090115809513580145物理成绩4060754070856090(1)计算出数学成绩与物理成绩的平均分及方差;(2)求相关系数r的值,并判断相关性的强弱;(r≥0.75为强)(3)求出数学成绩x与物理成绩y的线性回归直线方程,并预测数学成绩为110的同学的物理成绩.77. 下图甲、乙分别是对应于(a),(b)两组数据的散点图:表(a)A261813104−1B202434385064表(b)C05101520253035D541.67602.66672.09704.99806.71908.59975.421034.75根据数据的散点图判断两图中变量是否具有相关关系;如果具有相关关系,请说出是哪种相关关系.78. 抽测10名15岁的男生的身高x(单位:cm)和体重y(单位:kg),得到如下数据:x157153151158155156159160158163y45.544424644.54546.5474549(1)作出散点图;(2)从散点图中观察身高与体重成什么关系?(3)如果近似成线性关系,试画出一条直线来近似地表示这种关系.79. 某校为调查学生喜欢数学是否与性别有关,对50名学生进行了问卷调查得到了如下的列联表:喜欢数学不喜欢数学合计男生5女生10合计50已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3.5临界值参考:P(k2≥k)0.100.050.250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828,其中n=a+b+c+d)(参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(1)请将上面的列联表补充完整(不用写计算过程);(2)是否有99.5%的把握认为喜欢数学与性别有关?说明你的理由.80. 有一台机床可以按各种不同的速度运转,其加工的零件中有二级品,并且每小时生产的二级品零件的数量随机床运转的速度而变化,下面是记录的数据:机床运转的速度(转/秒)每小时生产二级品的数量/个851281491611(1)作出散点图,并说明上述两个变量之间是否具有线性相关关系;(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;(3)若实际生产中每小时所允许的二级品数量不超过10个,那么机床运转速度不得超过多少转/秒?(保留两位小数)81. 给出施化肥量对水稻产量影响的试验数据如下表:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出散点图,并判断这两者之间是否具有线性相关关系;(2)如果具有线性相关关系,请求出回归直线并且画出图形.82. 在某小区随机抽取16名成年男子测量他们的体重,x表示第一年的体重,y表示第二年的体重,数据如下(单位:kg):x77599098668569847276887595847965y68668199759175808069726391849273(1)对变量y与x进行相关性检验;(2)如果y与x具有线性相关关系,求回归直线方程.83. 下表是某地一年中10天测量的白昼时间统计表(时间近似到0.1小时,一年按365天计算):日期日期位置序号x白昼时间y(小时)日期日期位置序号x白昼时间y(小时)1月1日1 5.66月21日17219.42月28日5910.28月13日22516.43月21日8012.49月20日26312.44月27日11716.410月25日2988.55月6日12617.312月21日3555.4(1)以日期在 365 天中的位置序号 x 为横坐标,白昼时间 y 为纵坐标,在给定的坐标系中画出这些数据的散点图;(2)试选用一个函数近似描述一年中白昼时间 y 与日期位置 x 之间的函数关系; (3)用 (2) 中的函数模型估计该地一年中大约有多少天白昼时间大于 15.9 个小时.84. 某公司的广告费支出 x 与销售额 y (单位:万元)之间有下列对应数据x 24568y 3040605070参考公式:回归方程为 y ^=bx +a ,其中 b =∑x i y i −nxyn i=1∑x i 2−nx2n i=1,a =y −bx .(1)画出散点图,并判断广告费与销售额是否具有相关关系;(2)根据表中提供的数据,用最小二乘法求出 y 与 x 的回归方程 y ^=bx +a ; (3)预测销售额为 115 万元时,大约需要多少万元广告费.85. 在研究色盲与性别的关系调查中,调查了男性 480 人,其中有 38 人患色盲,调查的 520 个女性中 6 人患色盲,根据以上的数据得到一个 2×2 的列联表如下患色盲不换色盲总计男480女520总计1000(1)请根据以上的数据完成这个 2×2 的列联表;(2)若认为“性别与患色盲有关系”,则出错的概率会是多少? 参考数据:(38×514−442×6)2480×520×44×956=0.02714;(38×6−442×514)2480×520×44×956=4.90618;(38×442−6×514)2480×520×44×956=0.01791;86. 菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水 x (单位:千克)清洗该蔬菜 1 千克后,蔬菜上残留的农药 y (单位:微克)的统计表:x 12345y 5854392910(1)在下面的坐标系中,描出散点图,并判断变量 x 与 y 的相关性;(2)若用解析式 y ^=cx 2+d 作为蔬菜农药残量 y ^ 与用水量 x 的回归方程,令 ω=x 2,计算平均值 ω 和 y ,完成以下表格(填在答题卡中),求出 y ^ 与 x 的回归方程;(c ,d 精确到 0.1)ω1491625y 5854392910ωi −ωy i −y(3)对于某种残留在蔬菜上的农药,当它的残留量低于 20 微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到 0.1,参考数据 √5≈2.236)(附:线性回归方程 y ^=b ^x +a ^ 中系数计算公式分别为: b^=i −x )(i −y )n i=1(x −x )2,a ^=y −b^x .)87. 某地区 2007 年至 2013 年农村居民家庭纯收入 y (单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t 1234567人均纯收入y2.93.33.64.44.85.25.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.88. 在块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg )施化肥量x/kg 15202530354045水稻产量y/kg 330345365405445450455 (1)作出这些数据的散点图; (2)由(1)分析两变量之间的关系: (3)求回归线性方程; (4)当所施化肥量为 50kg 时,求水稻的产量.89. 假设某关于设备的使用年限 x (年)和所支出的维修费用 y (万元)有如下的统计资料.x 23456y 2.2 3.8 5.5 6.57.0(1)画出散点图并判断是否线性相关; (2)如果线性相关,求回归直线方程; (3)估计使用 10 年时的维修费用.90. 已知一个样本数据的对应值如下表:x 1825303941424952y 356788910判断 x ,y 之间是否有线性相关关系,若有,求其线性回归方程.91. 在电视的收视率调查中,得到性别与收视习惯的列联表如下表所示.试用独立性检验的方法分析性别与收视习惯是否有关?若有关系,则说出可在多大程度上认为有关系?92. 如图是某企业 2010 年至 2016 年污水净化量(单位:吨)的折线图.注:年份代码 1∼7 分别对应年份 2010∼2016.附注:参考数据:y =54,∑(t i −t)7i=1(y i −y )=21,√14≈3.74,∑(y i −yi ^)27i=1=94.参考公式:相关系数 r =i −t)n i=1i −y )√∑(t i −t)ni=1∑(y i −y )2ni=1 y ^=a ^+b^t 中斜率和截距的最小二乘估计公式分别为 b^=i −t)n i=1i −y )∑(t −t)2n i=1,a ^=y −b^t . 反映回归效果的公式为 R 2=1i i 2n i=1∑(y −y)2n ,其中 R 2越接近于 1,表示回归的效果越好. (1)由折线图看出,可用线性回归模型拟合 y 和 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程,预测 2017 年该企业污水净化量; (3)请用数据说明回归方程预报的效果.93. 2015 男篮亚锦赛决赛阶段,中国男篮以 9 连胜的不败战绩赢得第 28 届亚锦赛冠军,同时拿到亚洲唯一 1 张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛 MVP (最有价值球员),如表是易建联在这 9 场比赛中投篮的统计数据.注:(1)表中 a/b 表示出售 b 次命中 a 次;(2)TS%(真实得分率)是横梁球员进攻的效率,其计算公式为:TS%=全场得分2×(投篮出手次数+0.44×罚球出手次数);(1)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率;(2)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率;(3)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.94. 2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP最有价值球员),如表是易建联这9场比赛中投篮的统计数据.注:(1)表中a/b表示出手b次命中a次;(2)TS%(真实得分率)是衡量球员进攻的效率,其计算公式为:TS%=全场得分2×(投篮出手次数+0.44×罚球出手次数)(1)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%过50%的概率;。

人教A版高中数学选择性必修第三册习题课(三) 成对数据的统计分析含答案

人教A版高中数学选择性必修第三册习题课(三) 成对数据的统计分析含答案

习题课(三) 成对数据的统计分析一、选择题1.在建立两个变量y 与x 的回归模型时,分别选择了4个不同的模型,它们的R 2如下,其中拟合得最好的模型为( )A .模型1的R 2为0.75B .模型2的R 2为0.90C .模型3的R 2为0.25D .模型4的R 2为0.55解析:选B R 2的值越大,意味着残差平方和越小,也就是说拟合效果越好. 2.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A.由样本数据得到的经验回归方程y ^=b ^x +a ^必过样本点的中心(x -,y -) B.残差平方和越小的模型,拟合的效果越好C.用决定系数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D.若变量y 和x 之间的样本相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 解析:选C R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好. 3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的样本相关系数r 如下,其中拟合效果最好的模型是( )A .模型Ⅰ:样本相关系数r 为0.96B .模型Ⅱ:样本相关系数r 为-0.81C .模型Ⅲ:样本相关系数r 为-0.53D .模型Ⅳ:样本相关系数r 为0.35 解析:选A |r |越大,拟合效果越好.4.关于残差和残差图,下列说法正确的是( ) A .残差就是随机误差 B .残差图的横坐标是残差C .残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越高D .残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越低解析:选C 根据残差分析的概念可知,C 选项正确.残差是真实值减去估计值. 5.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是A .y =a +bxB .y =a +bx 2C .y =a +b e xD .y =a +b ln x解析:选D 用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y =a +b ln x .6.根据如下所示的列联表得到如下四个判断:①根据小概率值α=0.001的独立性检验,认为患肝病与嗜酒有关;②根据小概率值α=0.01的独立性检验,认为患肝病与嗜酒有关;③没有证据显示患肝病与嗜酒有关.患病状况 饮酒习惯合计嗜酒(Y =0)不嗜酒(Y =1)患肝病(X =0) 7 775 42 7 817 未患肝病(X =1)2 099 49 2 148 合计9 874919 965其中正确命题的个数为( ) A .1 B .2 C .3D .0 解析:选B 根据列联表中的数据,经计算得到 χ2=9 965×(7 775×49-42×2 099)27 817×2 148×9 874×91≈56.632,由56.632>10.828>6.635.且P (χ2≥10.828)≈0.001,P (χ2≥6.635)≈0.01. 所以①②均正确. 二、填空题7.调查某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元)显示,年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的经验回归方程y ^=0.254x +0.321.由经验回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由经验回归方程y ^=0.254x +0.321,知x 每增加1,y 增加0.254. 答案:0.2548.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程为y ^=0.67x +54.9.零件数x /个 10 2030 40 50 加工时间y /min62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为________. 解析:由表知x =30,设模糊不清的数据为m , 则y =15(62+m +75+81+89)=307+m 5,因为y =0.67x +54.9,即307+m5=0.67×30+54.9,解得m =68.答案:689.假设关于某设备的使用年限x (单位:年)和所支出的维修费用y (单位:万元)有如下的统计资料:x /年 2 3 4 5 6 y /万元2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系,且经验回归方程为y ^=a ^+b ^x ,其中已知b ^=1.23,请估计使用年限为20年时,维修费用约为________万元.解析:由表中数据可知, x -=2+3+4+5+65=4,y -=2.2+3.8+5.5+6.5+7.05=5.∵经验回归直线一定经过点(x -,y -), ∴5=a ^+1.23×4,∴a ^=0.08,∴经验回归方程为y ^=1.23x +0.08.故估计使用年限为20年时,维修费用约为y =1.23×20+0.08=24.68(万元). 答案:24.68 三、解答题10.2023年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过网络关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:(1)若“好老师”的被关注数量y 与其班主任的工作年限x 满足经验回归方程,试求经验回归方程y ^=b ^x +a ^,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量;(2)若用y ix i(i =1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率.解:(1)因为x -=8,y -=36,所以b ^=40+120+320+600+600-5×8×3616+36+64+100+144-5×82=6,a ^=36-6×8=-12, 所以y ^=6x -12.当x =15时,y ^=6×15-12=78(百人).(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.从5组“即时均值”任选2组,共有C 25=10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为310.11.“双11”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双11”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t (百元)的频率分布直方图如图所示:(1)求网民消费金额t 的平均值t -和中位数t 0.(2)把下表中空格里的数填上,并判断能否根据小概率值α=0.001的独立性检验,认为网购消费与性别有关?单位:人消费金额 性别合计 男(Y =0)女(Y =1)t ≥t 0(X =0) t <t 0(X =1) 30 合计45解:(1)以每组的中间值代表本组的消费金额,则网民消费金额t 的平均值 t -=2.5×0.2+7.5×0.3+12.5×0.2+17.5×0.15+22.5×0.1+27.5×0.05=11.5. 直方图中第一组,第二组的频率之和为0.04×5+0.06×5=0.5. 所以t 的中位数t 0=10. (2)补充列联表如下:消费金额 性别合计男(Y =0) 女(Y =1) t ≥t 0(X =0) 25 25 50 t <t 0(X =1) 20 30 50 合计4555100零假设为H 0:网购消费与性别独立,即网购消费与性别无关. 根据列联表中的数据,经计算得到χ2=100×(25×30-25×20)250×50×45×55=10099≈1.01<10.828=x 0.001.根据小概率值α=0.001的独立性检验,没有充分证据推断H 0不成立,因此可以认为H 0成立,即认为网购消费与性别无关.12.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:(1)求y 关于x 的回归直线方程;(2)计算变量x ,y 的样本相关系数r (计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强.(若|r |∈[0.75,1],则x ,y 相关性很强;若|r |∈[0.3,0.75),则x ,y 相关性一般;若|r |∈[0,0.3),则x ,y 相关性较弱)参考数据:30≈5.477.参考公式:b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,样本相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2·∑i =1n(y i -y )2.解:(1)由题意得,x =2+3+4+5+65=4,y =22+22+17+14+105=17,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=(-2)×5+(-1)×5+0×0+1×(-3)+2×(-7)(-2)2+(-1)2+02+12+22=-3.2,a ^=y -b ^x =17+3.2×4=29.8, 故y 关于x 的线性回归方程为y ^=-3.2x +29.8.(2)∵r =∑i =15(x i -x )(y i -y )∑i =15(x i -x )2·∑i =15(y i -y )2=-3210×108=-16330≈-0.97,∴r <0,说明x ,y 负相关.又|r |∈[0.75,1],说明x ,y 相关性很强.因此,可以认为该幼儿园去年春季流感人数与年龄负相关很强.。

人教版高中数学选择性必修第三册第八章成对数据的统计分析A卷基础训练(含解析)

人教版高中数学选择性必修第三册第八章成对数据的统计分析A卷基础训练(含解析)

人教版高中数学选择性必修第三册第八章成对数据的统计分析A卷基础训练(原卷版)一、选择题1.某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数y与当天气温x的回归方程 2.352147.767y x=-+.下列选项正确的是()A.x与y线性正相关B.x与y线性负相关C.y随x增大而增大D.y随x减小而减小2.如表是一个2×2列联表:则表中a,b的值分别为()y1y2合计x1a2173x2222547合计b46120A.94,72B.52,50C.52,74D.74,523.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.α0.100.050.025xα 2.706 3.841 5.024参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”4.2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码113分别对应2019年11月2020年11月)根据散点图选择y a x =+和ln y c d x =+两个模型进行拟合,经过数据处理得到的两个回归方程分别为0.93690.0285y x =+和0.95540.0306ln y x =+,并得到以下一些统计量的值:0.93690.0285y x=+0.95540.0306ln y x=+2R 0.9230.973注:x 是样本数据中x 的平均数,y 是样本数据中的平均数,则下列说法不一定成立的是()A .当月在售二手房均价y 与月份代码x 呈正相关关系B .根据0.93690.0285y x =+可以预测2021年2月在售二手房均价约为1.0509万元/平方米C .曲线0.93690.0285y x =+与0.95540.0306ln y x =+的图形经过点(),x yD .0.95540.0306ln y x =+回归曲线的拟合效果好于0.93690.0285y x =+的拟合效果5.(多选题)下列关于回归分析的说法中正确的是()A .回归直线一定过样本中心()x yB .残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C .甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好D .两个模型中残差平方和越小的模型拟合的效果越好6.(多选题)有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:()()()()()22χ-=++++n ad bc a b c d a c b d 优秀非优秀总计甲班10b乙班c 30()2P K k ≥0.0500.0100.001k3.8416.63510.828已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为20,b 的值为45C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”二、填空题7.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45A B 女婴E 35C 总计98D180那么A =________,B =________,C =________,D =________,E =________.8.某企业一种商品的产量与单位成本数据如下表:产量x (万件)234单位成本y (元/件)3a7现根据表中所提供的数据,求得y 关于x 的线性回归直线方程为25ay x =-,则预测当5x =时单位成本为每件______元.9.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)①若2χ的观测值为 6.635χ=,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌;③若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误10.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c xy c e =拟合时的相关指数为21R ,用y bx a =+$$$拟合时的相关指数为22R ,则2212R R >.三、解答题11.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为1221ni ii ni i x y nx yb x nx==-=-∑∑,a y bx =-$$.12.2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A ”、“B ”、“C ”三个等级,A 、B 等级都是合格品,C 等级是次品,统计结果如下表所示:等级A B C 频数2012060(表一)厂家合格品次品合计甲75乙35合计(表二)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A 、B 等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A 等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.()20P x χ≥0.500.400.250.150.100.050.0250.0100.0050.0010x 0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828人教版高中数学选择性必修第三册第八章成对数据的统计分析A 卷基础训练(解析版)一、选择题1.某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数y 与当天气温x 的回归方程 2.352147.767y x =-+.下列选项正确的是()A .x 与y 线性正相关B .x 与y 线性负相关C .y 随x 增大而增大D .y 随x 减小而减小【答案】B【解析】由回归方程 2.352147.767y x =-+,可得:x 与y 线性负相关,且y 随x 增大而减小.故选:B2.如表是一个2×2列联表:则表中a ,b 的值分别为()y 1y 2合计x 1a 2173x 2222547合计b46120A .94,72B .52,50C .52,74D .74,52【答案】C【详解】a =73-21=52,b =a +22=52+22=74.故选:C.3.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.α0.100.050.025x α2.7063.8415.024参照附表,得到的正确结论是()A .在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”D .在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”【答案】C【详解】由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,代入公式得χ2=100×(675-300)255×45×75×25≈3.030<3.841.∵2.706<3.030<3.841,∴在犯错误的概率不超过0.1的前提下认为“该市居民能否做到光盘与性别有关”.4.2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码113分别对应2019年11月2020年11月)根据散点图选择y a =+和ln y c d x =+两个模型进行拟合,经过数据处理得到的两个回归方程分别为0.9369y =+和0.95540.0306ln y x =+,并得到以下一些统计量的值:注:x 是样本数据中x 的平均数,y 是样本数据中的平均数,则下列说法不一定成立的是()A .当月在售二手房均价y 与月份代码x 呈正相关关系B .根据0.9369y =+可以预测2021年2月在售二手房均价约为1.0509万元/平方米C .曲线0.9369y =+与0.95540.0306ln y x =+的图形经过点(),x yD .0.95540.0306ln y x =+回归曲线的拟合效果好于0.9369y =+的拟合效果【答案】C【解析】对于A ,散点从左下到右上分布,所以当月在售二手房均价y 与月份代码x 呈正相关关系,故A 正确;对于B ,令16x =,由0.9369 1.0509y =+=,所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B 正确;对于C ,非线性回归曲线不一定经过()x y ,故C 错误;对于D ,2R 越大,拟合效果越好,故D 正确.故选:C.5.(多选题)下列关于回归分析的说法中正确的是()A .回归直线一定过样本中心()x yB .残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C .甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好D .两个模型中残差平方和越小的模型拟合的效果越好【答案】ABD【解析】对于A 选项,回归直线一定过样本中心(),x y ,A 选项正确;对于B 选项,残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,B 选项正确;对于C 选项,甲、乙两个模型的2R 分别约为0.98和0.80,则模型甲的拟合效果更好,C 选项错误;对于D 选项,两个模型中残差平方和越小的模型拟合的效果越好,D 选项正确.故选:ABD.6.(多选题)有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:()()()()()22χ-=++++n ad bc a b c d a c b d 优秀非优秀总计甲班10b 乙班c 30()2P K k ≥0.0500.0100.001k3.8416.63510.828已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为20,b 的值为45C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【答案】BC【详解】由题意,在全部的105人中随机抽取1人,成绩优秀的概率为27,所以成绩又由的人数为2105=307⨯人,非优秀的人数为1053075-=人,所以301020,753045c b =-==-=,则()22105103020453366.110 3.8413075505555χ⨯⨯-⨯==≈>⨯⨯⨯,若按95%的可靠性要求,能认为“成绩与班级有关系”.故选:BC.二、填空题7.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45A B 女婴E 35C 总计98D180那么A =________,B =________,C =________,D =________,E =________.【答案】47;92;88;82;53【详解】∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82,∵A +35=D ,∴A =47,∵45+A =B ,∴B =92.8.某企业一种商品的产量与单位成本数据如下表:产量x (万件)234单位成本y (元/件)3a7现根据表中所提供的数据,求得y 关于x 的线性回归直线方程为25ay x =-,则预测当5x =时单位成本为每件______元.【答案】9【详解】由所给数据可求得23433x ++==,103a y +=,代入线性回归直线方程ˆ25ayx =-,得103a +=235a⨯-,解得5a =,所以线性回归直线方程ˆ21yx =-,当5x =时单位成本ˆ2519y=⨯-=(元/件).9.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)①若2χ的观测值为 6.635χ=,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌;③若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误【答案】③【解析】若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误,故③正确.10.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c xy c e =拟合时的相关指数为21R ,用y bx a =+$$$拟合时的相关指数为22R ,则2212R R >.【答案】①③【详解】在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;x,,y 之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用21c xy c e =拟合比用y bx a =+$$$拟合效果要好,则2212R R >,故③正确.三、解答题11.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-$$.【答案】(1) 1.60.2y x =+;(2)B 项目的收益更好.【解析】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8,所以1234535x ++++==,2357855y ++++==,2222221223354758535 1.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元;因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元.因为9.89.7>,所以可预测B 项目的收益更好.12.2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A ”、“B ”、“C ”三个等级,A 、B 等级都是合格品,C 等级是次品,统计结果如下表所示:等级A B C 频数2012060(表一)厂家合格品次品合计甲75乙35合计(表二)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A 、B 等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A 等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.()20P x χ≥0.500.400.250.150.100.050.0250.0100.0050.0010x 0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【答案】(1)列联表答案见解析,没有95%的把握认为产品的合格率与厂家有关;(2)甲厂能盈利,乙不能盈利,理由见解析.【解析】(1)2×2列联表如下厂家合格品次品合计甲7525100乙6535100合计14060200()2220075352565 2.38 3.84110010014060χ⨯⨯-⨯=≈<⨯⨯⨯,∴没有95%的把握认为产品的合格率与厂家有关.(2)甲厂10件A 等级,65件B 等级,25件次品,对于甲厂,单件产品利润X 的可能取值为30,10,34-.X 的分布列如下:X 301034-P1101320141131()3010341010204E X ∴=⨯+⨯-⨯=>,∴甲厂能盈利,对于乙厂有10件A 等级,55件B 等级,35件次品,对于乙厂,单位产品利润Y 的可能取值为30,10,34-,Y 分布列如下:Y 301034-P1101120720111717()30103401020205E Y ∴=⨯+⨯-⨯=-<,乙不能盈利.。

人教A版高中数学选择性必修第三册精品课件 第8章 成对数据的统计分析 8.1 成对数据的统计相关性

人教A版高中数学选择性必修第三册精品课件 第8章 成对数据的统计分析 8.1 成对数据的统计相关性
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
解析:由样本相关系数r1=0.785 9>0知x与y正相关,由样本相关系数
r2=-0.956 8<0知u与v负相关,又|r1|<|r2|,故变量u与v的线性相关性较强.
规范展示:变量 y 与 x 的样本相关系数是
相关系数是
35.4
r'=15.6×2.3≈0.99,可以看出
与 BMI 值都是高度正相关.
28.3
r=15.6×1.9≈0.95,变量
z 与 x 的样本
TC 指标值与 BMI 值、GLU 指标值
本题考查均值、标准差以及样本相关系数等问题,是关于样本相关系数的
2.(1)每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由
这些点组成了统计图.我们把这样的统计图叫做散点图.
(2)如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现
增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另
一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
数据,由这四组不同的样本数据得到的样本相关系数r分别为
0.25,0.50,0.98,0.80,则其中相关程度最大的样本相关系数是(
A.0.25
B.0.50
C.0.98
D.0.80
解析:线性相关关系的判断中,样本相关系数为r,
|r|越接近于1,相关程度越大,
|r|越小,相关程度越小,故选C.
答案:C
)
15
1.3

人教A版高中数学选择性必修第三册课后习题 第八章 变量的相关关系 8.1.2 样本相关系数

人教A版高中数学选择性必修第三册课后习题 第八章 变量的相关关系 8.1.2 样本相关系数

8.1 成对数据的统计相关性8.1.1 变量的相关关系8.1.2 样本相关系数A级必备知识基础练1.下列说法正确的是( )A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间呈现正相关关系D.人的体重与视力呈现负相关关系2.在下列各图中,两个变量具有相关关系的是( )A.(1)(2)(3)B.(1)(3)(4)C.(2)(3)(4)D.(1)(2)(4)3.如下四个散点图中,呈现正相关关系的是( )4.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本相关系数,其数值分别为0.939,0.937,0.948,则( )A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱5.下列两个变量之间具有相关关系的是.①正方形的边长a和面积S;②一个人的身高h和腿长x;③真空中的自由落体运动其下落的距离h和下落的时间t;④一个人的身高h和体重x.6.为了对某班考试成绩进行分析,现从全班同学中随机抽取8位同学,他们的数学、物理成绩对应如表.根据表中数据分析:是否可以认为变量x 与y具有线性相关关系?B级关键能力提升练7.在各散点图中,两个变量具有正相关关系的是( )8.甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,并分别求得样本相关系数r,如表:则哪位同学的试验结果体现两变量有更强的线性相关性?( )A.甲B.乙C.丙D.丁9.如图所示,5组数据(x,y)中去掉D(3,10)后,下列说法正确的是( )A.相关系数r不变B.相关系数r变小C.负线性相关变为正线性相关D.变量x与变量y的相关性变强10.(多选题)对于样本相关系数r,以下说法错误的是( )A.r只能是正值,不能为负值B.|r|≤1,且|r|越接近于1,相关程度越强;相反则越弱C.|r|≤1,且|r|越接近于1,相关程度越弱;相反则越强D.r<0时表示两个变量不相关11.关于变量x,y的一组样本数据(a1,b1),(a2,b2),…,(a n,b n)(n≥2,a1,a2,…,a n不全相等)的散点图中,若所有样本点(a i,b i)(i=1,2,…,n)恰好都在直线y=-2x+1上,则根据这组样本数据推断的变量x,y的相关系数为.C级学科素养创新练12.许多先进国家对驾驶员的培训大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用.问题是这种方法有效吗?如表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):y 75 97 92 80 71 72试问:两者的相关性如何?请画出散点图,并求出x与y间的样本相关系数.8.1.1 变量的相关关系8.1.2 样本相关系数1.C 对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;对于B,粮食产量与施肥量之间的关系不是函数关系,是相关关系,所以B 错误;对于C,一定范围内,学生的成绩与学习时间呈现正相关关系,所以C正确; 对于D,人的体重与视力是没有相关关系的,所以D错误.2.A 图(1)、(2)、(3)中,散点图中的点大致分布在一条直线附近,呈带状分布,所以变量间具有线性相关关系;图(4)中,散点图中的点分布杂乱无章,不在一条直线附近,也不呈带状分布,所以变量间不具有相关关系.3.A 根据题意,依次分析选项:对于A,散点图中的点从左向右是上升的,呈现正相关关系;对于B,散点图中的点从左向右是下降的,呈现负相关关系;对于C,散点图中的点呈片状分布,没有明显的相关性;对于D,散点图中的点也呈片状分布,没有明显的相关性.4.D 甲、乙、丙三组数据的线性相关系数分别为0.939,0.937,0.948,所以线性相关系数最大的丙组数据的线性相关性最强,线性相关系数最小的乙组数据的线性相关性最弱.5.②④ 对于①,正方形的边长a 和面积S 是函数关系,不是相关关系; 对于②,一般情况下,一个人的身高h 和腿长x 是正相关关系;对于③,真空中的自由落体运动其下落的距离h 和下落的时间t 是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h 和他的体重x 是正相关关系. 6.解x =18×(60+65+70+75+80+85+90+95)=77.5,y =18×(72+77+80+85+88+90+93+95)=85.Ʃi=18(x i -x )(y i -y )=685,Ʃi=18(x i -x )2=1050,Ʃi=18(y i -y )2=456.所以线性相关系数r=Ʃi=18(x i -x )(y i -y )√Ʃi=18(x i -x )Ʃi=18(y i -y )=√1050×456≈0.99,接近于1,所以可以认为变量x 与y 具有线性相关关系. 7.B 根据题意,依次分析选项为:对于A,是相关关系,但不是正相关关系,不符合题意; 对于B,是相关关系,也是正相关关系,符合题意; 对于C,是相关关系,是负相关关系,不符合题意;对于D,所示的散点图中,样本点不呈带状分布,这两个变量不具有相关关系,不符合题意.8.D 根据题意知,丁同学的样本相关系数|r|=0.87为最大,所以丁同学的试验结果体现两变量有更强的线性相关性.9.D 由散点图知,去掉点D(3,10)后,y与x的线性相关性加强,由于是正线性相关,所以相关系数r变大,选项A错误,选项B错误;仍然是正线性相关,选项C错误;变量x与变量y的相关性变强,所以选项D正确.10.ACD 由样本相关系数的性质知选项B正确,其余选项均错误.11.-1 所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1.12.解两者的相关性很强.画出散点图,如图所示,由散点图中的点分布在一条直线附近,知两变量线性相关性很强;×(98+55+…+73)≈80,由表中数据,计算x=112y=1×(95+60+…+72)≈78.12相关系数为r=1122121212xy=√x12+x22+…+x122-12x2·√y12+y22+…+y122-12y298×95+55×60+…+73×72-12×80×78√982+552+…+732-12×802×√952+602+…+722-12×782≈2122≈0.9855.46.08×46.73所以y与x间的样本相关系数为0.9855,接近于1,知两变量的线性相关性很强.。

8.1 成对数据的相关关系(精练)(解析版)

8.1 成对数据的相关关系(精练)(解析版)

8.1 成对数据的相关关系(精练)【题组一相关关系】1.(2021·贵州贵阳市)如下四个散点图中,正相关的是()A.B.C.D.【答案】A【解析】对于A,散点图中的点从左向右是上升的,且在一条直线附近,是正相关;对于B,散点图中的点从左向右是下降的,且在一条直线附近,是负相关;对于C、D,散点图中的点不成带状分布,没有明显的相关关系;故选:A.2.(2021·秦安县第一中学高二期末)根据下面给出的2009年至2018年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2018年减少二氧化硫排放量的效果最显著B.2012年我国治理二氧化硫排放显现成效C.2011年以来我国二氧化硫年排放量呈减少趋势D.2011年以来我国二氧化硫年排放量与年份正相关【答案】D【解析】A. 逐年比较,2018年年排放量最少,故减少二氧化硫排放量的效果最显著;B. 2012年比2011年二氧化硫年排放量明显减少,故2012年我国治理二氧化硫排放显现成效;C. 2011年以来每年我国二氧化硫年排放量除2016年外几乎都在减少,故总体呈减少趋势.D. 2011年以来我国二氧化硫年排放量随年份逐渐减少,与年份负相关,故D错.故选:D3.(2020·全国高三专题练习)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系【答案】A【解析】画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系.故选:A.4.(2020·青海海东市)下列说法正确的是()A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间成正相关关系D.人的体重与视力成负相关关系【答案】C【解析】对于A ,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A 错误; 对于B ,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B 错误; 对于C ,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C 正确; 对于D ,人的体重与视力是没有相关关系的,所以D 错误. 故选:C.5.(2019·广东广州市·执信中学)对于散点图下列说法正确一个是( ) A .一定可以看出变量之间的变化规律 B .一定不可以看出变量之间的变化规律 C .可以看出正相关与负相关有明显区别 D .看不出正相关与负相关有什么区别【答案】C【解析】给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,不一定存在回归直线来模拟数据, 但是通过散点图可以看出正相关与负相关有明显区别. 故选:C6.(2021·江门市)下列语句表示的事件中的因素不具有相关关系的是( ) A .瑞雪兆丰年 B .名师出高徒C .不积跬步,无以至千里D .喜鹊叫喜,乌鸦叫丧 【答案】D【解析】A. 瑞雪对小麦有好处,可能使得小麦丰收,所以瑞雪兆丰年具有相关关系; B. 名师水平高,可能使得学生学习好,所以名师出高徒具有相关关系; C. 不积跬步,就不会有千里,所以不积跬步,无以至千里具有相关关系; D. 喜鹊叫喜,乌鸦叫丧,两者没有必然的关系. 故选:D7.(2020·吉林长白山保护开发区教育局高一月考)下列两个变量之间的关系哪个不是函数关系( ) A .角度和它的正切值 B .人的右手一柞长和身高C .正方体的棱长和表面积D .真空中自由落体运动物体的下落距离和下落时间【答案】B【解析】A 选项,由于角度和正切值有确定的关系tan y x =;B 选项,人的右手一柞长和身高不具有统一的关系;C 选项,正方体的棱长和表面积有关系26S a =;D 选项,真空中自由落体运动物体的下落距离和下落时间有确定的关系212s gt =.故选:B 8.(2020·江西赣州市·南康中学高二期中(文))观察下列各图形,其中两个变量x y ,具有相关关系的图是( ) A .①② B .①④C .③④D .③【答案】C【解析】由图可知,图③中这些点大致分布在一条直线附近,具有线性相关关系;图④中这些点大致分布在一条类似二次曲线附近,具有相关关系;而图①②中这些点分布不均匀,比较分散,不具有相关关系. 故选:C .【题组二 样本的相关系数】1.(2020·广东广州市)在建立两个变量y 与x 的回归模型,模型14的()()221211niii nii y y R y y ==-=--∑∑的值依次是0.35,0.67,0.84,0.92,则其中拟合效果最好的模型是( ) A .模型1 B .模型2C .模型3D .模型4【答案】D【解析】根据相关指数的作用,可知相关指数越大,模型拟合效果越好, 因为0.350.670.840.92<<<,所以模型4的拟合效果最好.故选:D.2.(2020·河南)有一散点图如图所示,现拟合模型为直线l 1,在5个(x ,y )数据中去掉D (3,10)后,重新拟合模型为直线l 2给出下列说法:①相关系数r 变大;②相关指数R 2变大;③残差平方和变小;④解释变量x 与预报变量y 的相关性变强.其中正确说法的个数为( )A .1个B .2个C .3个D .4个【答案】D【解析】由题意,散点图有5个(,)x y 的数据,去掉(3,10)D 后, 可得y 与x 的相关性越强,并且是正相关,所以相关系数r 变大,相关指数2R 变大,残差的平方和变小, 所以四个命题都正确. 故选:D.3.(2020·全国高三专题练习)对于相关系数r ,下列说法中正确的是( ) A .r 越大,线性相关程度越强 B .r 越小,线性相关程度越强C .r 越大,线性相关程度越弱,r 越小,线性相关程度越强D .1r ≤,且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱 【答案】D【解析】对于选项A ,r 越大,线性相关程度越强,即A 错误; 对于选项B ,r 越小,线性相关程度越弱,即B 错误;对于选项C ,r 越大,线性相关程度越强,r 越小,线性相关程度越弱, 即C 错误;对于选项D ,1r ≤,且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱,即D 正确, 故选:D.4.(2020·甘肃省会宁县第一中学)下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其中正确的是______.(将所有正确的序号填上) 【答案】①②④【解析】根据函数关系及相关关系的定义,①函数关系是一种确定性关系.②相关关系是一种非确定性关系.是正确的;由回归分析的定义及应用可知,④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.故答案为:①②④.5.(2020·合肥市第六中学高一期末)某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是( )A .4213r r r r <<<B .2413r r r r <<<C .2431r r r r <<<D .4231r r r r <<<【答案】C【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中在一条线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为负相关; 故1>0r ,3>0r ;20r <,40r <;又(1)与(2)中散点图更接近于一条直线,故13>r r ,24r r <, 因此,24310r r r r <<<<. 故选C .6.(2020·全国)对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是( ) A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强 B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强 C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强 D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强 【答案】C【解析】由线性相关系数10.78590r =>知x 与y 正相关,由线性相关系数20.95680r =-<知u 与v 负相关,又12r r <,所以,变量u 与v 的线性相关性比x 与y 的线性相关性强, 故选:C.7.(2020·江苏扬州市·高三期中)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i 位学生的成绩为(i i x y ,) (i =1,2,3...20),其中i i x y ,分别为第i 位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):(1)根据统计学知识,当相关系数|r |≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:20202022111()()485.()678.()476iiii i i i x x y y x x y y ===--=-=-=∑∑∑参考公式:相关系数12211()().()()niii n niii i x x y y r x x x y ===--=--∑∑∑(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X 表示这2名学生两科赋分的和,求X 的分布列和数学期望. 【答案】(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,95. 【解析】(1)由题意,20()()ii xx y y r --=∑6260.87.515>>=>=⨯=,所以“数学学期综合成绩”与“物理学期综合成绩”高度相关;(2) 由题意得:X的可能取值为0,1,2,3,4.,根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以9222036(0)190CP XC===,49112203619(1)C CP XC===,211220479169(29)C C CP XC+===,114722023810(9)C CP XC===,27220(4)21190CP XC===,所以X的分布列为:所以36366928213421901901909()012341901901905E X=⨯+⨯+⨯+⨯+⨯==.8.(2020·安徽省太和第一中学)某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数0.81r=;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(),i ix y (1i=,2,…,30),其中ix和iy分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得30160iix==∑,3011200iiy==∑,()302190iix x=-=∑,()30218000iiy y=-=∑,()()301800i iix x y y=--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本(),i ix y(1i=,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.附:相关系数()()niix x y y r --=∑ 1.414≈;相关系数[]0.75,1r ∈,则相关性很强,r 的值越大,相关性越强.【答案】(1)12000;(2)0.94r =,方案二的分层抽样方法更能准确的估计.【解析】(1)由题意可得,样区野生动物平均数为301111200403030i i y ==⨯=∑, 又地块数为300,所以该地区这种野生动物的估计值为3004012000⨯=; (2)由题中数据可得,样本(),i i x y (1i =,2,…,30)的相关系数为()()300.943iix x y y r --===≈∑.因为方案一的相关系数为0.81r =明显小于方案二的相关系数为0.94r =, 所以方案二的分层抽样方法更能准确的估计.9.(2020·湖北荆州市·荆州中学)在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:(1)依据表中给出的数据,是否可用线性回归模型拟合y 与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若||0.75r >,则线性相关程度很高,可用线性回归模型拟合)附:相关系数公式:()()n ni i i it t y y t y nt y r---==∑∑7.547≈,51i iit y====∑(2)谈专营店为吸引顾客,特推出两种促销方案.方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.①某位顾客购买了1050元的产品、该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率.②某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择返回200元现金,还是选择参加四次抽奖?说明理由.【答案】(1)答案见解析;(2)①1225;②专营店老板希望该顾客选择参加四次抽奖,理由见解析.【解析】(1)由题知,1(12345)35t=++++=,1(2.4 2.7 4.1 6.47.9) 4.75y=++++=,51i iit y====∑则n t y ntyr-===14.70.970.7515.095≈≈>.故y与t的线性相关程度很高,可以用线性回归方程拟合;(2)①顾客选择参加两次抽奖,设他获得100元现金奖励为事件A,122312()5525P A C=⋅⋅=;②设X表示顾客在四次抽奖中中奖的次数,由于顾客每次抽奖的结果相互独立,则24,5X B⎛⎫⎪⎝⎭,∴2()4 1.65E X np ==⨯=. 由于顾客每中一次可获得100元现金奖励,因此顾客在四次抽奖中可获得的奖励金额的均值为1.6100160⨯=.由于顾客参加四次抽奖获得现金奖励的均值160小于直接返现的200元现金, 故专营店老板希望该顾客选择参加四次抽奖.10.(2020·福建省仙游县枫亭中学)互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况; (2)据统计表明,y 与x 之间具有线性关系.①请用相关系数r 对y 与x 之间的相关性强弱进行判断;(若||0.75r >,则可认为y与x 有较强的线性相关关系(r 值精确到0.001))②经计算求得y 与x 之间的回归方程为ˆ 1.382 2.674yx =-,假定每单外卖业务企业平均能获纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围.(x 值精确到0.01)相关公式:()()niix x y y r --=∑参考数据:()()5166,77i i i x x y y =--=≈∑.【答案】(1)外卖甲平均日接单与乙相同﹐但外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①可认为y 与x 之间有较强的线性相关关系;②外卖甲所获取的日纯利润大约不低于6006元. 【解析】(1)由题可知,52981175x ++++==(百单),231051575y ++++==(百单)外卖甲的日接单量的方差为()()()()()22222275727978711105s-+-+-+-+-==甲,外卖乙的日接单量的方差()()()()()22222272737107571523.65s-+-+-+-+-==乙, 因为x y =,22s s <甲乙,即外卖甲平均日接单与乙相同,但外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①因为()()niix x y y r --=∑由:()()5166,77i i i x x y y =--=≈∑代入计算可得,相关系数660.8570.7577r =≈> 所以可认为y 与x 之间有较强的线性相关关系; ②令25y ≥,得1.382 2.67425x -≥ 解得20.02x ≥,又20.021*******⨯⨯=,所以当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润大约不低于6006元.。

2022秋高中数学第八章成对数据的统计分析-变量的相关关系课后提能训练新人教A版选择性必修第三册

2022秋高中数学第八章成对数据的统计分析-变量的相关关系课后提能训练新人教A版选择性必修第三册

第八章 8.1.1A级——基础过关练1.(多选)以下关于相关关系的说法错误的是( )A.相关关系是函数关系B.函数关系是相关关系C.线性相关关系是正比例函数关系D.相关关系有两种,分别是线性相关关系和非线性相关关系【答案】ABC 【解析】根据相关关系的概念可知,只有D正确,故选ABC.2.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.农作物产量与施肥量的关系C.吸烟与健康的关系D.数学成绩与物理成绩的关系【答案】C 【解析】若以吸烟量为横轴,健康为纵轴画出散点图,则由生活常识知,这些点散布在从左上角到右下角的区域内. 因此,吸烟与健康的关系属于线性负相关.3.对于给定的两个变量的统计数据,下列说法正确的是( )A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系【答案】C 【解析】给出一组样本数据,总可以作出相应散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系.4.下列两个变量之间的关系具有相关关系的是( )A.家庭的支出与收入B.某家庭用电量与水价间的关系C.单位圆中角的度数与其所对孤长D.球的体积与其半径【答案】A 【解析】C,D均为函数关系,B用电量与水价间不具有函数关系,也不具有相关关系,故选A.5.观察下列四个散点图,两变量具有线性相关关系的是( )【答案】A 【解析】选项A中的点大致分布在一条直线附近,故选A.6.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中具有相关关系的是________(填序号).【答案】①③④ 【解析】②⑤为确定性关系.7.函数关系是一种________关系,相关关系是一种________关系(两条横线上填“确定性”或“非确定性”).【答案】解定性 非确定性8.根据两个变量x,y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系________(填“是”或“否”).【答案】否 【解析】图中的点分布杂乱,两个变量不具有线性相关关系.9.下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:气温/℃2518121040杯数183037355054(1)根据表中的数据画出散点图;(2)你能从散点图中发现气温与热茶杯数近似成什么关系吗?解:(1)根据表中的数据画出某小卖部6天卖出热茶的杯数与当天气温的散点图,如图.(2)从散点图上可以看出气温与卖出的热茶杯数近似地成线性关系.说明了当气温越高时,所卖出的热茶的杯数就越少.10.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x10151720252832y1 1.3 1.82 2.6 2.7 3.3(1)画出散点图;(2)判断y与x是否具有线性相关关系.解:(1)散点图如下.(2)由图知,所有数据点接近直线排列,因此,认为y与x具有线性相关关系.B级——能力提升练11.下列说法正确的是( )A.相互关系与函数关系都是一种确定性的关系,也是一种因果关系B.根据身高和体重的相关关系可以确定身高对应的体重值C.“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系D.以上答案都不对【答案】C12.下面是四个散点图中的点的分布状态,直观上判断两个变量之间具有线性相关关系的是( )【答案】C 【解析】散点图A中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;B中所有的点都在同一条直线上,是函数关系;C中的点分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;D中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故选C.13.(多选)下列四个散点图中,变量x与y之间具有相关关系的是( )【答案】ACD 【解析】观察散点图可知,A,C选项中x与y之间具有非线性相关关系,D选项中x与y之间具有线性相关关系,B选项中x与y之间不具有相关关系.14.给出x,y值的数据如下:y35917x1248则根据数据可以判断x和y的关系是________(填“确定关系”“相关关系”或“没有关系”).【答案】确定关系 【解析】由表中数据可以得到x,y之间是一种函数关系y=2x+1,所以x,y是一种确定的关系,即函数关系.15.对某种珍稀动物胚胎的生长进行研究,测得9~20日龄动物的胚胎的质量如下:日龄/天91011121314胚重/g 1.656 2.662 3.100 4.579 6.5187.486日龄/天151617181920胚重/g9.94814.52215.61019.91423.73626.472(1)请作出这些数据的散点图;(2)关于这两个变量的关系,你能得出什么结论?解:(1)以动物胚胎的日龄为横坐标,以胚重为纵坐标,作出散点图如图所示:(2)从图象观察,许多点在同一曲线附近,且可以看出随着时间的增加,胚重增长得越来越快,所以两变量具有非线性相关关系.C级——探究创新练16.下表是从某校15岁的男生中随机地抽取9名所测得的身高与体重.编号123456789身高/cm165157155175168157178160163体重/kg524445555447625053由上述数据是否能推断身高与体重之间具有相关关系?若具有,则具有怎样的关系?解:从表中不难看出,同一身高157 cm对应着不同的体重44 kg和47 kg,所以体重不是身高的函数.如果把身高看作横坐标、体重看作纵坐标,在坐标平面中画出对应的点,就会发现,随着身高的增长,体重基本上呈直线增长的趋势(图略),也就是身高与体重之间存在着线性相关关系.。

【人教版高中数学A版选择性必修三】第八章 8.1

【人教版高中数学A版选择性必修三】第八章 8.1

温馨提示:此套题为Word 版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。

关闭Word 文档返回原板块。

第八章 成对数据的统计分析8.1 成对数据的统计相关性必备知识·素养奠基1.变量的相关关系(1)两个变量的关系(2)散点图:将样本中的每一个序号下的成对数据用直角坐标系中的点表示出来得到的统计图.(3)正相关与负相关加时,另一个变量的相应值也呈现增加的趋势加时,另一个变量的相应值呈现减少的趋势(4)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.正相关与负相关是对所有具有相关关系的两个变量而言的,对吗?提示:不对,正相关与负相关是针对线性相关关系而言的.2.样本的相关系数(1)相关系数:统计学里一般用r=错误!未找到引用源。

=错误!未找到引用源。

来衡量y与x的线性相关性的强弱,这里的r称为样本相关系数(简称相关系数).(2)相关系数的性质1r>0时,成对数据正相关;r<0时,成对数据负相关,-1≤r≤1.2 |r|越小,两个变量之间的线性相关程度越弱,|r|越大,两个变量之间的线性相关程度越强.3|r|=1时,成对数据构成的点都在一条确定的直线上.|r|的大小有何实际意义?提示:|r|越小,两个变量之间的线性相关性越弱;|r|越大,两个变量之间的线性相关性越强.1.思维辨析(对的打“√”,错的打“×”)(1)两个变量的相关关系是一种确定的关系.( )(2)两个变量的相关系数越大,它们的相关程度越强.( )(3)当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.( )(4)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.( )提示:(1)×.两个变量的相关关系不是一种确定的关系,是一种随机关系. (2)×.相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.(3)×.存在相关关系的两个变量,当一个变量增加时,另一个变量的相应值呈减少的趋势,则称这两个变量负相关.(4)√.2.根据一组数据判断两个变量是否线性相关时,应选( )A.茎叶图B.频率分布直方图C.散点图D.频率分布折线图【解析】选C.判断两个变量是否有线性相关关系时,应先画出散点图.若这些点大体分布在一条直线附近则具有线性相关关系.3.已知两个变量负相关,且相关程度很强,则它们的相关系数的大小可能是( )A.-0.95B.-0.13C.0.15D.0.96【解析】选A.相关系数r<0时,成对数据负相关,且|r|越大,两个变量之间的线性相关程度越强.关键能力·素养形成类型一相关关系与线性相关关系角度1 相关关系【典例】(多选题)下列关系中,属于相关关系的是( )A.正方形的边长与面积之间的关系B.农作物的产量与施肥量之间的关系C.人的身高与年龄之间的关系D.降雪量与交通事故的发生率之间的关系【思维·引】紧扣相关关系的概念加以判断.【解析】选BD.在A中正方形的边长与面积之间的关系是函数关系;在B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.角度2 线性相关关系的判断【典例】5名学生的数学和物理成绩(单位:分)如下:物理70 66 68 64 62成绩判断数学成绩与物理成绩是否具有线性相关关系.【思维·引】根据散点图判断.【解析】以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.【素养·探】本例考查利用散点图判断两个变量是否线性相关,同时考查了数据分析与数学抽象的核心素养.本例条件若改为:某公司2014~2019年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:年份2014 2015 2016 2017 2018 2019利润x 12.2 14.6 16 18 20.4 22.3支出y 0.62 0.74 0.81 0.89 1 1.11判断x与y是否线性相关,是正相关还是负相关?【解析】作出散点图(图略),由散点图可知,各点分布在一条直线附近,故x与y 之间线性相关,且y随x的增大而增大,是正相关.【类题·通】1.函数关系与相关关系函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.两个变量是否相关的两种判断方法(1)实际经验法:借助积累的经验进行分析判断;(2)散点图法:绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【习练·破】1.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【解析】选C.由题图象知,变量x与y呈负相关关系;u与v呈正相关关系.2.下列两个变量间的关系不是函数关系的是( )A.圆的半径与周长B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量【解析】选D.函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项C=2πr,B项y=tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.【加练·固】某个男孩的年龄与身高的统计数据如表所示.年龄x(岁) 1 2 3 4 5 6身高y(cm) 78 87 98 108 115 120(1)画出散点图;(2)判断y与x是否具有线性相关关系.【解析】(1)散点图如图所示.(2)由散点图知,所有数据点分布在一条直线附近,因此,认为y与x具有线性相关关系.类型二相关系数与相关程度的判断角度1 相关系数的概念【典例】下面的各图中,散点图与相关系数r不符合的是( )【思维·引】根据相关系数与散点图的关系解答.【解析】选B.A、B选项中散点全部集中在一条直线上,且分别呈负、正相关,故相关系数r的值应分别为-1,1;C选项变量呈负相关,故-1<r<0,D选项变量没有相关性,相关系数近似看为0.角度2 相关程度的判断【典例】一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm):身高168 170 171 172 174 176 178 178 180 181 右手长度19.20.21.21.521.22.24.23.22.523.(1)判断两者有无线性相关关系;(2)如果具有线性相关关系,判断相关性的强弱.【思维·引】画散点图判断是否线性相关,求相关系数刻画相关程度. 【解析】(1)散点图如图所示.可见,身高与右手长度之间的总体趋势为一条直线,即它们线性相关.(2)根据以上数据可由计算器计算得错误!未找到引用源。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8.1 成对数据的相关关系 ---A 基础练
一、选择题
1.下列现象中线性相关程度最强的是( )
A .商店的职工人数与商品销售额之间的线性相关系数为0.87
B .流通费用率与商业利润率之间的线性相关系数为-0.94
C .商品销售额与商业利润率之间的线性相关系数为0.51
D .商品销售额与流通费用率之间的线性相关系数为0.70 【答案】B
【详解】线性相关系数r 的绝对值越接近于1,两个变量间的线性相关程度越强,故选B.
2.(2021·福建三明一中高二月考)变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数r 最接近的值为( )
A .1
B .-0.5
C .0
D .0.5 【答案】C
【详解】根据变量x ,y 的散点图,得:x ,y 之间的样本相关关系非常不明显,所以相关系数r 最接近的值应为0.故选C.
3.(2021·山东泰安实验高中高二月考)一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2 x +1上,则这组样本
数据的样本相关系数为( )
A .-1
B .0
C .0.5
D .1 【答案】D
【详解】因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1. 4.甲、乙、丙、丁四位同学各自对x ,y 两变量的线性相关性作试验,求得相关系数r 如表:
A .甲
B .乙
C .丙
D .丁 【答案】D
【详解】根据题意知,丁同学的相关系数|r |=0.87为最大,所以丁同学的试验结果体现两变量有 更强的线性相关性.故选D.
5.(多选题)(2021·全国高二课时练)以下两个变量成正相关的是( )
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
D.电瓶车的重量和行驶每千米的耗电量
【答案】CD
【详解】对于A,学生的学籍号与学生的数学成绩没有相关关系;对于B,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于C,一般情况下,气温与冷饮销售量成正相关关系;对于D,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的是CD.
6.(多选题)(2021·山东德州市高二期末)对相关系数r来说,下列说法错误的有()
A.|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小
B.|r|≥1,|r|越接近1,相关程度越大;|r|越大,相关程度越小
C.|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小
D.|r|≥1,|r|越接近1,相关程度越小;|r|越大,相关程度越大
【答案】ABD
【详解】用相关系数r可以衡量两个变量之间的相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在相关关系,故“对于相关系数r来说,|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小”,C正确,故选ABD.
二、填空题
7.下列两个变量之间的关系是函数关系的是________.
①角度和它的余弦值;②正方形的边长和面积
③正n边形的边数和内角和;④人的年龄和身高
【答案】①②③
【详解】函数关系是变量之间的一种确定性的关系.①②③中的两个变量之间都是函数关系,可以写出它们的函数关系式,分别为f(θ)=cos θ,g(a)=a2,h(n)=(n-2)×180°.而④中的两个变量之间不是函数关系,对于年龄相同的人来说,可以有不同的身高.
8.(2021·江西上饶市高二期末)某个男孩的年龄与身高的统计数据如下表所示.
其散点图如下;
则y 与x (填:是或否)具有线性相关关系. 【答案】是
【详解】由图知,所有数据点接近一条直线排列,因此,认为y 与x 有线性相关关系.
9.已知变量x 和变量y 的3对随机观测数据(2,2),(3,-1),(5,-7),则成对样本数据的样本相关系数是________. 【答案】-20
21
【详解】x - =103 ,y - =-2,有相关系数公式得∴r =-20
21
10.(2021·全国高二专题练习)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表: 学生编号 1 2 3 4 5 6 7 8 数学成绩 60 65 70 75 80 85 90 95 物理成绩
72
77
80
84
88
90
93
95
给出散点图如下:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高. 其中正确的个数为________. 【答案】1
【详解】由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关
关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;
若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1. 三、解答题
11.(2021·河南高二期中)5名学生的数学和物理成绩如下表:
画出散点图,并判断它们是否具有相关关系.
【详解】把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(x i ,y i )(i =1,2,…,5),作出散点图如图.
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关.
12.(2021·浙江丽水高级中学高二期中)下图是我国2014年至2021年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2014~2021.
由折线图看出,可用线性回归模型拟合y 与t 的关系,请求出相关系数r ,并用相关系数的大小说明y 与t 相关性的强弱.
参考数据:∑i =1
7
y i =10.97,∑i =1
7
t i y i =47.36,
∑i =1
7
(y i -y -
)2 =0.664,7 ≈2.646.
参考公式:
相关系数r =
∑i =1
n
(t i -t -)(y i -y -

∑i =1
n (t i -t -)2∑i =1
n (y i -y -
)2

∑i =1
n
t i y i -t -∑i =1
n
y i
∑i =1
n
(t i -t -)2∑i =1
n (y i -y -
)2
【详解】由折线图中数据和参考数据得t - =4,∑i =1
7 (t i -t -
)2=28,
∑i =1
7 (y i -y -)2
=0.664,∑i =1
7 (t i -t - )(y i -y - )=∑i =1
7t i y i -t - ∑i =1
7
y i =47.36-4×10.97=3.48, ∴r ≈ 3.48
0.664×2×2.646
≈0.99.
∵y 与t 的相关系数近似为0.99,∴y 与t 的线性相关程度比较高.。

相关文档
最新文档