高考数学第九章算法初步、统计、统计案例课时作业56变量间的相关关系与统计案例文新人教A版
2022版高考数学一轮复习第九章算法初步统计统计案例第四讲变量间的相关关系统计案例学案含解析新人教版

第四讲变量间的相关关系、统计案例知识梳理·双基自测知识梳理知识点一回归分析(1)相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种__非确定性关系__.(2)散点图:表示具有__相关__关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点有y随x增大而增大的趋势,则称两个变量__正相关__;若这些散点有y随x增大而减小的趋势,则称两个变量__负相关__.(3)回归方程:y^=b^x+a^,其中b^=∑ni=1x i y i-n x-y-∑ni=1x2i-n x2,a^=__y--b^x__,它主要用来估计和预测取值,从而获得对这两个变量之间整体关系的了解.(4)相关系数:r=∑ni=1x i y i-n x-y-∑ni=1x2i-n x2∑ni=1y2i-n y2它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r>0时表示两个变量正相关,当r<0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性__越强__;当|r|接近0时,表明两个变量间几乎不存在相关关系,相关性__越弱__.知识点二独立性检验(1)2×2列联表设X,Y为两个分类变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+d(2)独立性检验利用随机变量K2(也可表示为X2)=n ad-bc2n=a+b+c+d为样本容量)来判断“两个变a+b c+d a+c b+d(其中量有关系”的方法称为独立性检验.(3)独立性检验的一般步骤①根据样本数据列出2×2列联表;②计算随机变量K2的观测值k,查表确定临界值k0:③如果k≥k0,就推断“X与Y有关系\”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关\”.归纳拓展1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验是对两个变量的关系的可信程度的判断,而不是对其是否有关系的判断.根据K2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活.双基自测题组一走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √)(2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0.( ×)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √)(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程y^=-2.352x+147.767,则气温为2 ℃时,一定可卖出143杯热饮.( ×)(5)事件x,y关系越密切,则由观测数据计算得到的K2的观测值越大.( √)(6)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( ×)题组二走进教材2.(P97T2)为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( C )A.回归分析B.均值与方差C.独立性检验D.概率[解析]“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.3.(P81例1)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y^=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为__68__.[解析]由x-=30,得y-=0.67×30+54.9=75.设表中的“模糊数字”为a,则62+a+75+81+89=75×5,∴a=68.题组三走向高考4.(2017·某某高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y^=b^x+a^,已知∑10i=1x i=225,∑10i=1y i=1 600,b^=4.该班某学生的脚长为24,据此估计其身高为( C )A .160B .163C .166D .170[解析]由题意知y ^=4x +a ^又x =22.5,y =160,因此160=22.5×4+a ^,∴a ^=70,因此y ^=4x +70,当x =24时,y ^=4×24+70=166,故选C .5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n ad -bc2a +bc +da +cb +d.P (K 2≥k ) 0.050 0.010 0.001 k3.8416.63510.828[解析](1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得K 2=100×40×20-30×10250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.考点突破·互动探究考点一 相关关系的判断——自主练透例1 (1)(2021·某某资阳模拟)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( B )A .人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B .人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C .人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D .人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%(2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是( A )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3[解析](1)观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.(2)由相关系数的定义及散点图所表达的含义,可知r2<r4<0<r3<r1.故选A.名师点拨判断两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归直线方程中:b^>0时,正相关;b^<0时负相关.考点二线性回归分析——师生共研例2 (1)(2021·湖湘名校教育联合体联考)2020年3月15日,某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:价格x 99.51010.511销售量y 111086 5 按公式计算,y与x的回归直线方程是:y=-3.2x+a,相关系数|r|=0.986,则下列说的是( D )法不正确...A.变量x,y线性负相关且相关性较强B.a^=40C.当x=8.5时,y的估计值为12.8D.相应于点(10.5,6)的残差约为0.4(2)(2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i =120xi =60,∑i =120y i =1 200,i =120(x i -x -)2=80,i =120(y i -y -)2=9 000,i =120(x i -x -)(y i -y -)=800.①求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);②求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);③根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =i =1nx i -x-y i -y-i =1nx i -x-2i =1ny i -y-2,2≈1.414.[解析](1)对A ,由表可知y 随x 增大而减少,可认为变量x ,y 线性负相关,且相关性强,故A 正确.对B ,价格平均x -=15(9+9.5+10+10.5+11)=10,销售量y -=15(11+10+8+6+5)=8.故回归直线恒过定点(10,8),故8=-3.2×10+a ^⇒a ^=40,故B 正确.对C ,当x =8.5时,y ^=-3.2×8.5+40=12.8,故C 正确.对D ,相应于点(10,8)的残差约为e ^=6-(-3.2×10.5+40)=-0.4,故D 不正确.故选D .(2)①样区野生动物平均数为 120∑i =120y i =120×1 200=60,地块数为200,该地区这种野生动物的估计值为200×60=12 000. ②样本(x i ,y i )的相关系数为r=i=120x i-x-y i-y-i=120x i-x-2i=120y i-y-2=80080×9 000=223≈0.94.③由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样,先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样方法抽取样本即可.名师点拨线性回归分析问题的类型及解题方法(1)求线性回归方程:①利用公式,求出回归系数b^,a^.②待定系数法:利用回归直线过样本点中心求系数.(2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b^.〔变式训练1〕(2021·某某六校教育研究会素质测试)某商场近5个月的销售额和利润额如表所示:销售额x/千万元35679利润额y/百万元1334 5(1)画出散点图,观察散点图,说明两个变量有怎样的相关关系;(2)求出利润额y关于销售额x的回归直线方程;(3)当销售额为4千万元时,利用(2)的结论估计该商场的利润额(百万元).b^=∑i=1nx i y i-n x-y-∑i=1nx2i-n x-2=i=1n x i-x-y i-y-i=1n x i-x-2,a^=y--b x-.[解析](1)散点图如图所示:两个变量正相关,且具有线性相关关系.(2)易求x-=6,y-=3.2,由公式有b^=3×2.2+1×0.2+0+1×0.8+3×1.832+12+12+32=1320=0.65,且a^=3.2-0.65×6=-0.7,则线性回归方程为y^=0.65x-0.7,(3)当x=4时,由(1)可求得y^=1.9,即利润额约为1.9百万元.考点三,独立性检验——师生共研例3 (1)(2020·新高考Ⅰ,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50](50,150](150,475][0,35]3218 4(35,75]6812(75,115]3710①估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;②根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75](75,115]③根据②中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.附:K2=n ad-bc2a+b c+d a+c b+d,P(K2≥k)0.0500.0100.001 k 3.841 6.63510.828某校推迟2020年的春季线下开学,并采取了“停课不停学”的线上授课措施.为了解学生对线上课程的满意程度,随机抽取了该校的100名学生(男生与女生的人数之比为3∶2)对线上课程进行评价打分,若评分不低于80分视为满意,其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到的评分不低于70分的频率为0.85.①估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表)②结合频率分布直方图,请完成以下2×2列联表,并回答能否有99%的把握认为对“线上教学是否满意与性别有关”;态度性别满意 不满意 合计男生 女生 10合计100K 2=n ad -bc2a +bc +d a +cb +d,其中P (K 2=k 0)0.10 0.05 0.025 0.010 0.005 k 02.7063.8415.0246.6357.879n =a +b +c +d .[解析](1)①根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64.②根据抽查数据,可得2×2列联表:SO 2PM2.5[0,150] (150,475][0,75] 64 16 (75,115]1010K 2=100×64×10-16×10280×20×74×26≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO 2浓度有关.(2)①由已知得(0.015+b +0.03)×10=0.85, 解得b =0.04,又(0.005+a )×10=1-0.85,解得a =0.01, 评分的平均值为55×0.05+65×0.1+75×0.3+85×0.4+95×0.15=80. ②完成2×2列联表如下表:态度性别满意 不满意 合计男生 25 35 60 女生 30 10 40 合计5545100K 2=100×10×25-35×3055×45×60×40≈10.774>6.635,∴有99%的把握认为对“线上教学是否满意与性别有关”.名师点拨解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体.②明确研究的两个问题. (2)两个关键:①准确列出2×2列联表:②准确理解K 2.注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k 值与求得的K 2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p ,所以其有关联的可能性为1-p .〔变式训练2〕(2021·某某某某、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用寿命频数表如下:使用寿命年数4年5年6年7年总计A型出租车(辆)10204525100B型出租车(辆)153********(1)填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?使用寿命不高于5年使用寿命不低于6年总计A型B型总计(2)司机师傅小李准备在一辆开了3年的A型车和一辆开了3年的B型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明,他应如何选择.参加公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:P(K2≥k0)0.050.0100.001k0 3.841 6.63510.828[解析](1)根据题目所给数据得到如下2×2的列联考:使用寿命不高于5年使用寿命不低于6年总计A型3070100B型5050100总计80 120 200由列联表可知:K 2=200×30×50-70×502100×100×80×120≈8.33>6.635,所以有99%的把握认为出租车的使用寿命年数与汽车车型有关;(2)记事件A 1,A 2分别表示小李选择A 型出租车和B 型出租车时,3年内(含3年)换车, 由表知P (A 1)=10+20+45100=0.75,P (A 2)=15+35+40100=0.9,因为P (A 1)<P (A 2),所以小李应选择A 型出租车.名师讲坛·素养提升非线性回归问题例4 (2020·某某乌兰察布等五市调研)一个调查学生记忆的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间t (分钟)和答对人数y 的统计表格如下: 时间t (分钟) 10 20 30 40 50 60 70 80 90 100 答对人数y 98 70 52 36 30 20 15 11 5 5 lg y1.991.851.721.561.481.301.181.040.70.7附:∑n =110t 2i =38 500,∑n =110y i =342,∑n =110lg y i =13.5,∑n =110t i y i =10 960,∑n =110t i lg y i =620.9,对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑i =1nu i v i -n u -v -∑i =1n u 2i -n u -2,α^=v --β^u -.请根据表格数据回答下列问题:(1)根据散点图判断,y =at +b 与lg y =ct +d ,哪个更适宜作为线性回归类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果,建立y 与t 的回归方程;(数据保留3位有效数字)(3)根据(2)请估算要想记住75%的内容,至多间隔多少分钟重新记忆一遍.(参考数据:lg 2≈0.3,lg 3≈0.48)[解析](1)由图象可知,lg y =ct +d 更适宜作为线性回归类型; (2)设lg y =ct +d ,根据最小二乘法得c =∑i =110t i lg y i -10t -lg y ∑i =110t 2i -10t -2=620.9-10×55×1.3538 500-10×552≈-0.014 7,d =lg y -c t -≈2.16,所以lg y =-0.014 7t +2.16, 因此y =10-0.014 7t +2.16;(3)由题意知y =10-0.014 7t +2.16≥75,即-0.014 7t+2.16≥2+lg 3-2lg 2≈1.88,解得t≤19.05,即至多19.05分钟,就需要重新复习一遍.名师点拨非线性相关问题一般通过换元法转化为线性相关(线性回归分析)问题解决.〔变式训练3〕(2020.课标Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2, (20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( D )A.y=a+bx B.y=a+bx2C.y=a+b e x D.y=a+b ln x[解析]观察题中散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象,故选D.。
全国高考数学第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文

第四节 变量间的相关关系与统计案例———————————————————————————————— [考纲传真] 1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.4.了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.1.回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则b ^=∑ni =1x i -x y i -y ∑ni =1 x i -x 2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^=y -b ^x .其中,b ^是回归方程的斜率,a ^是在y 轴上的截距.3.残差分析(1)残差:对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),它们的随机误差为e i =y i -bx i-a ,i =1,2,…,n ,其估计值为e ^i =y i -y ^i =y i -b ^x i -a ^,i =1,2,…,n ,e ^i 称为相应于点(x i ,y i )的残差.(2)相关指数:R 2=1-∑ni =1y i -y ^i 2∑ni =1y i -y2.4.独立性检验(1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为则随机变量K 2=a +ba +cb +dc +d(其中n =a +b +c +d 为样本容量).1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( ) (2)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( )(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.( )(4)若事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越小.( ) [答案] (1)√ (2)× (3)× (4)×2.(教材改编)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4A [因为变量x 和y 正相关,排除选项C ,D.又样本中心(3,3.5)在回归直线上,排除B ,选项A 满足.]3.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )图941A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关D[对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.]4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K2≈0.99,根据这一数据分析,下列说法正确的是( ) A.有99%的人认为该电视栏目优秀B.有99%的人认为该电视栏目是否优秀与改革有关系C.有99%的把握认为该电视栏目是否优秀与改革有关系D.没有理由认为该电视栏目是否优秀与改革有关系D[只有K2≥6.635才能有99%的把握认为“该电视栏目是否优秀与改革有关系”,而即使K2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关,故只有D正确.]5.(2017·贵阳检测)若8名学生的身高和体重数据如下表:第3名学生的体重漏填,但线性回归方程是y=0.849x-85.712,则第3名学生的体重估计为________kg.50 [设第3名学生的体重为a,则1 8(48+57+a+54+64+61+43+59)=0.849×18(165+165+157+170+175+165+155+170)-85.712.解得a≈50.]+1,变量y与z正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关(2)x 和y 的散点图如图942所示,则下列说法中所有正确命题的序号为________.图942①x ,y 是负相关关系;②在该相关关系中,若用y =c 1e c 2x 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21>R 22;③x ,y 之间不能建立线性回归方程.(1)C (2)①② [(1)因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;由散点图知用y =c 1e c 2x 拟合比用y ^=b ^x +a ^拟合效果要好,则R 21>R 22,故②正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故③错误.][规律方法] 1.利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,若点散布在左上角到右下角的区域,则负相关.2.利用相关系数判定,当|r |越趋近于1,相关性越强. 当残差平方和越小,相关指数R 2越大,相关性越强.[变式训练1] 甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:A .甲B .乙C .丙D .丁D [在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A ,B 两变量有更强的线性相关性.](单位:亿吨)的折线图.图943注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑ 7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑ni =1t i -ty i -y∑ni =1t i -t2∑n i =1y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1t i -ty i -y∑ ni =1t i -t2,a ^=y --b ^t .[解] (1)由折线图中的数据和附注中的参考数据得 t =4,∑ 7i =1(t i -t )2=28,∑7i =1y i -y2=0.55,2分∑7i =1(t i -t )(y i -y )=∑ 7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89, 所以r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.5分(2)由y =9.327≈1.331及(1)得b ^=∑ 7i =1t i -ty i -y∑7i =1t i -t2=2.8928≈0.103.8分 a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .10分将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.12分[规律方法] 1.在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数r 进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.(1)正确运用计算b ^,a ^的公式和准确的计算,是求线性回归方程的关键.(2)回归直线y ^=b ^x +a ^必过样本点的中心(x ,y ).[变式训练2] (2014·全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑ni =1t i -t-y i -y-∑ni =1t i -t-2,a ^=y --b ^t -.[解] (1)由所给数据计算得t -=17(1+2+3+4+5+6+7)=4,y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑7i =1 (t i -t -)2=9+4+1+0+1+4+9=28,3分∑7i =1(t i -t -)(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑7i =1t i -t-y i -y-∑7i =1t i -t-2=1428=0,5, a ^=y --b ^t -=4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.6分(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.9分将2015年的年份代号t =9代入(1)中的回归方程,得 y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.12分10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图944所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;【导学号:31222369】图944(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K 2=a +bc +d a +cb +d.[解] (1)利用分层抽样,300×4 50015 000=90,所以应收集90位女生的样本数据.4分(2)由频率分布直方图得1-2×(0.025+0.100)=0.75.所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.8分(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.10分又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表k =-275×225×210×90=10021≈4.762>3.841. 所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.12分 [规律方法] 1.在2×2列联表中,如果两个变量没有关系,则应满足ad -bc ≈0.|ad -bc |越小,说明两个变量之间关系越弱;|ad -bc |越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表; (2)根据公式K 2=n ad -bc 2a +ba +cb +dc +d计算K 2的观测值k ;(3)比较k 与临界值的大小关系,作统计推断.[变式训练3] (2017·济南联考)某市地铁即将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下;与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=a +bc +d a +c a +d.[解] x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).5分(2)根据条件可得2×2列联表如下:K2=≈6.27<6.635,10×40×18×32∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.12分[思想与方法]1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.根据K2的值可以判断两个分类变量有关的可信程度.[易错与防范]1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量K2的观测值k的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.课时分层训练(五十七)变量间的相关关系与统计案例A组基础达标(建议用时:30分钟)一、选择题1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578.其中一定不正确...的结论的序号是 ( ) A .①② B .②③ C .③④D .①④D [由正负相关性的定义知①④一定不正确.]2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是 ( )A .模型1的相关指数R 2为0.98 B .模型2的相关指数R 2为0.80 C .模型3的相关指数R 2为0.50 D .模型4的相关指数R 2为0.25A [相关指数R 2越大,拟合效果越好,因此模型1拟合效果最好.]3.第31届夏季奥林匹克运动会,中国获26金,18银,26铜共70枚奖牌居奖牌榜第二,并打破3次世界记录.由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为此进行了调查,在参加调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力( )A .平均数与方差B .回归直线方程C .独立性检验D .概率C [由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求.故用独立性检验最有说服力.]4.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元B [由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元).]5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n a +bc +d a +cb +d,算得K 2=-260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”C [根据独立性检验的定义,由K 2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”.]二、填空题6.(2017·西安质检)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.【导学号:31222370】68 [由x =30,得y =0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,即a =68.]7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2根据表中数据,得到K 2=-223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.5% [∵K 2≈4.844,根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.]8.(2017·长沙雅礼中学质检)某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程y =b x +a 中的b =-2,预测当气温为-4 ℃时,用电量为________℃.【导学号:31222371】68 [根据题意知x =18+13+10+-4=10,y =24+34+38+644=40,因为回归直线过样本点的中心,所以a ^=40-(-2)×10=60,所以当x =-4时,y =(-2)×(-4)+60=68,所以用电量为68度.]三、解答题9.(2017·石家庄质检)微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中23是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表:(2)关”?附:K 2=n ad -bc 2a +bc +d a +cb +d.[解] (1)180(人), 经常使用微信的有180-60=120(人), 其中青年人有120×23=80(人),使用微信的人中青年人有180×75%=135(人), 所以2×2列联表:5分(2)将列联表中数据代入公式可得:K 2=-2120×60×135×45≈13.333,由于13.333>10.828,所以有99.9%的把握认为“经常使用微信与年龄有关” .12分 10.为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下试验数据:(1)求y (2)利用(1)中的回归方程,预测t =8时的细菌繁殖个数. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:b ^=∑ni =1t i -ty i -y∑ni =1t i -t2,a ^=y -b ^t .[解] (1)由表中数据计算得,t =5,y =4,∑ni =1(t i -t )(y i -y )=8.5,∑ni =1(t i -t )2=10,2分b ^=∑ni =1t i -ty i -y∑ni =1t i -t2=0.85,a ^=y -b ^t =4-0.85×5=-0.25.所以回归方程为y ^=0.85t -0.25.5分 (2)将t =8代入(1)的回归方程中得 y ^=0.85×8-0.25=6.55.10分故预测t =8时,细菌繁殖个数为6.55千个.12分B 组 能力提升 (建议用时:15分钟)1.根据如下样本数据:得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0 D .a <0,b <0B [作出散点图如下:观察图象可知,回归直线y ^=bx +a 的斜率b <0,当x =0时,y ^=a >0.故a >0,b <0.] 2.(2017·赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)根据上述数据,过________.附表:k =-230×20×20×30≈5.556>5.024,∴推断犯错误的概率不超过0.025.]3.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图945表中w i =x i ,w ]=8∑ i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i -u v i -v ∑ni =1u i -u2,α^=v -β^u .[解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.4分(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x .8分 (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.10分所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.12分。
高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)

高中数学:第二册第九章:变量间的相关关系一、基础知识梳理1.变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2.散点图将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.3.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).(2)设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数.经数学上的推导,,a b 的值由下列公式给出:1122211()()()nni i i ii i nni i i i x x y y x y nx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+.上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________. (3)利用回归方程,我们可以进行预测并对总体进行估计. 4.相关关系的强与弱若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x与y 的相关系数()()niix x y y r --=∑,即ni ix y nx yr -=∑,通常用r 来衡量x 与y 之间的线性关系的强弱.r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关.||r 越接近于1,x 与y 的相关程度越大;||r 越接近于0,二者的相关程度越小.当||1r =时,所以数据点都在一条直线上.习题参考答案: 1.随机性2.(1)正相关 (2)负相关3.(1)一条直线 线性相关关系 (2)最小二乘法二、重点知识梳理b 的公式或混淆b 的位置1.回归方程的求解(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算a ,b 的值→写出回归方程. (2)回归直线一定经过样本点的中心.【例1】假设关于某设备的使用年限x (年)和所支出的年平均维修费用y (万元)(即维修费用之和除以使用年限),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)画出散点图;(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律; (3)求回归方程;(4)估计使用年限为10年时所支出的年平均维修费用是多少? 【答案】答案详见解析.【解析】(1)画出散点图如图所示:(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系. 由题表数据可得552114,5,112.3,90i ii i i x y x yx ======∑∑,由公式可得2112.3545 1.23,5 1.ˆ2340.089054ˆba y bx -⨯⨯===-=-⨯=-⨯, 即回归方程是 1.230.08y x =+.(4)由(3)知,当10x =时, 1.23100.0812.38y =⨯+=. 故估计使用年限为10年时所支出的年平均维修费用是12.38万元.2.回归直线的理解及其应用在回归方程y bx a =+中,b 是回归直线的斜率,它代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.【例2】根据如下样本数据得到的回归方程为y bx a =+,若 5.4a =,则x 每增加1个单位,y 就A .增加0.9个单位B .减少0.9个单位C .增加1个单位D .减少1个单位【答案】B【解析】(5,0.9)在回归直线上,∴0.95 5.4b =+,解得0.9b =-,故回归方程为0.9 5.4y x =-+,则x 每增加1个单位,y 就减少0.9个单位,故选B .【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:(1)求y 关于x 的线性回归方程y bx a =+;(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?参考公式:121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.弄错回归方程中a ,b 的位置【例4】某班5名学生的数学和物理成绩如下表:(1)画出散点图.(2)求物理成绩y 对数学成绩x 的线性回归方程. 【答案】答案详见解析. 【错解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=,1(7865716461)67.85y =⨯++++=, 518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174ii x==++++=∑,所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x y x ybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是22.0502ˆ.65yx =+. 【错因分析】错解中回归方程记忆错误,应为y bx a =+. 【正解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=, 1(7865716461)67.85y =⨯++++=,518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174i i x ==++++=∑, 所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x yxybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是0.62520ˆ 2.5yx =+.三、习题强化训练1.下列两个变量之间的关系不具有线性关系的是 A .小麦产量与施肥值 B .球的体积与表面积 C .蛋鸭产蛋个数与饲养天数D .甘蔗的含糖量与生长期的日照天数 2.下列命题正确的是①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. A .①③④ B .②③④C .③④⑤D .②④⑤3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关4.下列变量是线性相关的是 A .人的体重与视力 B .圆心角的大小与所对的圆弧长 C .收入水平与购买能力D .人的年龄与体重5.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2D .y ^=-1.5x -26.下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.7.若施肥量x (kg )与水稻产量y (kg )的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.8.正常情况下,年龄在18岁到38岁的人,体重y (kg )对身高x (cm )的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.9.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程y ^=0.7x +0.35,那么表中t 的值为________. 10.下列两个变量之间的关系是相关关系的是____________.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长; ③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.11.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同12.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 13.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^A .不能小于0B .不能大于0C .不能等于0D .只能小于014.某考察团对全国10大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有线性相关关系,线性回归方程ˆy=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x , (1)若两艘船的吨位相差1 000,求船员平均相差的人数. (2)估计吨位最大的船和最小的船的船员人数.16.某工厂对某种产品的产量与成本的资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.17.某城市理论预测2014年到2018年人口总数y (单位:十万)与年份(用2014+x 表示)的关系如表所示:年份中的x 0 1 2 3 4 人口总数y5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ∧=bx +a ; (3)据此估计2019年该城市人口总数.(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)参考公式:线性回归方程为y bx a =+,其中()()()1122211n ni i i i i i n n i i i i x x y y x y nxy b x x x nx====---==--∑∑∑∑.习题参考答案:6.【答案】②④ 7.【答案】650 8.【答案】69.96 9.【答案】310.【答案】④14.【答案】83%15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人. 16.【答案】(1)详见解析;(2)y ^=1.1x +4.6;(3)产量为8千件时,成本约为13.4万元. 17.【答案】(1)详见解析;(2)y =3.2x +3.6;(3)估计2019年该城市人口总数约为196万.。
(新课标)高考数学大一轮复习第九章算法初步、统计与统计案例9.4相关关系与统计案例课件文

请注意 高考对本节内容的考查主要是线性回归分析和独立性 检验的统计分析方法,三种题型都有可能出现,难度中档.
突破考点01 突破考点02 突破考点03
高考真题演练 课时作业
突破考点 01
相关关系的判断
(基础送分型——自主练透)
1.相关关系的分类 (1)正相关:从散点图上看,点散布在从________到 ________的区域内; (2)负相关:从散点图上看,点散布在从左上角到 ________的区域内. 2.线性相关关系 从散点图上看,如果这些点从整体上看大致分布在一条 直线附近,则称这两个变量之间具有线性相关关系,这条直 线叫________.
第九章
算法初步、统计与统计案例
第四节 相关关系与统计案例
考纲下载 1.会作两个相关变量的散点图,会利用散点图认识变 量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系 数公式建立线性回归方程. 3.了解独立性检验(只要求2×2列联表)的基本思想、 方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.
【答案】 B
(2)在一组样本数据(x1,y1),(x2,y2),…,(xn,
yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本
点(xi,yi)(i=1,2,…,n)都在直线y=
1 2
x+1上,则这组样本数
据的样本相关系数为( )
A.-1
B.0
1 C.2
D.1
【解析】 因为所有的点都在直线上,所以它就是确定 的函数关系,所以相关系数为1.
若变量x与y具有线性相关关系,有n个样本数据(xi,yi)(i
n
xi- x yi- y
^^
^ ^ i=1
变量间的相关关系-统计案例

高考数学知识点:变量间的相关关系-统计案例2016-04-22 15:15一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.典型例题1:某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.3.使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.2.回归方程为3.求最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.相关系数,当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.典型例题2:1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.3.由相关系数r判断时|r|越趋近于1相关性越强.三、独立性检验典型例题3:。
2020高考数学总复习第九章算法初步、统计、统计案例课时作业56变量间的相关关系与统计案例文(含解析)

课时作业56 变量间的相关关系与统计案例1.(2019·辽宁丹东教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有____的把握认为“学生性别与支持该活动没有关系”.( C )附:C .1%D .0.1%解析:因为6.635<6.705<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”,故选C.2.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关解析:由y =-0.1x +1,知x 与y 负相关,即y 随x 的增大而减小,又y 与z 正相关,所以z 随y 的增大而增大,减小而减小,所以z 随x 的增大而减小,x 与z 负相关,故选C.3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( B )A.116B.18C.14D.12解析:依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18. 4.为考察A 、B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法正确的是( C ) A .药物A 、B 对该疾病均没有预防效果 B .药物A 、B 对该疾病均有显著的预防效果 C .药物A 的预防效果优于药物B 的预防效果 D .药物B 的预防效果优于药物A 的预防效果解析:根据两个等高条形图知,药物A 实验显示不服药与服药时患病的差异较药物B 实验显示明显大,∴药物A 的预防效果优于药物B 的预防效果.故选C.5.(2019·河南焦作一模)已知变量x 和y 的统计数据如下表:根据上表可得回归直线方程为y =b x -0.25,据此可以预测当x =8时,y =( C ) A .6.4 B .6.25 C .6.55D .6.45解析:由题意知x =3+4+5+6+75=5,y =2.5+3+4+4.5+65=4,将点(5,4)代入y ^=b ^x -0.25,解得b ^=0.85,则y ^=0.85x -0.25, 所以当x =8时,y ^=0.85×8-0.25=6.55,故选C.6.(2019·南昌模拟)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.由K 2=a +bc +d a +cb +d算得,K 2=258×42×35×65≈9.616,参照附表,得到的正确结论是( C )A .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别无关”C .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”D .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关” 解析:由题意K 2的观测值≈9.616>6.635,所以在犯错误的概率不超过0.01的前提下认为“生育意愿与城市级别有关”.。
高考复习文科数学课时试题(56)变量的相关关系与统计案例及答案
【若缺失公式、图片现象属于系统读取不成功,文档内容齐全完整,请放心下载。
】课时作业(五十六)[第56讲变量的相关关系与统计案例][时间:45分钟分值:100分]基础热身1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫()A.函数关系B.线性关系C.相关关系D.回归关系2.分类变量X和Y的列联表如下:Y1Y2总计X1 a b a+bX2 c d c+d总计a+c b+d a+b+c+d则下列说法正确的是()A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强3.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图K56-1),以下结论中正确的是()图K56-1A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同4.2010年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:月平均气温x(℃)17138 2月销售量y(件)24334055由表中数据算出线性回归方程y=bx+a中的b≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月羽绒服的销售量约为________件.5.工人月工资y(元)关于劳动生产率x(千元)的回归方程为y=650+80x,下列说法中正确的个数是()①劳动生产率为1000元时,工资为730元;②劳动生产率提高1000元,则工资提高80元;③劳动生产率提高1000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2000元.A.1 B.2 C.3 D.46.某产品的广告费用x与销售额y的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元) 49 26 39 54 根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元7.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确8. 变量X 与Y 相对应的一组数据为(10,1),(11.3,2)(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 19.已知x 、y 的取值如下表所示:x 2 3 4 y 6 4 5如果y 与x 呈线性相关,且线性回归方程为y =bx +132,则b =( )A.13 B .-12 C.12D .1 10.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6 y 1.4 2.3 3.1 3.7 4.5若由资料可知y 对x 呈线性相关关系,且线性回归方程为y ^=a +bx ,其中已知b =1.23,请估计使用年限为20年时,维修费用约为________.11. 对一些城市进行职工人均工资水平x (千元)与居民人均消费水平y (元)统计调查后知,y 与x 具有相关关系,满足回归方程y =0.66x +1.562.若某被调查城市居民人均消费水平为7.675(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为________%(保留两个有效数字).12.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后 死亡 存活 合计 第一种剂量 14 11 25 第二种剂量 6 19 25 合计 20 30 50进行统计假设是________________________________________________________________________.13. 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:时间x 1 2 3 4 5 命中率y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.14.(10分) 某中学采取分层抽样的方法从应届高三学生中按照性别抽出20名学生作为男女文科2 5理科10 3(1)3人中既有男生也有女生的概率;(2)用假设检验的方法分析有多大的把握认为该中学的高三学生选报文理科与性别有关?参考公式和数据:K2=n(ad-bc)2.P(K2≥K0)0.150.100.050.0250.0100.0050.001 K0 2.07 2.71 3.84 5.02 6.647.8810.8315.(13分)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.821.618.429.222(1)(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.难点突破16.(12分)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号1234 5工作年限x/年35679推销金额y/万元2334 5(1)(2)求年推销金额y关于工作年限x的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.(参考数据: 1.04≈1.02;由检验水平0.01及n-2=3,查表得r0.01=0.959)课时作业(五十六)【基础热身】1.C [解析] 由相关关系的概念可知,C 正确.故选C.2.C [解析] 因为K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d ),当(ad -bc )2越大时,K 2越大,说明X 与Y 关系越强.故选C.3.A [解析] 由题设给出的图象知两变量负相关,则相关系数为负值,则C 错,相关系数r 是研究相关性大小的,b 为直线的斜率,则B 错,回归分析得到的直线为与所有点距离和最小的,与点在直线两边的个数无关,D 错,故答案为A.4.46 [解析] 由给定的样本数据可知,该样本点的中心(x ,y )为(10,38),因为线性回归方程过样本点的中心,故38=-20+a ,所以a =58,∴y ^=-2x +58,故当x =6时,y ^=46.【能力提升】5.C [解析] 将数据代入方程计算可判断①②④正确.故选C.6.B [解析] x =4+2+3+54=3.5,y =49+26+39+544=42,由于回归方程过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1,故回归方程为y ^=9.4x +9.1,所以当x =6时,y =6×9.4+9.1=65.5.7.C [解析] 根据独立性检验的思想知,选项C 正确.8.C [解析] 对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,即r 2<0.∴r 2<0<r 1. 故选C.9.B [解析] 因为x =3,y =5,又回归直线过点(x ,y ),所以5=3b +132,所以b =-12.10.22.68万元 [解析] 易得x =4,y =3,而b =1.23,代入回归方程得a =-1.92,所以,回归方程为y ^=1.23x -1.92,若使用年限为20年时,估计维修费用约为y ^=1.23×20-1.92=22.68.11.83 [解析] 将y =7.675代入回归方程得x =9.262,所以估计该城市人均消费额占人均工资收入的百分比约为7.6759.262≈0.83.12.小白鼠的死亡与电离辐射的剂量无关 [解析] 根据独立性检验的基本思想,可知类似反证法,即要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.对本题进行统计分析时的统计假设应是“小白鼠的死亡与剂量无关”.13.0.5 0.53 [解析] y =0.4+0.5+0.6+0.6+0.45=2.55=0.5;x =1+2+3+4+55=3.b ^=(x 1-x )(y 1-y )+…+(x 5-x )(y 5-y )(x 1-x )2+…+(x 5-x )2=0.01,a ^=y -b ^x =0.5-0.01×3=0.47,所以回归方程为:y =0.47+0.01x ,所以当x =6时,y =0.47+0.01×6=0.53.14.[解答] (1)设样本中两名男生分别为a ,b,5名女生分别为c ,d ,e ,f ,g ,则基本事件空间为:(abc ),(abd ),(abe ),(abf ),(abg ),(acd ),(ace ),(acf ),(acg ),(ade ),(adf ),(adg ),(aef ),(aeg ),(afg ),(bcd ),(bce ),(bcf ),(bcg ),(bde ),(bdf ),(bdg ),(bef ),(beg ),(bfg ),(cde ),(cdf ),(cdg ),(cef ),(ceg ),(cfg ),(def ),(deg ),(dfg ),(efg )共35种,其中既有男又有女的事件为前25种.故“抽出的3人既有男生又有女生”的概率为P =2535=57.(2)K 2=20×(50-6)27×13×12×8≈4.43>3.84,对照参考表格,结合考虑样本是抽取分层抽样抽取的,可知有95%以上的把握认为学生选报文理科与性别有关.15.[解答] (1)(2)x =15∑i =15x i =109,∑i =15 (x i -x )2=1570,y =23.2,∑i =15(x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^, 则b ^=3081570≈0.1962,a ^=y -b ^x =23.2-109×3081570≈1.8166.故所求回归直线方程为y ^=0.1962x +1.8166.(3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.1962×150+1.8166=31.2466(万元). 【难点突破】16.[解答] (1)由∑i =15(x i -x )(y i -y )=10,∑i =15(x i -x)2=20,∑i =15(y i -y )2=5.2,可得r =∑i =15(x i -x )(y i -y )∑i =15(x i -x)2∑i =15(y i -y )2=10104≈0.98. 即年推销金额y 与工作年限x 之间的相关系数约为0.98. (2)由(1)知,r =0.98>0.959=r 0.01,所以可以认为年推销金额y 与工作年限x 之间具有较强的线性相关关系.设所求的线性回归方程为y ^=b ^x +a ^,则b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1020=0.5,a ^=y -b ^x =0.4. 所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.(3)由(2)可知,当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9万元. 所以可以估计第6名推销员的年推销金额为5.9万元.。
高考数学总复习第九章算法初步、统计、统计案例课时作业62理
课时作业62 变量间的相关关系与统计案例1.(2019·辽宁丹东教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有 的把握认为“学生性别与支持该活动没有关系”.( C )附:C .1%D .0.1%解析:因为6.635<6.705<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”,故选C.2.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关解析:由y =-0.1x +1,知x 与y 负相关,即y 随x 的增大而减小,又y 与z 正相关,所以z 随y 的增大而增大,减小而减小,所以z 随x 的增大而减小,x 与z 负相关,故选C.3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( B )A.116 B .18 C.14D .12解析:依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18.4.为考察A 、B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法正确的是( C ) A .药物A 、B 对该疾病均没有预防效果 B .药物A 、B 对该疾病均有显著的预防效果 C .药物A 的预防效果优于药物B 的预防效果 D .药物B 的预防效果优于药物A 的预防效果解析:根据两个等高条形图知,药物A 实验显示不服药与服药时患病的差异较药物B 实验显示明显大,∴药物A 的预防效果优于药物B 的预防效果.故选C.5.(2019·河南焦作一模)已知变量x 和y 的统计数据如下表:根据上表可得回归直线方程为y =b x -0.25,据此可以预测当x =8时,y ^=( C ) A .6.4 B .6.25 C .6.55D .6.45解析:由题意知x =3+4+5+6+75=5,y =2.5+3+4+4.5+65=4,将点(5,4)代入y ^=b ^x -0.25,解得b ^=0.85,则y ^=0.85x -0.25, 所以当x =8时,y ^=0.85×8-0.25=6.55,故选C.6.(2019·南昌模拟)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.附表:由K 2=a +bc +d a +cb +d算得,K 2=258×42×35×65≈9.616,参照附表,得到的正确结论是( C )A .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别无关”C .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”D .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关” 解析:由题意K 2的观测值≈9.616>6.635,所以在犯错误的概率不超过0.01的前提下认为“生育意愿与城市级别有关”.7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.77x +52.9.解析:由已知可计算求出x =30,而线性回归方程必过点(x ,y ),则y =0.77×30+52.9=76,设模糊数字为a ,则a +62+75+80+905=76,计算得a =73.8.(2019·赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)过 0.025 .附表:解析:由列联表计算K 2的观测值k =30×20×20×30≈5.556>5.024,∴推断犯错误的概率不超过0.025.9.(2019·安徽蚌埠段考)为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:有解析:由2×2列联表可知,K 2=-240×60×35×65≈2.93,因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.10.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n = 10 .解析:x =9+9.5+m +10.5+115=8+m 5,y =11+n +8+6+55=6+n 5,回归直线一定经过样本点中心(x ,y ),即6+n5=-3.2⎝ ⎛⎭⎪⎫8+m 5+40,即3.2m +n =42.又因为m +n =20,即⎩⎪⎨⎪⎧3.2m +n =42,m +n =20,解得⎩⎪⎨⎪⎧m =10,n =10,故n =10.11.(2019·重庆调研)某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:(1)5人中任选2人,求被选中的恰好是男、女用户各1人的概率;(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.注:K 2=a +bc +d a +cb +d,n =a +b +c +d .解:(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为550=110.所以在满意产品的用户中应抽取女用户20×110=2(人),男用户30×110=3(人).抽取的5人中,三名男用户记为a ,b ,c ,两名女用户记为r ,s ,则从这5人中任选2人,共有10种情况:ab ,ac ,ar ,as ,bc ,br ,bs ,cr ,cs ,rs .其中恰好是男、女用户各1人的有6种情况:ar ,as ,br ,bs ,cr ,cs . 故所求的概率为P =610=0.6.(2)由题意,得K 2的观测值为k =-2++++=163≈5.333>5.024. 又P (K 2≥5.024)=0.025.故有97.5%的把握认为“产品用户是否满意与性别有关”.12.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t -.解:(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17y i -y2=0.55,∑i =17(t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.10, a ^=y -b ^ t -=1.331-0.10×4≈0.93. 所以y 关于t 的回归方程为 y ^=0.93+0.10t .将2016年对应的t =9代入回归方程得:y ^=0.93+0.10×9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.13.(2019·湖南张家界一模)已知变量x ,y 之间的线性回归方程为y ^=-0.7x +10.3,且变量x ,y 之间的一组相关数据如下表所示,则下列说法错误的是( C )A.变量x ,B .可以预测,当x =20时,y ^=-3.7 C .m =4D .该回归直线必过点(9,4)解析:由-0.7<0,得变量x ,y 之间呈负相关关系,故A 正确;当x =20时,y ^=-0.7×20+10.3=-3.7,故B 正确;由表格数据可知x =14×(6+8+10+12)=9,y =14(6+m +3+2)=11+m 4,则11+m 4=-0.7×9+10.3,解得m =5,故C 错;由m =5,得y =6+5+3+24=4,所以该回归直线必过点(9,4),故D 正确.故选C.14.(2019·湖南永州模拟)已知x 与y 之间的几组数据如下表:假设根据上表数据所得的线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( C )A.b ^>b ′,a ^>a ′ B .b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D .b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑i =16x i y i -6 x·y∑i =16x 2i -6 x 2=58-6×72×13691-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.15.(2019·青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数23.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有 12 人.则k >3.841,即k =3x 2⎝ ⎛⎭⎪⎫x 6·x 6-5x 6·x 32x ·x 2·x 2·x =3x8>3.841,解得x >10.243.因为x 6,x2为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.16.(2019·包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图.注:年份代码1~7分别对应年份2010~2016.(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程,预测2017年该企业的污水净化量;(3)请用数据说明回归方程预报的效果.参考数据:y -=54,∑i =17(t i -t -)(y i -y -)=21,14≈3.74,∑i =17(y i -y ^i )2=94. 参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,线性回归方程y ^=a ^+b ^t ,b ^=∑i =1nt i -ty i -y∑i =1n t i -t2,a ^=y -b ^t -.反映回归效果的公式为:R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,其中R 2越接近于1,表示回归的效果越好.解:(1)由折线图中的数据得,t =4,∑i =17(t i -t -)2=28,∑i =17(y i -y -)2=18,所以r =2128×18≈0.935. 因为y 与t 的相关系数近似为0.935,说明y 与t 的线性相关程度相当大,所以可以用线性回归模型拟合y 与t 的关系.(2)因为y -=54,b ^=∑i =17t i -ty i -y∑i =17t i -t2=2128=34, 所以a ^=y -b ^t =54-34×4=51,所以y 关于t 的线性回归方程为y ^=b ^t +a ^=34t +51.将2017年对应的t =8代入得y ^=34×8+51=57,所以预测2017年该企业污水净化量约为57吨.(3)因为R 2=1-∑i =17y i -y ^i2∑i =17y i -y2=1-94×118=1-18=78=0.875,所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.。
高考新坐标(教师用书)届高考数学总复习第九章算法初步、统计与统计案例【含答案】
第九章算法初步、统计与统计案例第一节算法与程序框图[考纲传真]1.了解算法的含义,了解算法的思想. 2.理解程序框图的三种基本逻辑结构:顺序、条件、循环. 3.理解几种基本算法语句——输入语句、输出语句、赋值语句、条件语句、循环语句的含义.1.算法(1)算法通常是指按照一定规则解决某一类问题的明确和有限的步骤.(2)应用:算法通常可以编成计算机程序,让计算机执行并解决问题.2.程序框图定义:程序框图又称流程图,是一种用程序框、流程线及文字说明来表示算法的图形.3.三种基本逻辑结构及相应语句1.(夯基释疑)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)程序框图中的图形符号可以由个人来确定.( )(2)一个程序框图一定包含顺序结构,但不一定包含条件结构和循环结构.( ) (3)5=x 是赋值语句.( )(4)输入语句可以同时给多个变量赋值.( )[解析] 图形符号不能个人确定,(1)不正确;赋值语句只能给变量赋值,(3)不正确. [答案] (1)× (2)√ (3)× (4)√2.(教材改编)根据给出的程序框图,计算f(-1)+f(2)=( )图911A .0B .1C .2D .4[解析] 输入-1,满足x≤0,所以f(-1)=4×(-1)=-4;输入2,不满足x≤0,所以f(2)=22=4,即f(-1)+f(2)=0.[答案]A3.运行如图所示的程序,可得A的输出值为( )A=20A=A*2-30PRINT AENDA.30 B.20 C.10 D.-10[解析]A=20×2-30=10.[答案]C4.(2014·天津高考)阅读下边的框图,运行相应的程序,输出S的值为________.图912[解析]S=0,n=3,S=0+(-2)3=-8,n=3-1=2≤1不成立;故S=-8+(-2)2=-4,n=2-1=1≤1成立.故输出S的值为-4.[答案]-45.(2014·福建高考改编)阅读如图913所示的程序框图,运行相应的程序,输出的n的值为________.图913[解析]当n=1时,21>12;当n=2时,22>22不成立,结束循环.因此输出n=2.[答案] 2考向1程序框图的基本结构与应用【典例1】(1)执行下面的程序框图,如果输入的t∈[-1,3],则输出的s属于( ) A.[-3,4] B.[-5,2]C.[-4,3] D.[-2,5]图914图915(2)(2014·浙江高考)若某程序框图如图915所示,当输入50时,则该程序运行后输出的结果是________.[解析] (1)由程序框图知s =⎩⎪⎨⎪⎧3t ,(t<1),4t -t 2,(t≥1),①当-1≤t<1时,-3≤s<3;②当1≤t≤3时,s =-(t -2)2+4.∴3≤s≤4. 由①②知,s 的取值范围属于[-3,4]. (2)第一次循环,S =1,i =2; 第二次循环,S =4,i =3;第三次循环,S =2×4+3=11,i =4; 第四次循环,S =2×11+4=26,i =5;第五次循环,S =2×26+5=57,i =6,此时S>50,退出循环. 所以输出的结果i =6. [答案] (1)A (2)6 【规律方法】1.对条件结构,无论判断框中的条件是否成立,都只能执行两个分支中的一个,不能同时执行两个分支.2.利用循环结构表示算法,第一要确定是利用当型还是直到型循环结构;第二准确表示累计变量;第三要注意从哪一步开始循环.弄清进入或终止的循环条件、循环次数是做题的关键.【变式训练1】 (1)如图916所示的程序框图,运行相应的程序.若输入x 的值为1,则输出S 的值为________.图916(2)(2014·陕西高考)根据下边框图,对大于2的整数N,输出的数列的通项公式是( )图917A.a n=2n B.a n=2(n-1) C.a n=2n D.a n=2n-1[解析](1)第1次运行:x=1,S=0+13=1<50;第2次运行:x=2,S=1+23=9<50;第3次运行:x=4,S=9+43=73>50,满足S≥50,跳出循环.输出S=73.(2)由程序框图可知第一次运行:i=1,a1=2,S=2;第二次运行:i=2,a2=4,S=4;第三次运行:i=3.a3=8,S=8;第四次运行:i=4,a4=16,S=16.故选C.[答案](1)73 (2)C考向2程序框图的识别与完善(高频考点)命题视角程序框图的识别与完善是高考命题的热点,主要以客观题的形式呈现.主要命题角度:(1)根据程序框图确定输出结果;(2)补充程序框图中判断框或执行框;(3)依据程序框图及运行结果求输入变量的初始值等.【典例2】 (1)如图918所示是计算某年级500名学生期末考试(满分为100分)及格率q 的程序框图,则图中空白框内应填入________.图918 图919(2)(2014·重庆高考)执行如图919所示的程序框图,若输出k 的值为6,则判断框内可填入的条件是( )A .s>12B .s>35C .s>710D .s>45[思路点拨] (1)根据程序框图的功能,应确定及格率q 与及格人数M 之间的关系;(2)依次执行程序框图,根据输出结果确定判断框内的控制条件.[解析] (1)由判断框输出可知,M 表示及格人数,N 表示不及格人数, ∴及格率q =M M +N ,因此执行框为“q=M M +N”.(2)第一次循环:s =1×910=910,k =8,s =910应满足条件;第二次循环:s =910×89=810,k =7,s =810应满足条件,排除选项D ;第三次循环:s =810×78=710,k =6,故这时程序不再满足条件,结束循环,因此判断框中的条件为s>710.[答案] (1)q =MM +N(2)C 【通关锦囊】1.(1)第1题的关键在于理解程序框图的功能;(2)第2题要明确何时进入或退出循环体,以及累乘变量的变化.2.解答此类题目:(1)要明确程序框图的顺序结构,条件结构和循环结构;(2)理解程序框图的功能;(3)要按框图中的条件运行程序,按照题目的要求完成解答.【变式训练2】 (2015·潍坊质检)执行如图9110所示的程序框图,若输出的S 是2 047,则判断框内应填写()图9110A .n ≤9?B .n ≤10?C .n ≥10?D .n ≥11?[解析] 由程序框图的功能知,题目的实质是数列{2n}(n∈N )求和. ∵{2n }的首项为20=1,公比为2.∴当n =9时,S =1+2+22+…+29=1-2101-2=1 023.当n =10时,S =1+2+22+…+210=1-2111-2=2 047.此时输出S =2 047,跳出循环,所以判断框的条件为n ≤9. [答案] A考向3 基本算法语句【典例3】 根据下列算法语句,当输入x 为60时,输出y 的值为( )A .25B .30C .31D .61[解析] 由题意,得y =⎩⎪⎨⎪⎧0.5x ,x ≤50,25+0.6(x -50),x>50.当x =60时,y =25+0.6×(60-50)=31. ∴输出y 的值为31. [答案] C ,【规律方法】1.本题主要考查条件语句,输入与输出语句,要注意赋值语句一般格式中的“=”不同于等式中的“=”,其实质是计算“=”右边表达式的值,并将该值赋给“=”左边的变量.2.解决此类问题关键要理解各语句的含义,以及基本算法语句与算法结构的对应关系. 【变式训练3】 运行下面的程序时,WHILE 循环语句的执行次数是( )A .3B .4C .18D .19[解析] 0<20,1<20,2×2<20,5×5>20,程序结束, 故WHILE 循环语句共执行了3次. [答案] A掌握1条规律 每个算法结构都含有顺序结构,循环结构中必定包含一个条件结构,用于确定何时终止循环体.循环结构和条件结构都含有顺序结构.注意1个区别 当型循环与直到型循环的区别:直到型循环是“先循环,后判断,条件满足时终止循环”;当型循环是“先判断,后循环,条件满足时执行循环”;两者的判断框内的条件表述在解决同一问题时是不同的,它们恰好相反.勿忘2点注意 1.赋值号左边只能是变量(不是表达式),在一个赋值语句中只能给一个变量赋值. 2.利用循环结构表示算法,要明确是利用当型循环结构,还是直到型循环结构.要注意:(1)选择好累计变量;(2)弄清在哪一步开始循环,满足什么条件不再执行循环体.易错辨析之10程序框图中“变量”的含义理解不清致误(2014·课标全国卷Ⅰ)执行下面的程序框图,若输入的a ,b ,k 分别为1,2,3,则输出的M =( )图9111A .203 B .72 C .165 D .158[错解] n =1,M =1+12=32,a =2,b =32;n =2,M =2+23=83,a =32,b =83;n =3,M =32+38=158,a =83,b =158;n =4,M =83+815=4815=165,a =158,b =165,此时不满足条件,跳出循环,输出M =165.[答案] C 【智慧心语】错因分析:(1)循环变量n 与累加变量M 计算不对立,或混淆当型循环,误认为直到型循环结构,导致错解.(2)对循环体中各执行框的含义不清,错误赋值,错选A 或B .防范措施:(1)要分清是当型循环结构还是直到型循环结构;要理解循环结构中各变量的具体含义以及变化规律.具体求解时,把每次循环中各个变量的值对应起来,并要清楚的写下来,再根据条件判断是否结束循环.(2)在处理含有循环结构的算法问题时,关键是确定循环的次数,循环中有哪些变量,且每一次循环之后的变量S 、k 值都要被新的S 、k 值所替换.[正解] 第一次执行循环后:M =1+12=32,a =2,b =32,n =2;第二次执行循环后:M =2+23=83,a =32,b =83,n =3.第三次执行循环后:M =32+38=158,a =83,b =158,n =4.这时n =4,跳出循环.输出M 的值158.[答案] D【类题通关】 (2014·北京高考)当m =7,n =3时,执行如图9112所示的程序框图,输出的S 值为( )图9112A.7 B.42 C.210 D.840[解析]程序框图的执行过程如下:m=7,n=3时,m-n+1=5,k=m=7,S=1,S=1×7=7;k=k-1=6>5,S=6×7=42;k=k-1=5=5,S=5×42=210;k=k-1=4<5,输出S=210.故选C.[答案]C课后限时自测[A级基础达标练]一、选择题1.(2014·课标全国卷Ⅱ)执行如图9113所示的程序框图,如果输入的x,t均为2,则输出的S=( )图9113A .4B .5C .6D .7[解析] x =2,t =2,M =1,S =3,k =1. k ≤t ,M =11×2=2,S =2+3=5,k =2;k ≤t ,M =22×2=2,S =2+5=7,k =3;3>2,不满足条件,输出S =7. [答案] D2.(2014·湖南高考)执行如图9114所示的程序框图,如果输入的t∈[-2,2],则输出的S 属于( )图9114A .[-6,-2]B .[-5,-1]C .[-4,5]D .[-3,6][解析] 由程序框图知,当0≤t≤2时,输出S =t -3,此时S∈[-3,-1];当-2≤t<0时,执行t =2t 2+1后1<t≤9,执行1<t≤9时,输出S =t -3,此时S∈(-2,6].因此输出S 的值属于[-3,6].[答案] D3.某程序框图如图9115所示,若输出的结果S=57,则判断框内应填入的条件是( )图9115A.k>4? B.k>5? C.k>6? D.k>7?[解析]由程序框图可知,k=1时,S=1;k=2时,S=2×1+2=4;k=3时,S=2×4+3=11;k=4时,S=2×11+4=26;k=5时,S=2×26+5=57.[答案]A4.阅读如图9116所示的程序框图,运行相应的程序,则输出S的值为( )图9116A.8 B.18 C.26 D.80[解析]执行一次循环S=2,n=2;执行第二次循环:S=2+32-31=8,n=3;执行第3次循环:S=8+33-32=26,n=4;满足n≥4,故输出S=26.[答案]C5.(2014·安徽高考)如图9117所示,程序框图(算法流程图)的输出结果是( )图9117A.34 B.55 C.78 D.89[解析]当输入x=1,y=1,执行z=x+y及z≤50,x=y,y=z后,x,y,z的值依次对应如下:x=1,y=1,z=2;x=1,y=2,z=3;x=2,y=3,z=5;x=3,y=5,z=8;x=5,y=8,z=13;x=8,y=13,z=21;x=13,y=21,z=34;x=21,y=34,z=55.由于55≤50不成立,故输出55.故选B.[答案]B二、填空题6.运行下列的程序,当输入a,b分别为2,3时,最后输出的m的值为________.[解析]∵a=2,b=3,满足a<b,∴应把b值赋给m,∴m的值为3.[答案] 37.(2014·山东高考)执行如图9118所示的程序框图,若输入的x的值为1,则输出的n的值为________.图9118[解析]按照程序框图逐一执行.由x2-4x+3≤0,解得1≤x≤3.当x=1时,满足1≤x≤3,所以x=1+1=2,n=0+1=1;当x=2时,满足1≤x≤3,所以x=2+1=3,n=1+1=2;当x=3时,满足1≤x≤3, 所以x=3+1=4,n=2+1=3;当x=4时,不满足1≤x≤3,所以输出n=3.[答案] 38.(2015·临沂模拟)图9119(1)是某高三学生进入高中三年来的数学考试成绩茎叶图,第1次到第14次的考试成绩依次记为A1,A2,…,A14.图(2)是统计茎叶图中成绩在一定范围内考试次数的一个算法流程图.那么算法流程图输出的结果是________.(1) (2)图9119[解析]从算法流程图可知,该图表示统计成绩大于或等于90分的考试次数.由茎叶图可知输出的结果为10.[答案]10三、解答题9.某篮球队6名主力队员在最近三场比赛中投进的三分球个数如表格所示:图9120统计该6名队员在最近三场比赛中投进的三分球总数的程序框图如图9120所示.(1)试在判断框内填上条件;(2)求输出的s的值.[解](1)依题意,程序框图是统计6名队员投进的三分球的总数.∴判断框内应填条件“i≤6?”.(2)6名队员投进的三分球数分别为a1,a2,a3,a4,a5,a6.故输出的s=a1+a2+…+a6.10.三月植树节,林业管理部门在植树前,为了保证树苗的质量,都会对树苗进行检测.现从甲,乙两种树苗中各抽测了10株树苗,量出它们的高度如下:(单位:厘米) 甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,14,26,10,44,46.(1)画出两组数据的茎叶图,并根据茎叶图对甲,乙两种树苗的高度作比较,写出两个统计结论.(2)设抽测的10株甲种树苗高度平均值为x -,将这10株树苗的高度依次输入,按程序框图(如图9121)进行运算,问输出的S 大小为多少?并说明S 的统计学意义.图9121[解] (1)茎叶图如下:统计结论:①甲种树苗的平均高度小于乙种树苗的平均高度; ②甲种树苗比乙种树苗长得整齐;③甲种树苗的中位数为27,乙种树苗的中位数为28.5;④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近.(任写两条即可) (2)x -=27,S =35;S 表示10株甲种树苗高度的方差,是描述树苗高度离散程度的量.S 值越小,表示长得越整齐,S 值越大,表示长得越参差不齐.[B 级 能力提升练]1.(2015·济南质检)已知函数f(x)=ax 3+12x 2在x =-1处取得极大值,记g(x)=1f ′(x ).程序框图如图9122所示,若输出的结果S>2 0142 015,则判断框中可以填入的关于n 的判断条件是( )图9122A .n ≤ 2 014?B .n ≤2 015?C .n>2 014?D .n>2 015?[解析] 由题意得f′(x)=3ax 2+x ,由f′(-1)=0得a =13,∴f ′(x)=x 2+x ,即g(x)=1x 2+x =1x (x +1)=1x -1x +1. 由程序框图可知S =0+g(1)+g(2)+…+g(n)=1-1n +1, 由1-1n +1>2 0142 015,得n>2 014. 因此条件应为n≤2 015? [答案] B2.执行如图9123所示的程序框图,若输入n 的值为4,则输出s 的值为________.图9123[解析] 第一步运算结果:s =1,i =2(i≤4成立);第二步运算结果:s =2,i =3(i≤4成立);第三步运算结果:s =4,i =4(i≤4成立);第四步运算结果:s =7,i =5(i≤4不成立),程序结束,故输出s 的值为7.[答案] 73.已知数列{a n }的各项均为正数,观察程序框图如图9124所示,若k =5,k =10时,分别有S =511和S =1021,试求数列{a n }的通项公式.图9124[解] 由程序框图可知,数列{a n }是等差数列,首项为a 1,公差为d. S i =1a 1a 2+1a 2a 3+…+1a i a i +1=1d (1a 1-1a 2+1a 2-1a 3+…+1a i -1a i +1) =1d ⎝ ⎛⎭⎪⎫1a 1-1a i +1. 当k =5时,S =⎝ ⎛⎭⎪⎫1a 1-1a 61d =5a 1a 6=511.∴a 1a 6=11,即a 1(a 1+5d)=11;①当k =10时,S =⎝ ⎛⎭⎪⎫1a 1-1a 111d =10a 1a 11=1021,∴a 1a 11=21,即a 1(a 1+10d)=21,② 由①②联立,得a 1=1,d =2, 因此a n =a 1+(n -1)d =2n -1.第二节 随机抽样[考纲传真]1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本. 3.了解分层抽样和系统抽样方法.1.简单随机抽样(1)设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)常用简单随机抽样的方法:抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号.(2)确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n ,当Nn 不是整数时,随机从总体中剔除余数.(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k). (4)按照一定的规则抽取样本, 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.(2)应用范围:总体是由差异明显的几个部分组成时.1.(夯基释疑)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)简单随机抽样是从总体中逐个不放回的抽取抽样.( ) (2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ) (3)系统抽样在起始部分抽样时采用简单随机抽样.( )(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )[解析] 由简单随机抽样,系统抽样,分层抽样的意义,知(1)与(3)正确,(2)与(4)不正确.[答案] (1)√ (2)× (3)√ (4)×2.(2014·广东高考)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20[解析] 根据系统抽样的特点可知分段间隔为1 00040=25,故选C .[答案] C3.(2015·青岛调研)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学,初中,高中三个学段学生的视力情况有较大差异,而男女视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按学段分层抽样D .系统抽样[解析] 由于三个学段学生的视力情况差别较大,故需按学段分层抽样. [答案] C4.(2014·湖南高考)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3[解析] 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. [答案] D5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.[解析] 设应从高二年级抽取x 名学生,则x∶50=3∶10.解得x =15. [答案] 15考向1简单随机抽样【典例1】(1)下列抽取样本的方式属于简单随机抽样的个数为( )①盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.②从20件玩具中一次性抽取3件进行质量检验.③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3(2)(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 B.07 C.02 D.01[解析](1)①②③中都不是简单随机抽样,这是因为:①是放回抽样,②中是“一次性”抽取,而不是“逐个”抽取,③中“指定个子最高的5名同学”,不存在随机性,不是等可能抽样.(2)由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.[答案](1)A(2)D【规律方法】1.简单随机抽样是从含有N(有限)个个体的总体中,逐个不放回地抽取样本,且每次抽取时总体内的各个个体被抽到的机会都相等.2.(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀,一般地,当总体容量和样本容量都较小时可用抽签法.(2)随机数表法适用于总体中个体数较多的情形:随机数表法的操作要点:编号,选起始数,读数,获取样本.【变式训练1】下列抽样试验中,适合用抽签法的有________.①从某厂生产的5 000件产品中抽取600件进行质量检测; ②从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验; ③从甲,乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检测; ④从某厂生产的5 000件产品中抽取10件进行质量检测. [解析] ①,④中总体的个体数较大,不适用抽签法.对于③中,甲,乙两厂的产品质量可能差别较大,不一定能够达到搅拌均匀的条件,不适宜用抽签法.②中为同厂的产品,且样本容量较小,可用抽签法. [答案] ②考向2 系统抽样及其应用【典例2】 (1)(2015·淄博调研)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.(2)(2013·陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14[解析] (1)设第1组抽取的号码为b ,由系统抽样则第n 组抽取的号码为8(n -1)+b , ∴8×(16-1)+b =126,∴b =6, 故第1组抽取的号码为6.(2)抽样间隔为84042=20.设在1,2,…,20中抽取号码x 0(x 0∈[1,20]),在[481,720]之间抽取的号码记为20k +x 0,则481≤20k+x 0≤720,k ∈N *.∴24120≤k +x 020≤36.∵x 020∈⎣⎢⎡⎦⎥⎤120,1,∴k =24,25,26,…,35, ∴k 值共有35-24+1=12(个),即所求人数为12. [答案] (1)6 (2)B 【规律方法】1.如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样.特别注意,每个个体被抽到的机会均是n N.2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.【变式训练2】 (2015·威海质检)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15[解析] 由系统抽样知:抽取号码的间隔为96032=30,∵第一组抽取的号码为9,∴抽取的第n 个号码为a n ,则a n =9+30(n -1), 由451≤a n ≤750,得151115≤n ≤25710,注意到n ∈N *,∴落入区间[451,750]的号码共10个, 因此做问卷B 的有10人. [答案] C考向3 分层抽样及应用(高频考点)命题视角 分层抽样是抽样方法考查的重点,主要以客观题的形式呈现,命题的主要角度:(1)求各层的个体容量;(2)根据某层的容量求总体容量;(3)分层抽样的简单应用.【典例3】 (1)(2015·日照联考)某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =( )A .9B .10C .12D .13(2)(2014·湖北高考)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.[思路点拨] (1)利用抽样比为定值,列方程求解;(2)利用分层抽样,先求出总体中甲设备生产的产品数量,再计算乙设备生产的产品数量.[解析] (1)依题意得360=n120+80+60,故n =13.(2)由题设,抽样比为804 800=160.设甲设备生产的产品为x 件, 则x60=50,∴x =3 000. 故乙设备生产的产品总数为4 800-3 000=1 800. [答案] (1)D (2)1 800 【通关锦囊】1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.2.为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i ∶N i =n∶N.分层抽样的有关计算,转化为按比例列方程或算式求解.【变式训练3】 (1)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.(2)(2014·重庆高考)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250[解析] (1)抽样比为280560+420=280980=27,所以样本中男生人数为560×27=160.(2)法一:由题意可得70n -70=3 5001 500,解得n =100.法二:由题意,抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.[答案] (1)160 (2)A掌握2条规律 1.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n ,总体容量为N ,每个个体被抽到的概率是nN. 2.系统抽样抽取的个体编号从小到大成等差数列.熟记3个范围 1.简单随机抽样:总体容量较少,尤其是样本容量较少. 2.系统抽样:适用于元素个数很多且均衡的总体. 3.分层抽样:适用于总体由差异明显的几部分组成的情形.勿忘3点注意 1.简单随机抽样中,易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等. 2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn 不是整数时,注意剔除,剔除的个体是随机的. 3.分层抽样中,易忽视每层抽取的个体的比例是相同的.易错辨析之11 图表信息求解的误区(2014·广东高考改编)已知某地区中小学生人数和近视情况分别如图921①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.图921[错解] 由图①知,样本容量为(2 000+3 500+4 500)×2%=200, 根据图②知,高中学生的近视人数为200×50%=100. 或根据图②知,高中近视人数为50人. 【智慧心语】错因分析:(1)误把样本容量200认为高中学生的样本数量,或将条形图中近视率误为近视人数.(2)不能从图表中提取有效信息,有的考生无从入手,或者未抓住分层抽样的特点:“各层抽取的个体数依各层个体之比来分配”而无法正确完成高中近视人数的计算求值.防范措施:(1)加强识图能力的培养,如本题中纵轴表示的近视率分别为10%,30%,50%.(2)理解分层抽样的概念,首先分层抽样是等概率抽样,因此,各层的抽样比应相等,可以利用这个等比关系计算求值.[正解] 易知,样本容量为(3 500+4 500+2 000)×2%=200.又样本中高中学生共有2 000×2%=40人.利用图②知,高中学生的近视率为50%.因此所抽样本中高中学生的近视人数为40×50%=20人.[答案]200 20【类题通关】从某小学随机抽样100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图922所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.图922[解析]∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030.设身高在[120,130),[130,140),[140,150]内的三组学生各有x,y,z人,则x100=0.030×10,y100=0.020×10,z100=0.01×10.∴x=30,y=20,z=10.由分层抽样的意义,抽样比为1830+20+10=30%.因此从身高在[140,150]内的学生中选取10×30%=3(人).[答案](1)0.030 (2)3课后限时自测[A 级 基础达标练]一、选择题1.(2014·四川高考)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本[解析] 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.[答案] A2.从2 007名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2 007人中剔除7人,剩下的2 000人再按系统抽样的方法抽取,则每人入选的概率( )A .不全相等B .均不相等C .都相等,且为502 007D .都相等,且为140[解析] 从N 个个体中抽取M 个个体,每个个体被抽到的概率均为MN .[答案] C3.某学校有男,女学生各500名,为了解男,女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法[解析] 由于是调查男,女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样法.[答案] D4.(2015·潍坊一模)高三某班有学生56人,现将所有同学随机编号,用系统抽样的方。
变量间的相关关系与统计案例
变量间的相关关系与统计案例变量间的相关关系是统计学中一个重要的概念,它描述了两个或多个变量之间的关联程度。
在实际应用中,我们经常需要了解不同变量之间的相关性,以便更好地理解数据和进行预测分析。
本文将介绍变量间相关关系的基本概念,并通过统计案例来说明相关关系的计算和应用。
首先,我们需要了解相关系数的概念。
相关系数是衡量两个变量之间相关性强弱的统计指标,通常用于描述线性相关关系。
常见的相关系数有皮尔逊相关系数、斯皮尔曼相关系数和判定系数等。
其中,皮尔逊相关系数用于衡量两个连续变量之间的线性相关性,取值范围为-1到1,其绝对值越接近1,表示相关性越强。
接下来,我们通过一个实际的统计案例来说明相关系数的计算和应用。
假设我们对某公司员工的工作满意度和工作绩效进行了调查,现在我们希望了解这两个变量之间的相关关系。
我们首先收集了员工的工作满意度得分和绩效评价得分,然后计算了它们之间的皮尔逊相关系数。
假设计算结果为0.8,这意味着工作满意度和工作绩效之间存在较强的正相关关系,即工作满意度较高的员工通常也具有较好的工作绩效。
在实际应用中,相关系数的计算可以帮助我们了解变量之间的关联程度,从而指导决策和预测分析。
例如,在人力资源管理中,我们可以通过工作满意度和绩效之间的相关关系来评估员工的工作状态,制定相应的激励和管理策略。
在市场营销中,我们可以分析产品销量与广告投入之间的相关关系,从而优化营销策略和预测销售额。
除了了解相关系数的计算和应用,我们还需要注意相关关系的解释和局限性。
相关系数只能描述两个变量之间的线性相关关系,对于非线性关系或者其他类型的相关关系,相关系数可能无法准确描述。
因此,在实际应用中,我们需要结合具体情况,综合考虑多个统计指标和数据特征,以全面理解变量间的相关关系。
综上所述,变量间的相关关系是统计学中一个重要的概念,相关系数的计算和应用可以帮助我们了解变量之间的关联程度,指导决策和预测分析。
然而,我们需要注意相关关系的解释和局限性,以便更准确地理解数据和进行统计分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时作业56 变量间的相关关系与统计案例1.(2019·辽宁丹东教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有____的把握认为“学生性别与支持该活动没有关系”.( C )附:C .1%D .0.1%解析:因为6.635<6.705<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”,故选C.2.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关解析:由y =-0.1x +1,知x 与y 负相关,即y 随x 的增大而减小,又y 与z 正相关,所以z 随y 的增大而增大,减小而减小,所以z 随x 的增大而减小,x 与z 负相关,故选C.3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( B )A.116B.18C.14D.12解析:依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18. 4.为考察A 、B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法正确的是( C ) A .药物A 、B 对该疾病均没有预防效果 B .药物A 、B 对该疾病均有显著的预防效果 C .药物A 的预防效果优于药物B 的预防效果 D .药物B 的预防效果优于药物A 的预防效果解析:根据两个等高条形图知,药物A 实验显示不服药与服药时患病的差异较药物B 实验显示明显大,∴药物A 的预防效果优于药物B 的预防效果.故选C.5.(2019·河南焦作一模)已知变量x 和y 的统计数据如下表:根据上表可得回归直线方程为y =b x -0.25,据此可以预测当x =8时,y =( C ) A .6.4 B .6.25 C .6.55D .6.45解析:由题意知x =3+4+5+6+75=5,y =2.5+3+4+4.5+65=4,将点(5,4)代入y ^=b ^x -0.25,解得b ^=0.85,则y ^=0.85x -0.25, 所以当x =8时,y ^=0.85×8-0.25=6.55,故选C.6.(2019·南昌模拟)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.由K 2=a +bc +d a +cb +d算得,K 2=258×42×35×65≈9.616,参照附表,得到的正确结论是( C )A .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别无关”C .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”D .在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关” 解析:由题意K 2的观测值≈9.616>6.635,所以在犯错误的概率不超过0.01的前提下认为“生育意愿与城市级别有关”.7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.77x +52.9.73.解析:由已知可计算求出x =30,而线性回归方程必过点(x ,y ),则y =0.77×30+52.9=76,设模糊数字为a ,则a +62+75+80+905=76,计算得a =73.8.(2019·赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)过0.025 .附表:解析:由列联表计算K 2的观测值k =30×20×20×30≈5.556>5.024,∴推断犯错误的概率不超过0.025.9.(2019·安徽蚌埠段考)为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.解析:由2×2列联表可知,K 2=-240×60×35×65≈2.93,因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.10.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n =10.解析:x =9+9.5+m +10.5+115=8+m 5,y =11+n +8+6+55=6+n 5,回归直线一定经过样本点中心(x ,y ),即6+n5=-3.2⎝ ⎛⎭⎪⎫8+m 5+40,即3.2m +n =42.又因为m +n =20,即⎩⎪⎨⎪⎧3.2m +n =42,m +n =20,解得⎩⎪⎨⎪⎧m =10,n =10,故n =10.11.(2019·重庆调研)某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:(1)2人,求被选中的恰好是男、女用户各1人的概率;(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.注:K 2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d .解:(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为550=110.所以在满意产品的用户中应抽取女用户20×110=2(人),男用户30×110=3(人).抽取的5人中,三名男用户记为a ,b ,c ,两名女用户记为r ,s ,则从这5人中任选2人,共有10种情况:ab ,ac ,ar ,as ,bc ,br ,bs ,cr ,cs ,rs .其中恰好是男、女用户各1人的有6种情况:ar ,as ,br ,bs ,cr ,cs . 故所求的概率为P =610=0.6.(2)由题意,得K 2的观测值为k =-2++++=163≈5.333>5.024. 又P (K 2≥5.024)=0.025.故有97.5%的把握认为“产品用户是否满意与性别有关”.12.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t -.解:(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17y i -y2=0.55,∑i =17(t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.10, a ^=y -b ^ t -=1.331-0.10×4≈0.93.所以y 关于t 的回归方程为y ^=0.93+0.10t .将2016年对应的t =9代入回归方程得:y ^=0.93+0.10×9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.13.(2019·青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数23.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.则k >3.841,即k =3x 2⎝ ⎛⎭⎪⎫x 6·x 6-5x 6·x 32x ·x 2·x 2·x =3x8>3.841,解得x >10.243.因为x 6,x2为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.14.(2019·包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图.注:年份代码1~7分别对应年份2010~2016.(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程,预测2017年该企业的污水净化量; (3)请用数据说明回归方程预报的效果.参考数据:y -=54,∑i =17(t i -t -)(y i -y -)=21,14≈3.74,∑i =17(y i -y ^i )2=94.参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,线性回归方程y ^=a ^+b ^t ,b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t -.反映回归效果的公式为:R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,其中R 2越接近于1,表示回归的效果越好.解:(1)由折线图中的数据得,t =4,∑i =17(t i -t -)2=28,∑i =17(y i -y -)2=18,所以r =2128×18≈0.935. 因为y 与t 的相关系数近似为0.935,说明y 与t 的线性相关程度相当大,所以可以用线性回归模型拟合y 与t 的关系.(2)因为y -=54,b ^=∑i =17t i -ty i -y∑i =17t i -t2=2128=34, 所以a ^=y -b ^t =54-34×4=51,所以y 关于t 的线性回归方程为y ^=b ^t +a ^=34t +51.将2017年对应的t =8代入得y ^=34×8+51=57,所以预测2017年该企业污水净化量约为57吨.(3)因为R 2=1-∑i =17y i -y ^i2∑i =17y i -y2=1-94×118=1-18=78=0.875,所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预报的效果是良好的.。