2018年高考数学考点通关练第八章概率与统计65随机抽样课件理2017052301106
[精品]2018年高考数学文科考点过关习题第八章概率与统计56和答案
![[精品]2018年高考数学文科考点过关习题第八章概率与统计56和答案](https://img.taocdn.com/s3/m/404f24d8f705cc17552709c0.png)
考点测试56 变量间的相关关系与统计案例一、基础小题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-2x +100 B.y ^=2x +100 C.y ^=-2x -100 D.y ^=2x -100答案 A解析 B 、D 为正相关,C 中y ^值恒为负,不符合题意. 2.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元答案 B解析 ∵a ^=y -b ^x =49+26+39+544-9.4×4+2+3+54=9.1,∴回归方程为y ^=9.4x +9.1.令x =6,得y ^=9.4×6+9.1=65.5(万元).3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.4.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1答案 D解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y ^i ,代入相关系数公式r =1-∑i =1ny i -y ^i2∑i =1ny i -y2=1.5.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .直线l 过点(x ,y )B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同答案 A解析因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误;D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误;根据线性回归直线一定经过样本点中心可知A正确.6.在一次对性别与说谎是否相关的调查中,得到如下数据:) A.在此次调查中有95%的把握认为是否说谎与性别有关B.在此次调查中有99%的把握认为是否说谎与性别有关C.在此次调查中有99.5%的把握认为是否说谎与性别有关D.在此次调查中没有充分的证据显示说谎与性别有关答案 D解析由于K2=30× 6×9-7×8 213×17×14×16≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.7.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.答案D解析由散点图知呈带状区域时有较强的线性相关关系,故去掉D.8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:根据表中所给的数据,能否在犯错误的概率不超过0.15的前提下认为这两种手术对病人又发作过心脏病的影响有差别?_______________________________________________________ .答案 1.78 不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析根据列联表中的数据,可以求得K 2=392× 39×167-29×157268×324×196×196≈1.78,而K 2<2.072,所以我们不能在犯错误的概率不超过0.15的前提下,作出这两种手术对病人又发作心脏病的影响有差别的结论.二、高考小题9.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D解析 由柱形图,知2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关,故D 错误.10.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元答案 B解析 ∵x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=y -0.76x =8-0.76×10=0.4, ∴y ^=0.76x +0.4.当x =15时,y ^=0.76×15+0.4=11.8.11.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A.成绩C.智商D.阅读量答案 D解析根据K2=n ad-bc 2a+b c+d a+c b+d,代入题中数据计算得表1:K2=52× 6×22-10×14 216×36×20×32≈0.009;表2:K 2=52× 4×20-12×16216×36×20×32≈1.769;表3:K 2=52× 8×24-8×12216×36×20×32≈1.3;表4:K 2=52× 14×30-6×2 216×36×20×32≈23.48.∵D 选项K 2最大,∴阅读量与性别有关联的可能性最大,故选D. 12.根据如下样本数据得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0 D .a <0,b <0答案 B解析 把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图,由图可知b <0,a >0.故选B.13.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本中心(3,3.5),代入验证得A 正确,B 错误.故选A.三、模拟小题14.已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^的值为( )A .-12B.12 C .-110D.110答案 A解析 将x =3,y =5代入到y ^=b ^x +132中,得b ^=-12.故选A.15.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( )A.116B.18C.14D.12答案 B解析 依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ,解得a ^=18. 16.下列说法错误的是( )A .在回归模型中,预报变量y 的值不能由解释变量x 唯一确定B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好答案 B解析 对于A ,在回归模型中,预报变量y 的值由解释变量x 和随机误差e 共同确定,即x 只能解释部分y 的变化,∴A 正确;对于B ,线性回归分析中,相关系数r 的绝对值越接近1,两个变量的线性相关性越强,反之,线性相关性越弱,∴B 错误;对于C ,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C 正确;对于D ,在回归分析中,用相关指数R 2来刻画回归的效果时,R 2取值越大,说明模型拟合的效果越好,∴R 2为0.98的模型比R 2为0.80的模型拟合的效果好,D 正确.故选B.17.为了检验某套眼保健操预防学生近视的作用,把500名做该套眼保健操的学生与另外500名未做该套眼保健操的学生的视力情况作记录并比较,提出假设H 0:“这套眼保健操不能起到预防近视的作用”,利用2×2列联表计算所得的K 2≈3.918.经查对临界值表知P (K 2≥3.841)≈0.05.对此,四名同学得出了以下结论:①有95%的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有95%的可能得近视;③这套眼保健操预防近视的有效率为95%;④这套眼保健操预防近视的有效率为5%.其中所有正确结论的序号是________. 答案 ①解析 根据查对临界值表知P (K 2≥3.841)≈0.05,故有95%的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;95%仅是指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.18.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,计算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.已知家庭的月储蓄y 关于月收入x 的线性回归方程为y ^=b ^x +a ^,则变量x 与y ________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.答案 正相关 1.7解析 由题意,知n =10,x =110∑i =110x i =8,y =110∑i =110y i =2,∴b^=184-10×8×2720-10×82=0.3,a ^=2-0.3×8=-0.4,∴y ^=0.3x -0.4,∵0.3>0,∴变量x 与y 正相关.当x =7时,y ^=0.3×7-0.4=1.7(千元).一、高考大题1.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1y i -y 2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 t i -t y i -y∑ni =1t i -t 2∑ni =1y i -y 2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑ni =1t i -t y i -y ∑ni =1t i -t 2,a ^=y -b ^ t . 解 (1)由折线图中数据和附注中参考数据得t =4,∑7i =1(t i -t )2=28,∑7i =1y i -y 2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i=40.17-4×9.32=2.89, r ≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1t i -t y i -y ∑7i =1t i -t 2=2.8928≈0.103, a ^=y -b ^t =1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i -u v i -v ∑n i =1u i -u 2,α^=v -β^ u . 解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2) 令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1 w i -w y i -y ∑8i =1w i -w 2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x的回归方程为y ^=100.6+68x .(3)①由(2),知当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果,知年利润z 的预报值z ^=0.2×(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值,故年宣传费为46.24千元时,年利润的预报值最大. 二、模拟大题3.班主任对班级22名学生进行了作业量多少的调查,数据如下:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.(1)根据以上数据建立一个2×2列联表;(2)试问喜欢玩电脑游戏与认为作业多少是否有关系.参考公式:K 2=n ad -bc2a +bc +d a +c b +d,其中n =a+b +c +d .参考数据:解 (1)(2)K 2=12×10×13×9≈6.418,∵3.841<6.418,∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关. 4.为使政府部门与群众的沟通日常化,某城市社区组织“网络在线问政”活动.2015年,该社区每月通过问卷形式进行一次网上问政.2016年初,社区随机抽取了60名居民,对居民上网参政议政意愿进行调查.已知上网参与问政次数与参与人数的频数分布表如下:附:χ2=11221221n 1+n 2+n +1n +2,(1)居民”,请你根据频数分布表,完成2×2列联表,据此调查是否有99%的把握认为在此社区内“上网参政议政与性别有关”;(2)6人中选出3人参加政府听证会,求选出的3人为2男1女的概率.解(1)由题意,知积极上网参政的有8+14+10+6=38人,不积极上网参政的有8+14=22人,2×2列联表为:∴χ2=40×20×38×22≈7.03,∵7.03>6.635,∴有99%的把握认为“上网参政议政与性别有关”.(2)选取男居民人数为6×4060=4人,选取女居民人数为6×2060=2人,记4个男居民分别为A、B、C、D,2个女居民分别为甲、乙,则基本事件有(A,B,C),(A,B,D),(A,B,甲),(A,B,乙),(A,C,D),(A,C,甲),(A,C,乙),(A,D,甲),(A,D,乙),(A,甲,乙),(B,C,D),(B,C,甲),(B,C,乙),(B,D,甲),(B,D,乙),(B,甲,乙),(C,D,甲),(C,D,乙),(C,甲,乙),(D,甲,乙),共20种.满足条件的基本事件有12种,∴所求概率为P =1220=35.5.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?参考公式:b ^=∑i =1nx i -x y i -y∑i =1nx i -x2,a ^=y -b ^·x .解 (1)由条件可知,x =15∑i =15x i =5405=108,y =15∑i =15y i =4205=84,∑i =15(x i -x )(y i -y )=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,∑i =15(x i -x )2=(-8)2+(-6)2+02+62+82=200,b ^=∑i =15x i -x y i -y∑i =15x i -x2=144200=0.72, a ^=y -b ^x =84-0.72×108=6.24, 故y 关于x 的线性回归方程为y ^=0.72x +6.24. (2)当x =200时,y ^=0.72×200+6.24=150.24.所以可以预测此时PM2.5的浓度约为150.24微克/立方米. 6.某品牌新款夏装即将上市,为了对夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据:与销量的回归直线方程y ^=b ^x +a ^;(2)在大量投入市场后,销售量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该款夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)附:b ^=∑i =1nx i -x y i -y ∑i =1nx i -x2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b^x .解 (1)A ,B ,C 三家连锁店平均售价和销量分别为(83,83),(85,80),(87,74),∴x =85,y =79,∴b ^=错误!=-2.25,∴a ^=y -b ^x =270.25,∴y ^=-2.25x +270.25. (2)设该款夏装的单价应定为x 元,利润为f (x )元, 则f (x )=(x -40)(-2.25x +270.25) =-2.25x 2+360.25x -10810,∴当x ≈80时,f (x )取得最大值.故该款夏装的单价应定为80元.。
2018年高考考点完全题数学(理)考点通关练习题第八章概率与统计66Word版含答案

考点测试66 用样本估计总体一、基础小题1.某日用品按行业质量标准分成五个等级,等级系数X依次为1,2,3,4,5,现从一批该种日用品中随机抽取200件,对其等级系数进行统计分析,得到频率f的分布表如下:则在所取的200A.40 B.20 C.30 D.60答案 B解析由所有频率之和为1,得a=0.1,则在所取的200件日用品中,等级系数X=1的件数为200×0.1=20.2.对于一组数据x i(i=1,2,3,…,n),如果将它们改变为x i+C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是( )A.平均数与方差均不变B.平均数变,方差保持不变C.平均数不变,方差变D.平均数与方差均发生变化答案 B解析由平均数的定义,可知每个个体增加C,则平均数也增加C,方差不变,故选B.3.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:A.甲 B.乙 C.丙 D.丁答案 C解析由表格中数据,可知丙平均环数最高,且方差最小,说明丙技术稳定,且成绩好,选C.4. 某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品长度的中位数为( )A.20 B.25 C.22.5 D.22.75答案 C解析产品的中位数出现在概率是0.5的位置.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08·(x-20)=0.5,得x=22.5,选C.5. 甲、乙两名同学在7次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是85,乙同学成绩的中位数是83,则成绩较稳定的是________.答案 甲解析 根据众数及中位数的概念易得x =5,y =3,故甲同学成绩的平均数为78+79+80+85+85+92+967=85,乙同学成绩的平均数为72+81+81+83+91+91+967=85,故甲同学成绩的方差为17×(49+36+25+49+121)=40,乙同学成绩的方差为17×(169+16+16+4+36+36+121)=3987>40,故成绩较稳定的是甲.6.甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,则参加比赛的最佳人选为________.答案 乙解析 甲的平均数x 1=4×0.2+5×0.1+7×0.3+8×0.1+9×0.2+10×0.1=7.0,乙的平均数x 2=5×0.1+6×0.2+7×0.4+8×0.2+9×0.1=7.0,所以x 1=x 2;甲的方差s 21=110=4,乙的方差s 22=110=1.2,所以s 21>s 22,即参加比赛的最佳人选为乙. 二、高考小题7.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140 答案 D解析 由频率分布直方图,知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.8.重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是( ) A .19 B .20 C .21.5 D .23 答案 B解析 由茎叶图,可知这组数据的中位数为20+202=20.9.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 答案 C解析 设数据x 1,x 2,…,x 10的平均数为x ,标准差为s ,则2x 1-1,2x 2-1,…,2x 10-1的平均数为2x -1,方差为x 1--x -2+x 2--x -2+…+x 10--x -210=x 1-x2+x 2-x2+…+x 10-x210=4s 2,因此标准差为2s =2×8=16.故选C.10.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 由题图,可知第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有200.40=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12.11.设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a,4B .1+a,4+aC .1,4D .1,4+a答案 A解析 ∵x 1,x 2,…,x 10的均值x =1,方差s 21=4,且y i =x i +a (i =1,2,…,10),∴y 1,y 2,…,y 10的均值y =110(y 1+y 2+…+y 10)=110(x 1+x 2+…+x 10+10a )=110(x 1+x 2+…+x 10)+a =x +a =1+a ,其方差s 22=110=110=s 21=4.故选A.12.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间上的运动员人数是________.答案 4解析 由系统抽样方法,知应把35人分成7组,每组5人,每组按规则抽取1人,因为成绩在区间上的共有4组,故成绩在区间上的运动员人数是4.三、模拟小题13. 某品牌空调在元旦期间举行促销活动,右面的茎叶图表示某专卖店记录的每天销售量情况(单位:台),则销售量的中位数是( )A .13B .14C .15D .16 答案 C解析 由茎叶图可知这些数分别为:5,8,10,14,16,16,20,23,∴中位数为14+162=15,故选C.14.气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于22 ℃”,现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22; ②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有( )A.①②③ B.①③ C.②③ D.①答案 B解析由统计知识,①甲地:5个数据的中位数为24,众数为22,可知①符合题意;而②乙地:5个数据的中位数为27,总体均值为24,有可能某一天的气温低于22 ℃,所以不符合题意;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若某一天的气温低于22 ℃,则总体方差就大于10.8,所以满足题意.故选B.15.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的频率分布直方图如图所示,假设得分值的中位数为m e,众数为m0,平均数为x,则( )A.m e=m0=x B.m e=m0<xC.m e<m0<x D.m0<m e<x答案 D解析显然得分值的众数为5,由频率分布直方图,可得30名学生的得分值分布为:3分(2人),4分(3人),5分(10人),6分(6人),7分(3人),8分(2人),9分(2人),10分(2人),则中位数是第15,16个数(5与6)的平均数5+62=5.5(分),众数为5,平均数x=+8+9++++10×5+6×630≈5.97(分),所以m0<m e<x,故选D.16.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时、980小时、1030小时,估计这个企业所生产的该产品的平均使用寿命为________小时.答案50 1015解析第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为1020×0.5+980×0.2+1030×0.3=1015.17.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组数据的频数和为62,设视力在4.6到4.8之间的学生人数为a,最大频率为0.32,则a的值为________.答案54解析前三组人数为100-62=38,第三组人数为38-(1.1+0.5)×0.1×100=22,则a=22+0.32×100=54.18.某市教育行政部门为了对某届高中毕业生学业水平进行评价,从该市高中毕业生中随机抽取1000名学生学业水平考试数学成绩作为样本进行统计.已知该样本中的每个值都是中的整数,且在上的频率分布直方图如图所示.记这1000名学生学业水平考试数学平均成绩的最小值(平均数的最小值是用区间的左端点值乘以各组的频率)为a,则a的值为________.答案67.5解析平均数的最小值是用区间的左端点值乘以各组的频率,于是a=0.005×10×40+0.010×10×50+0.025×10×60+0.035×10×70+0.015×10×80+0.010×10×90=67.5.一、高考大题1.某工厂36名工人的年龄数据如下表:(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01 %)?解 (1)依题意知所抽取的样本编号是一个首项为2,公差为4的等差数列,故其所有样本编号依次为2,6,10,14,18,22,26,30,34,对应样本的年龄数据依次为44,40,36,43,36,37,44,43,37.(2)由(1)可得其样本的均值x =44+40+36+43+36+37+44+43+379=40,方差s 2=19=19=1009.(3)由(2)知s =103,所以x -s =3623,x +s =4313.因为年龄在x -s 与x +s 之间共有23人, 所以其所占的百分比是2336≈63.89%.2.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.解 (1)由频率分布直方图,知月均用水量在 中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1.解得a =0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以 2.5≤x <3.由0.3×(x -2.5)=0.85-0.73,解得x =2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准. 二、模拟大题3.汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO 2排放量超过130 g/km 的MI 型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI 型品牌的新车各抽取了5辆进行CO 2排放量检测,记录如下(单位:g/km):经测算发现,乙类品牌车CO 2排放量的平均值为x 乙=120 g/km. (1)求甲类品牌汽车的排放量的平均值及方差;(2)若乙类品牌汽车比甲类品牌汽车CO 2的排放量稳定性好,求x 的取值范围. 解 (1)甲类品牌汽车的CO 2排放量的平均值x 甲=80+110+120+140+1505=120(g/km),甲类品牌汽车的CO 2排放量的方差s 2甲=÷5=600.(2)由题意知乙类品牌汽车的CO 2排放量的平均值x 乙=100+120+x +y +1605=120(g/km),得x +y =220,故y =220-x ,所以乙类品牌汽车的CO 2排放量的方差s 2乙=÷5,因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以s 2乙<s 2甲,解得90<x <130.4.为了解甲、乙两个快递公司的工作状况,假设同一个公司的快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,整理如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据题中数据写出甲公司员工A在这10天投递的快递件数的平均数和众数;(2)为了解乙公司员工B每天所得劳务费的情况,从这10天中随机抽取1天,他所得的劳务费记为X(单位:元),求X的分布列和数学期望;(3)根据题中数据估算两公司被抽取员工在该月所得的劳务费.解(1)甲公司员工A在这10天投递快递件数的平均数为36,众数为33.(2)设a为乙公司员工B1天的投递件数,则当a=34时,X=136,当a≥35时,X=35×4+(a-35)×7=7a-105,由题意知X的所有可能取值为136,147,154,189,203.X的分布列为:E(X)=136×10+147×10+154×5+189×10+203×10=10=165.5(元).(3)估计甲公司被抽取员工在该月所得的劳务费为4860元,乙公司被抽取员工在该月所得的劳务费为4965元.5.一个盒子中装有大量形状大小一样但重量不尽相同的小球,从中随机抽取50个作为样本,称出它们的重量(单位:克),重量分组区间为,(15,25],(25,35],(35,45].由此得到样本的重量频率分布直方图(如图).(1)求a 的值,并根据样本数据,试估计盒子中小球重量的众数与平均值;(2)从盒子中随机抽取3个小球,其中重量在内的小球个数为X ,求X 的分布列和数学期望.(以直方图中的频率作为概率)解 (1)由题意,得(0.02+0.032+a +0.018)×10=1,解得a =0.03.又由题图最高矩形中点的横坐标为20,可估计盒子中小球重量的众数约为20克. 50个样本小球重量的平均值为x =0.2×10+0.32×20+0.3×30+0.18×40=24.6(克).(2)利用样本估计总体,该盒子中小球重量在内的概率为0.2,则X ~B ⎝ ⎛⎭⎪⎫3,15. X 的所有可能取值为0,1,2,3.P (X =0)=C 03⎝ ⎛⎭⎪⎫150⎝ ⎛⎭⎪⎫453=64125, P (X =1)=C 13⎝ ⎛⎭⎪⎫15⎝ ⎛⎭⎪⎫452=48125, P (X =2)=C 23⎝ ⎛⎭⎪⎫152⎝ ⎛⎭⎪⎫45=12125, P (X =3)=C 33⎝ ⎛⎭⎪⎫153⎝ ⎛⎭⎪⎫450=1125. ∴X 的分布列为:∴E (X )=0×125+1×125+2×125+3×125=35⎝⎛⎭⎪⎫或E X=3×15=35.6.某超市从2014年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按,(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:假设甲、乙两种酸奶独立销售且日销售量相互独立.(1)写出频率分布直方图(甲)中a的值;记甲种酸奶与乙种酸奶日销售量(单位:箱)的方差分别为s21,s22,试比较s21与s22的大小;(只需写出结论)(2)以日销售量落入各组的频率作为概率,估计在未来的某一天里,甲、乙两种酸奶的日销售量恰有一个高于20箱且另一个不高于20箱的概率;(3)设X表示在未来3天内甲种酸奶的日销售量不高于20箱的天数,以日销售量落入各组的频率作为概率,求X的数学期望.解(1)根据频率分布直方图的性质,得(0.020+0.010+a+0.030+0.025)×10=1,解得a=0.015.根据频率分布直方图,估计s21>s22.(2)设事件A:在未来的某一天里,甲种酸奶的日销售量不高于20箱;事件B:在未来的某一天里,乙种酸奶的日销售量不高于20箱;事件C :在未来的某一天里,甲、乙两种酸奶的日销售量恰好一个高于20箱且另一个不高于20箱.则P (A )=0.20+0.10=0.3,P (B )=0.10+0.20=0.3. 所以P (C )=P (A -)P (B )+P (A )P (B -)=0.42. (3)由题意,可知X 的可能取值为0,1,2,3.P (X =0)=C 03×0.30×0.73=0.343, P (X =1)=C 13×0.31×0.72=0.441, P (X =2)=C 23×0.32×0.71=0.189, P (X =3)=C 33×0.33×0.70=0.027.所以X 的分布列为:所以X 0.9.。
2018高考理科概率与统计专题课件.doc

2017 高考理科专题概率与统计(解析)一、选择题1.5个车位分别停放了A, B,C, D, E,5 辆不同的车,现将所有车开出后再按A, B, C,D, E 的次序停入这 5 个车位,则在 A 车停入了 B 车原来的位置的条件下,停放结束后恰有1辆车停在原来位置上的概率是()A. 38B.340C.16D.1122.如图是八位同学400 米测试成绩的茎叶图(单位:秒),则()A. 平均数为64B. 众数为7C. 极差为17D. 中位数为64.53.五个人围坐在一张圆桌旁,每个人面前放着完全相同的硬币,所有人同时翻转自己的硬币. 若硬币正面朝上, 则这个人站起来; 若硬币正面朝下, 则这个人继续坐着. 那么, 没有相邻的两个人站起来的概率为()A.516B.1132C.1532D.124.5 名学生进行知识竞赛. 笔试结束后,甲、乙两名参赛者去询问成绩,回答者对甲说:“你们5 人的成绩互不相同,很遗憾,你的成绩不是最好的”;对乙说:“你不是最后一名”. 根据以上信息,这 5 人的笔试名次的所有可能的种数是()A. 54B. 72C. 78D. 965.已知5 件产品中有 2 件次品,现逐一检测,直至能.确.定.所有次品为止,记检测的次数为,则E ()A. 3B. 72C.185D. 46.将编号为1,2,3,4,5,6 的六个小球放入编号为1,2,3,4,5,6 的六个盒子,每个盒子放一个小球,若有且只有三个盒子的编号与放入的小球编号相同,则不同的放法总数是A. 40B. 60C. 80D. 1007.某厂家为了解广告宣传费与销售轿车台数之间的关系,得到如下统计数据表:根据数据表可得回归直线方程y?b?x a?,其中b? 2.4,a?y b?x,据此模型预测广告费用为9万元时,销售轿车台数为A. 17B. 18C. 19D. 20二、填空题8.有3 女2 男共5 名志愿者要全部分到 3 个社区去参加志愿服务,每个社区 1 到2 人,甲、乙两名女志愿者需到同一社区,男志愿者到不同社区,则不同的分法种数为__________.10.从1,2,3,4,5,6,7 这七个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是________.三、解答题11.一企业从某生产线上随机抽取100 件产品,测量这些产品的某项技术指标值x,得到的频率分布直方图如图.(1)估计该技术指标值x平均数x ;(2)在直方图的技术指标值分组中,以x落入各区间的频率作为x取该区间值的频率,若x x 4,则产品不合格,现该企业每天从该生产线上随机抽取5件产品检测,记不合格产品的个数为,求的数学期望 E .12.某保险公司针对企业职工推出一款意外险产品,每年每人只要交少量保费,发生意外后可一次性获赔50 万元. 保险公司把职工从事的所有岗位共分为 A 、B 、C 三类工种,根据历史数据统计出三类工种的每赔付频率如下表(并以此估计赔付概率).(Ⅰ)根据规定,该产品各工种保单的期望利润都不得超过保费的20%,试分别确定各类工种每张保单保费的上限;(Ⅱ)某企业共有职工20000 人,从事三类工种的人数分布比例如图,老板准备为全体职工每人购买一份此种保险,并以(Ⅰ)中计算的各类保险上限购买,试估计保险公司在这宗交易中的期望利润.13.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等极如下表:质量指标值m m185185m205m205等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品90%”的规定?(2)在样本中,按产品等极用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足X~N218,140,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?14.“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40 人(男、女各20 人),记录了他们某一天的走路步数,并将数据整理如下:(1)已知某人一天的走路步数超过8000 步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的 2 2 列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?22 n ad bc附:k,a b c d a c b d2P K k 0.10 0.05 0.025 0.010 0k 2.706 3.841 5.024 6.635(2)若小王以这40 位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选 2 人,其中每日走路不超过5000 步的有X 人,超过10000 步的有Y 人,设X Y ,求的分布列及数学期望.15.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:质量指标值m m185185m205m205等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(Ⅰ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(Ⅱ)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(Ⅲ)该企业为提高产品质量,开展了“质量提升月”活动,活动后在抽样检测,产品质量指标值X近似满足X N218,140,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?16.仪器经过检验合格才能出厂,初检合格率为34:若初检不合格,则需要进行调试,经调试后再次对其进行检验;若仍不合格,作为废品处理,再检合格率为45. 每台仪器各项费用如表:项目生产成本检验费/ 次调试费出厂价金额(元)1000 100 200 3000(Ⅰ)求每台仪器能出厂的概率;(Ⅱ)求生产一台仪器所获得的利润为1600 元的概率(注:利润出厂价生产成本检验费调试费);(Ⅲ)假设每台仪器是否合格相互独立,记X 为生产两台仪器所获得的利润,求X 的分布列和数学期望.实标准用17.随着社会发展,淮北市在一天的上下班时段也出现了堵车严重的现象。
最新-2018高考数学点 概率与统计 选择题专项 精品

【命中考心】2018高考数学必考点之概率与统计 选择题专项一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.要从已编号(1·50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( )A .5,10,15,20,25B .3,13,23,33,43C .1,2,3,4,5D .2,4,8,16,32【解析】B 根据系统抽样的规则,1到10一段,11到20一段,如此类推,那么每一段上都应该有号码.2. ①教育局督学组到学校检查工作,需在高三年级的学号为001·800的学生中抽调20人参加关于学校管理的综合座谈;②该校高三年级这800名学生期中考试的数学成绩有160在120分以上(包括120分),480人在120以下90分以上(包括90分),其余的在90分以下,现欲从中抽出20人研讨进一步改进数学教和学的座谈;③该校高三年级这800名学生参加2018年元旦聚会,要产生20名“幸运之星”. 以上三件事,合适的抽样方法依次为 ( )A .系统抽样,分层抽样,系统抽样B .系统抽样,系统抽样,简单随机抽样C .分层抽样,简单随机抽样,简单随机抽样D .系统抽样,分层抽样,简单随机抽样【解析】D 参加学校管理的综合座谈采用系统抽样较好,具有代表性;研究数学教与学的问题采用分层抽样较为合适,这样可以使研究更能反映不同层次的学生;“幸运之星”就不能在用系统抽样,那样就不具有“幸运”之意了,合适的抽样方法就是用简单随机抽样,以体现“幸运”之意.3.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本,有以下三种抽样方法:①采用随机抽样法,将零件编号为00,01,,99,抽签取出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组随机抽取1个;③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.则下述判断中正确的是 ( )A .不论采用何种抽样方法,这100个零件中每个被抽到的可能性均为51B .①、②两种抽样方法,这100个零件中每个被抽到的可能性均为51;③并非如此C .①、③两种抽样方法,这100个零件中每个被抽到的可能性均为51;②并非如此D .采用不同的抽样方法,这100个零件中每个被抽到的可能性是各不相同的【解析】A 三种抽样方法的特点就是保证了每个个体从总体中抽到的可能性都相同,保证了公平性。
(完整版)2018年高考统计与概率专题

2018年高考统计与概率专题(全国卷1文)2.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B(全国卷1理)2.如图,正方形ABCD 内的图形来自中国古代的太极图。
正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8C .12D .π4【考点】:几何概型【思路】:几何概型的面积问题,=P 基本事件所包含的面积总面积.【解析】:()21212=82r S P S r ππ==,故而选B 。
(全国卷2理)6.安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有( )A .12种B .18种C .24种D .36种(全国卷2文)6。
如图,网格纸上小正方形的边长为1,粗实线画出的是某几何体的三视图,该几何体由一平面将一圆柱截去一部分后所得,则该几何体的体积为 A.90πB 。
63πC 。
42π D.36π【答案】B【解析】由题意,该几何体是由高为6的圆柱截取一半后的图形加上高为4的圆柱,故其体积为2213634632V πππ=⋅⋅⋅+⋅⋅=,故选B 。
(天津卷)文(3)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫。
从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为(A)45(B)35(C)25(D)15(全国卷2文)11.从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C。
2018届高考数学第八章概率与统计67变量间的相关关系与统计案例试题理

考点测试67 变量间的相关关系与统计案例一、基础小题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ^=-2x +100 B.y ^=2x +100 C.y ^=-2x -100 D.y ^=2x -100答案 A解析 B 、D 为正相关,C 中y ^值恒为负,不符合题意. 2.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 答案 B解析 ∵a ^=y -b ^x =49+26+39+544-9.4×4+2+3+54=9.1,∴回归方程为y ^=9.4x +9.1.令x =6,得y ^=9.4×6+9.1=65.5(万元).3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.4.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1答案 D解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即y i =y ^i ,代入相关系数公式r =1-∑i =1ny i -y ^i2∑i =1ny i -y2=1.5. 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同答案 A解析因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误;D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误;根据线性回归直线一定经过样本点中心可知A正确.6.在一次对性别与说谎是否相关的调查中,得到如下数据:A.在此次调查中有95%的把握认为是否说谎与性别有关B.在此次调查中有99%的把握认为是否说谎与性别有关C.在此次调查中有99.5%的把握认为是否说谎与性别有关D.在此次调查中没有充分的证据显示说谎与性别有关答案 D解析由于K2=-213×17×14×16≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.7. 如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.答案D解析由散点图知呈带状区域时有较强的线性相关关系,故去掉D.8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:根据表中所给的数据,能否在犯错误的概率不超过0.15的前提下认为这两种手术对病人又发作过心脏病的影响有差别?________________________________________________________________________.答案 1.779 不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析根据列联表中的数据,可以求得K2=-268×324×196×196≈1.779,而K2<2.072,所以我们不能在犯错误的概率不超过0.15的前提下,作出这两种手术对病人又发作心脏病的影响有差别的结论.二、高考小题9.[2015·全国卷Ⅱ]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D解析由柱形图,知2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关,故D错误.10.[2015·福建高考]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y=b x+a,其中b=0.76,a=y-b x.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元 B.11.8万元C .12.0万元D .12.2万元 答案 B 解析 ∵x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=y -0.76x =8-0.76×10=0.4, ∴y ^=0.76x +0.4.当x =15时,y ^=0.76×15+0.4=11.8.11.[2014·江西高考]某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A .成绩B .视力C .智商D .阅读量 答案 D 解析 根据K 2=n ad -bc 2a +bc +d a +cb +d,代入题中数据计算得表1:K 2=-216×36×20×32≈0.009;表2:K 2=-216×36×20×32≈1.769; 表3:K 2=-216×36×20×32≈1.3;表4:K 2=-216×36×20×32≈23.48.∵D 选项K 2最大,∴阅读量与性别有关联的可能性最大,故选D. 12.[2014·湖北高考]根据如下样本数据得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0 D .a <0,b <0答案 B解析 把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图,由图可知b <0,a >0.故选B.13.[2014·重庆高考]已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本中心(3,3.5),代入验证得A 正确,B 错误.故选A.三、模拟小题14.[2017·大连双基测试]已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +2,则b ^的值为( )A .-12 B.12 C .-110 D.110答案 A解析 将x =3,y =5代入到y ^=b ^x +132中,得b ^=-12.故选A.15.[2016·兰州、张掖联考]对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( )A.116B.18C.14D.12 答案 B解析 依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ,解得a ^=18.16.[2016·漳州二模]下列说法错误的是( )A .在回归模型中,预报变量y 的值不能由解释变量x 唯一确定B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好 答案 B解析 对于A ,在回归模型中,预报变量y 的值由解释变量x 和随机误差e 共同确定,即x 只能解释部分y 的变化,∴A 正确;对于B ,线性回归分析中,相关系数r 的绝对值越接近1,两个变量的线性相关性越强,反之,线性相关性越弱,∴B 错误;对于C ,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C 正确;对于D ,在回归分析中,用相关指数R 2来刻画回归的效果时,R 2取值越大,说明模型拟合的效果越好,∴R 2为0.98的模型比R 2为0.80的模型拟合的效果好,D 正确.故选B.17.[2017·温州月考]为了检验某套眼保健操预防学生近视的作用,把500名做该套眼保健操的学生与另外500名未做该套眼保健操的学生的视力情况作记录并比较,提出假设H 0:“这套眼保健操不能起到预防近视的作用”,利用2×2列联表计算所得的K 2≈3.918.经查对临界值表知P (K 2≥3.841)≈0.05.对此,四名同学得出了以下结论:①有95%的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有95%的可能得近视;③这套眼保健操预防近视的有效率为95%;④这套眼保健操预防近视的有效率为5%.其中所有正确结论的序号是________. 答案 ①解析 根据查对临界值表知P (K 2≥3.841)≈0.05,故有95%的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;95%仅是指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.18.[2016·兰州一模]从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,计算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.已知家庭的月储蓄y 关于月收入x 的线性回归方程为y ^=b ^x +a ^,则变量x 与y ________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.答案 正相关 1.7解析 由题意,知n =10,x =110∑i =110x i =8,y =110∑i =110y i =2,∴b ^=184-10×8×2720-10×82=0.3,a ^=2-0.3×8=-0.4,∴y ^=0.3x -0.4,∵0.3>0,∴变量x 与y 正相关.当x =7时,y ^=0.3×7-0.4=1.7(千元).一、高考大题1.[2016·全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17, ∑7i =1y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 t i -ty i -y∑n i =1t i -t2∑ni =1y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑ni =1t i -ty i -y∑ni =1t i -t2,a ^=y -b ^t .解 (1)由折线图中数据和附注中参考数据得t =4,∑7i =1(t i -t )2=28, ∑7i =1y i -y 2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1t i -ty i -y∑7i =1t i -t2=2.8928≈0.103, a ^=y -b ^t =1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.2.[2015·全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i -uv i -v∑n i =1u i -u2,α^=v -β^u .解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2) 令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1w i -w y i -y ∑8i =1 w i -w 2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2),知当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6,年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果,知年利润z 的预报值 z ^=0.2×(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值,故年宣传费为46.24千元时,年利润的预报值最大. 二、模拟大题3.[2016·石家庄模拟]班主任对班级22名学生进行了作业量多少的调查,数据如下:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.(1)根据以上数据建立一个2×2列联表;(2)试问喜欢玩电脑游戏与认为作业多少是否有关系. 参考公式:K 2=n ad -bc 2a +b c +d a +cb +d,其中n =a +b +c +d .参考数据:解(2)K 2=-212×10×13×9≈6.418,∵3.841<6.418,∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.4.[2016·广东模拟]2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生育二胎政策的态度,某市选取70后和80后作为调查对象,随机调查了100位,得到数据如下表:70后公民中随机抽取3位,记其中生二胎的人数为X ,求随机变量X 的分布列和数学期望;(2)根据调查的数据,是否有90%以上的把握认为“生二胎与年龄有关”,并说明理由. 参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d参考数据:解 (1)由已知得70后“生二胎”的概率为3,并且X ~B ⎝ ⎛⎭⎪⎫3,23, 所以P (X =k )=C k 3⎝ ⎛⎭⎪⎫23k ⎝ ⎛⎭⎪⎫133-k(k =0,1,2,3),其分布列如下:所以E (X )=3×3=2.(2)K 2=n ad -bc 2a +bc +d a +cb +d=-275×25×45×55=10033≈3.030>2.706, 所以有90%以上的把握认为“生二胎与年龄有关”.5.[2017·成都诊断]PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?参考公式:b ^=∑i =1nx i -xy i -y∑i =1nx i -x2,a ^=y -b ^·x .解 (1)由条件可知x =15∑i =15x i =5405=108,y =15∑i =15y i =4205=84,∑i =15(x i -x )(y i -y )=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,∑i =15(x i -x )2=(-8)2+(-6)2+02+62+82=200,b ^=∑i =15x i -xy i -y∑i =15x i -x2=144200=0.72, a ^=y -b ^x =84-0.72×108=6.24,故y 关于x 的线性回归方程为y ^=0.72x +6.24. (2)当x =200时,y ^=0.72×200+6.24=150.24.所以可以预测此时PM2.5的浓度约为150.24微克/立方米.6.[2017·厦门质检]某单位共有10名员工,他们某年的收入如下表:(2)从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,求ξ的分布列和期望; (3)已知员工年薪与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元、4.2万元、5.6万元、7.2万元,预测该员工第五年的年薪为多少.附:线性回归方程y ^=b ^x +a ^中系数计算公式b ^=∑i =1nx i -xy i -y∑i =1nx i -x2,a ^=y -b^x ,其中x ,y 表示样本均值.解 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,所以从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,ξ的可能取值为0,1,2.P (ξ=0)=C 24C 210=215,P (ξ=1)=C 14C 16C 210=815,P (ξ=2)=C 26C 210=13,所以ξ的分布列为:E (ξ)=0×15+1×15+2×3=5.(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪,则x =2.5,y =5,∑i =14(x i -x )2=2.25+0.25+0.25+ 2.25=5,∑i =14(x i -x )(y i -y )=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,b ^=∑i =14x i -xy i -y∑i =14x i -x2=75=1.4, a ^=y -b ^x =5-1.4×2.5=1.5,所以线性回归方程为y ^=1.4x +1.5. 当x =5时,y ^=8.5.故可预测该员工第五年的年薪为8.5万元.。
山东省沂水县第一中学2018高考数学《统计概率》备考课件 (共21张PPT)

重视实际应用
全国I卷的概率统计问题一直对数学的 应用比较重视,并且考查的形式比较灵活, 不是一成不变的,对考生的数学阅读和建 模能力要求较高。就是解答题的阅读量较 大,语言比较难以理解,数量关系太多, 这些造成了很多考生理解问题的障碍,使 用了错误的模型解答问题。
山东卷:情景固定、解法固定、难度固定,解答题定位与 互斥事件独立事件(分类),离散型随机变量分布列与期 望 ,第一问概率第二问分布 ,太有规律(机械)。 新课标:情景不固定、解法不固定、和现实生活联系密切, 几乎每年的题都有图(表),主要考查数据的获取、分析 和应用,山东考生会极不适应,定位于随机抽样、回归直 线、独立检验、二项分布、正态分布、茎叶图、散点图、 柱状图、直方图、几何概型、列联表、频数表、均值与方 差等,统计的内容占比大,题目涵盖内容广,和函数(实 际、应用、社会、生活)结合多而变化大。把所有得高考 题练一遍。很少发现模拟题中有和真题有点相近的题。
x 哪一个适宜作为年销售量 y 关于年宣传费 x 的
回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立 y 关于 x 的回归方程; (Ⅲ)以知这种产品的年利率 z 与 x、y 的关系为 z=0.2y-x。根据(Ⅱ)的结果 回答下列问题: (i) 年宣传费 x=49 时,年销售量及年利润的预报值是多少? (ii) 年宣传费 x 为何值时,年利率的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…….. (un vn),其回归线 v= u
近五年考情
解答题
年 13年 14年 15年 16年 17年
19.概率及数 18.正态分布 19.回归直线 19.概率分 理科 学期望 与期望 方程 布列均值
2018全国高考数学统计与概率专题(附答案解析)

2018全国高考真题数学统计与概率专题(附答案解析)1.(全国卷I,文数、理数第3题.5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A2.(全国卷I,文数19题.12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数 1 3 2 4 9 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案解析】解:(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=. 3.(全国卷I ,理数20题12分)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为()01p p <<,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为()f p ,求()f p 的最大值点0p ; (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-.因此 2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =.当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数,依题意知(180,0.1)YB ,=+.X Y=⨯+,即402520225X Y所以(4025)4025490=+=+=.EX E Y EY(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于400EX>,故应该对余下的产品作检验.4.(全国卷Ⅱ,文数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5C.0.4D.0.3【答案】D5.(全国卷Ⅱ,文数、理数18题.12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5y t=-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案解析】解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.6.(全国卷Ⅱ,理数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5 C.0.4 D.0.3【答案】A7.(全国卷Ⅲ,文数5题.5分)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A.0.3 B.0.4 C.0.6 D.0.7【答案】B8.(全国卷Ⅲ,文数、理数18题.12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()0.0500.0100.0013.8416.63510.828P K kk≥.【答案解析】解:(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.学科%网以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:超过m 不超过m第一种生产方式 15 5 第二种生产方式515(3)由于2240(151555)10 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.(北京卷,文数17题,13分)电影公司随机收集了电影的有关数据,经分类整理得到下表: 电影类型 第一类 第二类 第三类 第四类 第五类 第六类 电影部数 140 50 300 200 800 510 好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;学科*网(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案解析】(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000. 第四类电影中获得好评的电影部数是200×0.25=50, 故所求概率为500.0252000=. (Ⅱ)方法一:由题意知,样本中获得好评的电影部数是 140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51=372.故所求概率估计为37210.8142000-=. 方法二:设“随机选取1部电影,这部电影没有获得好评”为事件B .没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(0P B ==. (Ⅲ)增加第五类电影的好评率, 减少第二类电影的好评率. 10.(北京卷,理数17题,12分)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.【答案解析】解:(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (Ⅱ)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB )=P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (Ⅲ)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ. 11.(天津卷,文数,15题,13分)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A ,B ,C ,D ,E ,F ,G 表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i )试用所给字母列举出所有可能的抽取结果;(ii )设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率.【答案解析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识.考查运用概率知识解决简单实际问题的能力.满分13分. (Ⅰ)解:由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(Ⅱ)(i )解:从抽出的7名同学中随机抽取2名同学的所有可能结果为{A ,B },{A ,C },{A ,D },{A ,E },{A ,F },{A ,G },{B ,C },{B ,D },{B ,E },{B ,F },{B ,G },{C ,D },{C ,E },{C ,F },{C ,G },{D ,E },{D ,F },{D ,G },{E ,F },{E ,G },{F ,G },共21种.(ii )解:由(Ⅰ),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A ,B },{A ,C },{B ,C },{D ,E },{F ,G },共5种. 所以,事件M 发生的概率为P (M )=521. 12.(天津卷,理数,16题,13分)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16. 现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I )应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【答案解析】本小题主要考查随机抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.学.科网(Ⅰ)解:由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.(Ⅱ)(i)解:随机变量X的所有可能取值为0,1,2,3.P(X=k)=34337C CCk k-⋅(k=0,1,2,3).所以,随机变量X的分布列为随机变量X的数学期望11218412 ()0123353535357E X=⨯+⨯+⨯+⨯=.(ii)解:设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(i)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=67.所以,事件A发生的概率为67.13.(江苏卷,3题,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为__________.【答案解析】答案:90解析:8989909191905++++=14.(浙江卷,7题,4分)设0<p<1,随机变量ξ的分布列是ξ0 1 2P12p-122p 则当p在(0,1)内增大时,A.D(ξ)减小B.D(ξ)增大C.D(ξ)先减小后增大D.D(ξ)先增大后减小【答案】D第11 页共11 页。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解析
由抽样方法的性质知抽样过程中每个个体被抽
到的概率都相等,这个比例只与样本容量和总体有关.
8.某高中在校学生 2000 人,高一年级与高二年级人数 相同并都比高三年级多 1 人.为了响应“阳光体育运动”号 召,学校举行了“元旦”跑步和登山比赛活动.每人都参加 而且只参加了其中一项比赛,各年级参加比赛人数情况如下 表: 高一年级 高二年级 高三年级 跑步 登山 a x b y c z
n=12 或 n=18;当样本容量为 n+1 时,需要剔除 1 个个 35 体,此时总体容量为 35,系统抽样的抽样间距为 ,因 n+ 1 35 为 必须是整数,所以 n 只能取 6,即样本容量 n=6.故 n+ 1 选 C.
10.某城区有农民、工人、知识分子家庭共计 2000 户, 其中农民 1800 户,工人 100 户,现从中抽取一个容量为 40 的样本来调查家庭收入情况, 以下给出了几种常见的抽样方 法:①简单随机抽样;②系统抽样;③分层抽样.则在整个
其中 a∶b∶c=2∶3∶5, 全校参加登山的人数占总人数 2 的 5 . 为了了解学生对本次活动的满意程度,从中抽取一个 200 人的样本进行调查,则在高二年级参加跑步的学生中应 抽取( ) B.60 人 C.24 人 D.30 人 A.36 人
解析
设高三年级的人数为 m,则高一年级与高二年
级的人数都为 m+1,则 2(m+1)+m=2000,解得 m=666. 2 因为全校参加登山的人数占总人数的5,则全校参加跑步的 3 3 人数占总人数的5, 即 2000×5=1200(人). 高二年级参加跑 3 步的学生人数为 1200× =360,从中抽取一个 200 2+3+5 人的样本,则在高二年级参加跑步的学生中应抽取 200 360×2000=36(人).故选 A.
M 到的概率都等于 N .
5.某商场有四类食品,食品类别和种数见下表,现从 中抽取一个容量为 20 的样本进行食品安全检测,若采用分 层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种 数之和是( ) 类 粮食 植物 别 种 数 A.7 B .6 类 40 C. 5 油类 10 D.4 动物性 果蔬 食品类 30 类 20
A.不论采取哪种抽样方法,这 100 个零件中每个被抽 1 到的概率都是5 B.①②两种抽样方法,这 100 个零件中每个被抽到的 1 概率都是5,③并非如此 C.①③两种抽样方法,这 100 个零件中每个被抽到的 1 概率都是5,②并非如此 D.采用不同的抽样方法,这 100 个零件中每个被抽到 的概率各不相同
第一部分
考点通关练
第八章 概率与统计
考点测试65 随机抽样
第1步 狂刷小题· 练基础
一、基础小题 1.某学校为了了解高中一年级、二年级、三年级这三 个年级之间的学生视力是否存在显著差异,拟从这三个年级 中按人数比例抽取部分学生进行调查,则最合理的抽样方法 是( ) A.抽签法 C.分层抽样法 B.系统抽样法 D.随机数法
解析
要了解高中一、二、三年级之间的学生视力是
否存在显著差异,且按人数比例从这三个年级中抽取样本, 分层抽样法最具代表性,最合理,选 C.
2.为了解 1200 名同学对学校某项教改试验的意见,打 算从中抽取一个容量为 40 的样本,考虑用系统抽样,则分 段的间隔 k 为( A.40 C.30 ) B.20 D.15
解析
1200 系统抽样中抽取个体间隔 k= 40 =30.
3.某市有高中生 30000 人,其中女生 4000 人.为调查 学生的学习情况,采用分层抽样的方法抽取一个容量为 150 的样本,则样本中女生的数量为( A.30 B.25 C.20 D.15 )
解析 20.故选 C.
150 x 设样本中女生的数量为 x,则30000=4000⇒x=
4.从 2007 名学生中选取 50 名学生参加全国数学联赛, 若采用下面的方法选取: 先用简单随机抽样法从 2007 人中剔除 7 人, 剩下的 2000 人再按系统抽样的方法抽取,则每人入选的概率( A.不全相等 B.均不相等 )
50 1 C.都相等,且为2007 D.都相等,且为40 解析 从 N 个个体中抽取 M 个个体,则每个个体被抽
解析
20 1 由已知可得抽样比为 = ,∴抽 40+10+30+20 5
1 取植物油类与果蔬类食品种数之和为(10+20)×5=6, 故选 B.
6. 总体由编号为 01,02, „, 19,20 的 20 个个体组成. 利 用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字, 则选出来的第 5 个个体的编号为( )
A.08
B.07
C.02
D.01
解析
从随机数表第 1 行的第 5 列和第 6 列数字开
始由左到右依次选取两个数字,则选出的数字为 08,02,14,07,01,„,故选出的第 5 个个体的编号为 01.
7.在 100 个零件中,有一级品 20 个,二级品 30 个, 三级品 50 个,从中抽取 20 个作为样本: ①采用随机抽样法,将零件编号为 00,01,02,„,99, 抽出 20 个; ②采用系统抽样法,将所有零件分成 20 组,每组 5 个, 然后每组中随机抽取 1 个; ③采用分层抽样法,随机从一级品中抽取 4 个,二级品 中抽取 6 个,三级品中抽取 10 个.则( )
解析
总体容量 由题意可知系统抽样的抽样间距为 n ,分层抽样的抽样比 n n 是36, 则采用分层抽样法抽取的乒乓球运动员人数为 6×36 n n n = 6 ,篮球运动员人数为 12× 36 = 3 ,足球运动员人数为 n n 18×36=2,可知 n 应是 6 的倍数,36 的约数,故 n=6 或
9.某班运动队由足球运动员 18 人、篮球运动员 12 人、 乒乓球运动员 6 人组成(每人只参加一项),现从这些运动员 中抽取一个容量为 n 的样本, 若分别采用系统抽样法和分层 抽样法,则都不用剔除个体;当样本容量为 n+1 时,若采 用系统抽样法,则需要剔除 1 个个体,那么样本容量 n= ( ) A.18 B.7 C.6 D.12