统计、统计案例【解析版】
统计案例(精讲)(提升版)(原卷版)

8.5 统计案例(精讲)(提升版)思维导图考点一独立性检验【例1】(2022·吉林·梅河口市第五中学高三开学考试)某中学准备组建“文科”兴趣特长社团,由课外活动小组对高一学生进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了100名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科方向”学生,低于60分的称为“理科方向”学生.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99.5%的把握认为“文科方向”与性别有关?理科方向文科方向总计男40女45考点呈现例题剖析总计 1001人,共抽取4次,记被抽取的4人中“文科方向”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列和数学期望.参考公式:()()()()22()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.参考临界值:()2P k αχ=0.10 0.05 0.025 0.010 0.005 0.001k2.7063.841 5.024 6.635 7.879 10.828【一隅三反】1.(2022·白山模拟)十三届全国人大四次会议表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能、特种应用及第三代半导体等离子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产,在试产初期,生产一件该款芯片有三道工序,每道工序的生产互不影响,这三道工序的次品率分别为118,119,120.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.0500.0100.0050.001 k 3.841 6.6357.87910.828(①P①100X(2)某手机生产厂商将该款芯片投入到某新款手机上使用,并对部分芯片做了技术改良,推出了两种型号的手机,甲型号手机采用没有改良的芯片,乙型号手机采用改良了的芯片,现对使用这两种型号的手机用户进行回访,就他们对开机速度进行满意度调查.据统计,回访的100名用户中,使用甲型号手机的有30人,其中对开机速度满意的有15人;使用乙型号手机的有70人,其中对开机速度满意的有55人.完成下列22⨯列联表,并判断是否有99.5%的把握认为该项技术改良与用户对开机速度的满意度有关.甲型号乙型号合计满意不满意合计2.(2022·陕西咸阳·三模(理))2022年北京冬奥组委发布的《北京2022年冬奥会和冬残奥会经济遗产报告(2022)》显示,北京冬奥会已签约45家赞助企业,冬奥会赞助成为一项跨度时间较长的营销方式.为了解该45家赞助企业每天销售额与每天线上销售时间之间的相关关系,某平台对45家赞助企业进行跟踪调查,其中每天线上销售时间不少于8小时的企业有20家,余下的企业中,每天的销售额不足30万元的企业占35,统计后得到如下22⨯列联表:销售额不少于30万元销售额不足30万元合计线上销售时间不少于8小时 17 20 线上销售时间不足8小时合计45售时间有关?(2)按销售额在上述赞助企业中采用分层抽样方法抽取5家企业.在销售额不足30万元的企业中抽取时,记“抽到线上销售时间不少于8小时的企业数”为X ,求X 的分布列和数学期望. 附: ()20P K k ≥0.050 0.010 0.001 0k3.841 6.635 10.828参考公式:()()()()2 n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.考点二 线性回归方程【例2-1】(2022·齐齐哈尔模拟)某单位为了解夏季用电量与月份的关系,对本单位2021年5月份到8月份的日平均用电量y (单位:千度)进行了统计分析,得出下表数据:月份(x )5 6 7 8 日平均用电量(y )1.93.4t7.11.7877ˆ.0y x =-t 的值为( )A .5.8B .5.6C .5.4D .5.2【例2-2】(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iii ii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X ,求随机变量X 的分布列和数学期望.(视频率为相应事件发生的概率)【一隅三反】1.(2022·安徽三模)对某位同学5次体育测试的成绩(单位:分)进行统计得到如下表格:第x 次 1 2 3 4 5 测试成绩y3940484850根据上表,可得关于的线性回归方程为ˆ3ˆy x a =+,下列结论不正确的是( )A .ˆ36a= B .这5次测试成绩的方差为20.8 C .y 与x 的线性相关系数0r < D .预测第6次体育测试的成绩约为542.(2022·安徽模拟)新冠疫情期间,口罩的消耗量日益增加,某药店出于口罩进货量的考虑,连续9天统计了第i (i 1239)x =,,,,天的口罩的销售量i y (百件),得到的数据如下:99i i i=1i=145171x y ==∑∑,,()99922ii i i i=1i=1i=1312528510953x x y y y ==-=∑∑∑,,. 参考公式:相关系数()()()()iii=122iii=1i=1nnnx x y y r x x y y --=--∑∑∑数据()i i ()i 123x y n =,,,,,,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计分别为()()()iii i1222i i11ˆˆˆnn i inni i x x y y x y nxybay bx x x xnx ===---===---∑∑∑∑, (1)若用线性回归模型ˆˆˆybx a =+拟合y 与x 之间的关系,求该回归直线的方程; (2)统计学家甲认为用(1)中的线性回归模型(下面简称模型1)进行拟合,不够精确,于是尝试使用非线性模型(下面简称模型2)得到i x 与i y 之间的关系,且模型2的相关系数20989r =.,试通过计算说明模型1,2中,哪一个模型的拟合效果更好. 3.(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iiiii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X,求随机变量X的分布列和数学期望.(视频率为相应事件发生的概率)考点三非线性回归方程【例3】(2022·福建·三明一中模拟预测)当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近5年区块链企业总数量相关数据,如下表年份20172018201920202021编号x12345企业总数量y(单位:千个) 2.156 3.7278.30524.27936.224(1)根据表中数据判断,y a bx=+与e dxy c=(其中 2.71828e=…为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由),并根据你的判断结果求y关于x的回归方程;(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;①每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;①在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“优胜公司”的概率.参考数据:5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =). 附:样本(),(1,2,,)i i x y i n =的最小二乘法估计公式为1221ˆni ii nii x y nx ybxnx==-=-∑∑,ˆa y bx=-.【一隅三反】1.(2022·山西二模)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.年份代码x 1 2 3 4 5 市场规模y3.984.565.045.866.36参考数据: 5.16y =, 1.68v =,145.10i ii v y==∑,其中i i v x =.参考公式:对于一组数据()11v y ,,()22v y ,,…,()n n v y ,,其回归直线ˆˆˆybv a =+的斜率和截距的最小二乘估计公式分别为1221ˆni ii ni i v y nvybv nv ==-=-∑∑,ˆˆay bv =-. (1)由上表数据可知,可用函数模型ˆˆyx a =拟合y 与x 的关系,请建立y 关于x 的回归方程(ˆa ,ˆb 的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p ,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X ,若()()34P X P X ===,求X 的分布列与期望.2.(2022·广东广州·一模)人们用大数据来描述和定义信息时代产生的海量数据,并利用这些数据处理事务和做出决策,某公司通过大数据收集到该公司销售的某电子产品1月至5月的销售量如下表. 月份x1 2 3 4 5 销售量y (万件)4.95.86.88.310.2该公司为了预测未来几个月的销售量,建立了y 关于x 的回归模型:ˆv . (1)根据所给数据与回归模型,求y 关于x 的回归方程(ˆu 的值精确到0.1);(2)已知该公司的月利润z (单位:万元)与x ,y 的关系为z x x=,根据(1)的结果,问该公司哪一个月的月利润预报值最大? 参考公式:对于一组数据()()()1122,,,,,,n n x y x y x y ,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-.11 / 113.(2022·广东肇庆·二模)下表是我国从2016年到2020年能源消费总量近似值y (单位:千万吨标准煤)的数据表格: 年份2016 2017 2018 2019 2020 年份代号x1 2 3 4 5 能源消费总量近似值y (单位:千万吨标准煤) 442 456 472 488 498以x 为解释变量,y 为预报变量,若以11为回归方程,则相关指数210.9946R ≈,若以22ˆln ya b x =+为回归方程,则相关指数220.9568R ≈. (1)判断11ˆyb x a =+与22ˆln y a b x =+哪一个更适宜作为能源消费总量近似值y 关于年份代号x 的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y 关于年份代号x 的回归方程.参考数据:512356i i y ==∑,517212i i i x y ==∑.参考公式:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn ni i i ii i n n ii i i x x y y x y nxy b x x x nx ====---==--∑∑∑∑,ˆˆa y bx =-.。
2021届全国高考数学一轮复习知识巩固AB卷:专题13 统计、统计案例与概率(A卷)(含解析)

2021年全国高考数学一轮复习知识巩固AB卷(理科)专题13 统计、统计案例与概率(A卷)第Ⅰ卷一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.2019年夏季来临,某品牌饮料举行夏季促销活动,瓶盖内部分别印有标识“谢谢惠顾”、A B C标识的饮料数量之比标识B“再来一瓶”以及标识C“品牌纪念币一枚”,每箱中印有,,为3:1:2,若顾客购买了一箱(12瓶)该品牌饮料,则兑换“品牌纪念币”的数量为()A.2 B.4 C.6 D.82.一般来说,一个班级的学生学号是从1开始的连续正整数,在一次课上,老师随机叫起班上8名学生,记录下他们的学号是:3、21、17、19、36、8、32、24,则该班学生总数最可能为()A.39人B.49人C.59人D.超过59人3.某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编 从中抽取60个样本,如下提供随机数表的第4行到第6行:号分别为001,002,,599,60032 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号()A.522B.324C.535D.5784.新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到如下图表:针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是( ) A .获得A 等级的人数减少了 B .获得B 等级的人数增加了1.5倍 C .获得D 等级的人数减少了一半D .获得E 等级的人数相同5.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =<B .270,75x s =>C .270,75x s ><D .270,75x s <>6.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[)50,60的同学有30人,则n 的值为( )A .100B .1000C .90D .9007.某公司新发明了甲、乙两种不同型号的手机,公司统计了消费者对这两种型号手机的评分情况,作出如下的雷达图,则下列说法不正确的是( )A .甲型号手机在外观方面比较好B .甲、乙两型号的系统评分相同C .甲型号手机在性能方面比较好D .乙型号手机在拍照方面比较好8.某企业的一种商品的产量与单位成本数据如下表:产量x (万件) 14 16 182022单位成本y (元/件)12107a3若根据表中提供的数据,求出y 关于x 的线性回归方程为ˆ 1.1528.1yx =-+,则a 的值等于( ) A .4.5 B .5C .5.5D .69.相关变量的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,根据剩下数据得到线性回归直线方程,相关系数为.则( )A .B .C .D .10.为了判断高中生选修理科是否与性别有关.现随机抽取50名学生,得到如下列联表:根据表中数据,得到的观测值()22501320107 4.84423272030K ⨯⨯-⨯=≈⨯⨯⨯,若已知,,则认为选修理科与性别有关系出错的可能性约为( ) A .B .C .D .11.甲、乙两人各写一张贺年卡随意送给丙、丁两人中的一人,则甲、乙将贺年卡都送给丁的概率为( ) A .12B .13C .14D .1512.函数()()22846f x x x x =-++-≤≤,在其定义域内任取一点0x ,使()00f x ≥的概率是( ) A .310B .23C .35D .45第Ⅱ卷二、填空题:本大题共4小题,每小题5分. 13.某公司对2019年14月份的获利情况进行了数据统计,如下表所示:月份x 123 4利润y /万元5 6 6.58利用线性回归分析思想,预测出2019年8月份的利润为11.6万元,则y 关于x 的线性回归方程为__________.14.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过______(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”. 参考公式:()()()()()22n ad bc K a b c d a c b d -=++++15.从集合中随机选取一个数记为,从集合中随机选取一个数记为,则直线不经过第三象限的概率为_____.16.如图,在边长为2的正方形中,以的中点为圆心,以为半径作圆弧,交边于点,从正方形中任取一点,则该点落在扇形中的概率为_____.三、解答题:本大题共6个大题,共70分,解答应写出文字说明、证明过程或演算步骤.17.(10分)本市摄影协会准备在2019年10月举办主题为“庆祖国70华诞——我们都是追梦人”摄影图片展.通过平常人的镜头记录国强民富的幸福生活,向祖国母亲的生日献礼.摄影协会收到了来自社会各界的大量作品,打算从众多照片中选取100张照片展出,其参赛者年龄集中在[25,85]之间,根据统计结果,做出频率分布直方图如图:(1)根据频率分布直方图,求这100位摄影者年龄的样本平均数x和中位数m(同一组数据用该区间的中点值作代表);(2)为了展示不同年龄作者眼中的祖国形象,摄影协会按照分层抽样的方法,计划从这100件照片中评出20个最佳作品,并邀请作者参加“讲述照片背后的故事”座谈会.①在答题卡上的统计表中填出每组应抽取的人数;年龄[25,35)[35,45)[45,55)[55,65)[65,75)[75,85]人数②若从较年轻的前三组作者中选出2人把这些图片和故事整理成册,求这2人至少有一人的年龄在[35,45)的概率.18.(12分)国家学生体质健康测试专家组到某学校进行测试抽查,在高三年级随机抽取100名男生参加实心球投掷测试,测得实心球投掷距离(均在5至15米之内)的频数分布表如下(单位:米):规定:实心球投掷距离在[)9,13之内时,测试成绩为“良好”,以各组数据的中间值代表这组数据的平均值ξ,将频率视为概率.(1)求ξ,并估算该校高三年级男生实心球投掷测试成绩为“良好”的百分比;(2)现在从实心球投掷距离在[)5,7,[)13,15之内的男生中用分层抽样的方法抽取5人,再从这5人中随机抽取3人参加提高体能的训练,求:在被抽取的3人中恰有两人的实心球投掷距离在[)5,7内的概率.19.(12分)已知某商品每件的生产成本x (元)与销售价格y (元)具有线性相关关系,对应数据如表所示:(1)求出y 关于x 的线性回归方程y bx a =+;(2)若该商品的月销售量z (千件)与生产成本x (元)的关系为221z x =-+,[2,10]x ∈, 根据(1)中求出的线性回归方程,预测当x 为何值时,该商品的月销售额最大.附:121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.20.(12分)随着教育信息化2.0时代的到来,依托网络进行线上培训越来越便捷,逐步成为实现全民终身学习的重要支撑.最近某高校继续教育学院采用线上和线下相结合的方式开展了一次300名学员参加的“国学经典诵读”专题培训.为了解参训学员对于线上培训、线下培训的满意程度,学院随机选取了50名学员,将他们分成两组,每组25人,分别对线上、线下两种培训进行满意度测评,根据学员的评分(满分100分)绘制了如下茎叶图:(1)根据茎叶图判断学员对于线上、线下哪种培训的满意度更高?并说明理由;(2)求50名学员满意度评分的中位数m,并将评分不超过m、超过m分别视为“基本满意”、“非常满意”两个等级.①利用样本估计总体的思想,估算本次培训共有多少学员对线上培训非常满意?②根据茎叶图填写下面的列联表:并根据列联表判断能否有99.5%的把握认为学员对两种培训方式的满意度有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,()20.0100.0050.0016.6357.87910.828P K kk≥.21.(12分)在边长为1的正六边形ABCDEF中,其中心为点O.(1)在正六边形ABCDEF的边上任取一点P,求满足OP在OE上的投影大于12的概率;(2)从A,B,C,D,E,F这六个点中随机选取两个点,记这两个点之间的距离为x,求x大于等于3的概率.22.(12分)某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y(万人)与年份x的数据:第x年 1 2 3 4 5 6 7 8 9 10 旅游人数y(万人)300 283 321 345 372 435 486 527 622 800该景点为了预测2021年的旅游人数,建立了y与x的两个回归模型:模型①:由最小二乘法公式求得y 与x 的线性回归方程50.8169.7y x =+;模型②:由散点图的样本点分布,可以认为样本点集中在曲线bxy ae =的附近.(1)根据表中数据,求模型②的回归方程bx y ae =.(a 精确到个位,b 精确到0.01). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).回归方程①50.8169.7y x =+②bx y ae =1021()iii y y =-∑ 30407 14607参考公式、参考数据及说明: ①对于一组数据()()()1122,,,,,,n n v w v w v w ,其回归直线w v αβ=+的斜率和截距的最小二乘法估计分别为121()(),()niii nii w w v v w v v v βαβ==--==--∑∑.②刻画回归效果的相关指数22121()1()nii i n ii yy R yy ==-=--∑∑.③参考数据: 5.46235e ≈, 1.43 4.2e ≈.x y u1021()ii xx =-∑()()101iii x x y y =--∑ ()()101iii x x uu =--∑表中1011ln ,10i i i i u y u u ===∑.专题13 统计、统计案例与概率 答 案+解 析第Ⅰ卷一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的. 1.【答案】B【解析】根据题意,“品牌纪念币一枚”的瓶数占全部瓶数的三分之一,即11243⨯=. 2.【答案】A【解析】因为随机抽样中,每个个体被抽到的机会都是均等的,所以110,1120,2130,3140,…,每组抽取的人数,理论上应均等;又所抽取的学生的学号按从小到大顺序排列为3、8、17、19、21、24、32、36,恰好使110,1120,2130,3140四组中各有两个,因此该班学生总数应为40左右,故选A . 3.【答案】D【解析】第6行第6列的数开始的数为808,不合适,436,789不合适,535,577,348,994不合适,837不合适,522,535重复不合适,578合适,则满足条件的6个编号为436,535,577,348,522,578, 则第6个编号为578,故选D . 4.【答案】B【解析】设2016年参加考试x 人,则2018年参加考试2x 人,根据图表得出两年各个等级的人数如下图所示:由图可知A ,C ,D 选项错误,B 选项正确,故本小题选B . 5.【答案】A【解析】由题意,根据品滚石的计算公式,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则()()()()()2222212481757070706070907050x x x ⎡⎤=-+-++-+-+-⎣⎦()()()2221248170707050050x x x ⎡⎤=-+-++-+⎣⎦, ()()()()()222222124817070708070707050s x x x ⎡⎤=-+-++-+-+-⎣⎦ ()()()222124817070701007550x x x ⎡⎤=-+-++-+<⎣⎦, 故275s <.故选A . 6.【答案】A【解析】由频率分布直方图可知,支出在[)50,60的同学的频率为0.03100.3⨯=,301000.3n ∴==,本题正确选项A . 7.【答案】C【解析】从图中可得:甲型号手机在外观方面评分为90,乙型号手机在外观方面评分为85, 故A 正确;甲型号手机在系统方面评分为95,乙型号手机在系统方面评分也为95,故B 正确; 甲型号手机在性能方面评分为85,乙型号手机在外观方面评分为90,故C 错误; 甲型号手机在拍照方面评分为85,乙型号手机在拍照方面评分为90,故D 正确; 故选C . 8.【答案】B 【解析】1416182022901855x,1210733255a ay , x y ,在线性回归方程ˆ 1.1528.1yx =-+上, 1.151828.17.4y ,则32=7.45a,解得5a =,故选B . 9.【答案】D【解析】由散点图得负相关,所以,因为剔除点后,剩下点数据更具有线性相关性,更接近,所以.故选D .10.【答案】B【解析】由观测值,对照临界值得4.844>3.841,由于P (X 2≥3.841)≈0.05,∴认为选修理科与性别有关系出错的可能性为5%.故选B . 11.【答案】C【解析】(甲送给丙、乙送给丁)、(甲送给丁,乙送给丙)、(甲、乙都送给丙)、(甲、乙都送给丁)共四种情况,其中甲、乙将贺年卡送给同一人的情况有两种,所以甲、乙将贺年卡送给同一人丁的情况一种, 概率是14,故选C . 12.【答案】C【解析】由题意,知()00f x ≥,即200280x x -++≥,解得{}0024x x -≤≤,所以由长度的几何概型可得概率为4(2)36(4)5P --==--,故选C .第Ⅱ卷二、填空题:本大题共4小题,每小题5分.13.【答案】ˆ0.954yx =+ 【解析】设线性回归方程为ˆˆˆybx a =+,因为52x =,518y =, 由题意可得551ˆ288ˆ11.6ˆˆb a b a⎧+=⎪⎨⎪+=⎩,解得ˆ0.95b =,ˆ4a =,即ˆ0.954y x =+,故答案为ˆ0.954yx =+. 14.【答案】5%【解析】由题意,计算观测值()2210010302040 4.762 3.84150503070K ⨯⨯-⨯==>⨯⨯⨯,参照附表,可得:在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”. 故答案为5%.15.【答案】29【解析】试验发生包含的事件(k ,b )的取值所有可能的结果有:(﹣1,﹣2);(﹣1,1);(﹣1,2);(1,﹣2);(1,1);(1,2);(2,﹣2);(2,1);(2,2)共9种结果.而当00k b <>⎧⎨⎩时,直线不经过第三象限,符合条件的(k ,b )有2种结果,∴直线不过第三象限的概率29P =,故答案为29.16.【答案】π8【解析】如图,正方形面积,因为,故,所以π4AOM ∠=, 同理π4NOB ∠=,所以π2MON ∠=, 又,∴()212222ππMONS =⨯⨯=扇形. ∴从正方形中任取一点,则该点落在扇形中的概率为8ππ24P ==.故答案为π8.三、解答题:本大题共6个大题,共70分,解答应写出文字说明、证明过程或演算步骤.17.【答案】(1)平均数60,中位数4557;(2)①详见解析,②35. 【解析】(1)在频率分布直方图中,这100位参赛者年龄的样本平均数300.05400.1500.15x =⨯+⨯+⨯600.35700.2800.1560+⨯+⨯+⨯=.设中位数为m ,由0.050.10.15(55)0.350.5m +++-⨯=,解得4557m =(或答55.57). (2)①每组应各抽取人数如下表:②根据分层抽样的原理,年龄在前三组内分别有1人、2人、3人,设在第一组的是a ,在第二组的是1b ,2b ,在第三组的是1c ,2c ,3c ,列举选出2人的所有可能如下:1(,)a b ,2(,)a b ,1(,)a c ,2(,)a c ,3(,)a c ,12()b b ,,11(,)b c ,12(,)b c ,13(,)b c ,21(,)b c ,22(,)b c ,23(,)b c ,12(,)c c ,13(,)c c ,23(,)c c ,共15种情况.设“这2人至少有一人的年龄在区间[35,45]”为事件A , 则93()155P A ==. 18.【答案】(1)平均值9.77ξ=,百分比62%;(2)0.6. 【解析】(1)根据平均值的定义得92340226681012149.77100100100100100ξ=⨯+⨯+⨯+⨯+⨯=, 因为实心球投掷距离在[)9,13之内时,测试成绩为“良好”,所以40220.6262%100+==. (2)实心球投掷距离在[)5,7,[)13,15之内的男生分别有9,6人,用分层抽样的方法抽取5人,则分别抽取3,2人.从这5人中随机抽取3人参加提高体能的训练的总数为35C 10=,在被抽取的3人中恰有两人的实心球投掷距离在[)5,7的总数为2132C C 6=, 所以在被抽取的3人中恰有两人的实心球投掷距离在[)5,7内的概率为60.610p ==. 19.【答案】(1)ˆ46y x =-;(2)预计当6x =时,该商品的销售额最大为162元.【解析】(1)根据题意,5678 6.54x +++==,15172127204y +++==,41515617721827540i ix y=⨯+⨯+⨯+⨯=∑,42222215678174i x =+++=∑,所以414222145404 6.52041744 6.54i ii x y x yb x x--⨯⨯===-⨯-∑∑,所以204 6.56a y bx =-=-⨯=-, 所以y 关于x 的线性回归方程ˆ46yx =-. (2)依题意,销售额2()(221)(46)896126([2,10])f x x x x x x =-+-=-+-∈. 其对称轴为9662(8)x =-=⨯-,又因为()f x 为开口向下的抛物线,故当6x =时()f x 最大, 最大值()836966126162f x =-⨯+⨯-=. 答:预计当6x =时,该商品的销售额最大为162元.20.【答案】(1)对线下培训满意度更高;(2)①84人,②有把握. 【解析】(1)对线下培训满意度更高.理由如下:①由茎叶图可知:在线上培训中,有72%的学员满意度评分至多79分,在线下培训中,有72%的学员评分至少80分.因此学员对线下培训满意度更高.②由茎叶图可知:线上培训满意度评分的中位数为76分,线下评分的中位数为85分.因此学员对线下培训满意度更高.③由茎叶图可知:线上培训的满意度评分平均分高于80分;线下培训的平均分低于80分,因此学员对线下培训满意度更高.④由茎叶图可知:线上培训的满意度评分在茎7上的最多,关于茎7大致呈对称分布;线下培训的评分分布在茎8上的最多,关于茎8大致呈对称分布,又两种培训方式打分的分布区间相同,故可以认为线下培训评分比线上培训打分更高,因此线下培训的满意度更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知798079.52m +==. ①参加线上培训满意度调查的25名学员中共有7名对线上培训非常满意,频率为725, 又本次培训共300名学员,所以对线上培训满意的学员约为73008425⨯=人. ②列联表如下:于是2250(181877)9.6825252525k ⨯-⨯==⨯⨯⨯,因为9.687.879>,所以有99.5%的把握认为学员对两种培训方式的满意度有差异. 21.【答案】(1)13;(2)35. 【解析】(1)OD ,OF 在OE 上的投影为cos cos OD OD OE OF OF OE 〈〉=〈〉,,11cos602=⨯︒=, ∴当P 在线段FE (除点F )和线段ED (除点D )上运动时,OP 在OE 上的投影大于12,∴OP 在OE 上的投影大于12的概率2163p ==.(2, 选出的两个点不相邻有9种,(A ,C ),(A ,D ),(A ,E ),(B ,D ),(B ,E ),(B ,F ),(C ,E ), (D ,F ),(C ,F );六个点中随机选取两个点,总共有15种:(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F );(93155P x ∴≥==. 22.【答案】(1)0.11235x y e =;(2)见解析. 【解析】(1)对bxy ae =取对数,得ln ln y bx a =+, 设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,()()()10110219.000.10883iii i i x x u u b x x==--==≈-∑∑, 6.050.108 5.5 5.456 5.46c u bx =-≈-⨯=≈,5.46235c a e e =≈≈,∴模型②的回归方程为0.11235x y e =.(2)由表格中的数据,有30407>14607,即101022113040714607()()i i i i y y y y ==>--∑∑,即10102211304071460711()()iii i y y y y ==-<---∑∑,2212R R <,模型①的相关指数21R 小于模型②的22R ,说明回归模型②的拟合效果更好.2021年时,13x =,预测旅游人数为0.1113 1.43235235235 4.2987y e e ⨯==≈⨯=(万人).。
【精品课件】新教材一轮复习北师大版第10章第3讲变量间的相关关系、统计案例课件

求得回归方程^y=0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 y(min) 62
75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为__6_8__.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
[解析] 由-x =30,得-y =0.67×30+54.9=75. 设表中的“模糊数字”为 a, 则 62+a+75+81+89=75×5,∴a=68.
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
返回导航
5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了 50 名 男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评 价,得到下面列联表:
满意 不满意 男顾客 40 10 女顾客 30 20
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
考点一
相关关系的判断——自主练透
(1)(2021·四 川 资 阳 模
拟)在一次对人体脂肪含量和年龄关
系的研究中,研究人员获得了一组样
本数据,并制作成如图所示的人体脂
肪含量与年龄关系的散点图.根据该
图,下列结论中正确的是 ( )
返回导航
第十章 统计、统计案例
高考一轮总复习 • 数学(新高考)
积相近的 200 个地块,从这些地块中用简单随机抽样的方法抽取 20 个作
为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中 xi 和 yi 分别表 示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计
20
20
20
算得xi=60,yi=1 200,
统计案例 PPT课件

• [例2] 一家保险公司调查其总公司营业部 的加班情况,收集了10周中每周加班工作 时间y(小时)与签发新保单数目x的数据如 下表,则用最小二乘法估计求出的线性回 归方程是
()
[答案] A
• [例3] 要分析学生初中升学的数学成绩对 高一年级数学学习有什么影响,在高一年 级学生中随机抽选10名学生分析他们入学 的数学成绩和高一年级期末数学考试成绩, 如下表所示:
• [点评] 本题为求回归直线方程中的最常见 问题,应注意作图要准确.
• [例4] 某保键药品推销商为推销其药品, 在广告中宣传:“在服用该药品的105人 中有100人未患A疾病”.经调查发现,在 不使用该药品的418人中仅有18人患A疾 病.请用所学知识分析该药品对防治A疾 病是否有效?
• [解析] 将问题中的数据写成2×2列联表如 下表:
• [例1] 下列属于相关关系的是
•( ) • A.利息与利率 • B.居民收入与储蓄存款 • C.电视机产量与苹果产量 • D.某种商品的销售额与销售价格
• [解析] 本题考查相关关系的概念,相关 关系不是函数关系,但两个变量之间存在 着关系,是一种非确定关系,但二者之间 不能没有任何关系,如选项C中:电视机 产量与苹果产量之间无关系.
• (2)
可求得 x =110(63+67+…+76)=70, y =110(65+78+…+75)=76. b^ =555019447-4-101×0×707×0276≈0.76556, a^=76-0.76556×70≈22.41, ∴所求的线性回归直线方程为^y=22.41+0.76556x. (3)若学生王明亮入学成绩为 80 分,代入上面线性回 归直线方程^y=22.41+0.76556x,可求得^y≈84(分). 答:王明亮同学高一期末数学成绩预测值为 84 分.
第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验
步
骤
③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.
专题68 变量间的相关关系与统计案例-高考数学复习资料(解析版)

D.58 件
【答案】A
【解析】由题中数据,得 x =10, y =38,回归直线y^=b^x+a^过点( x , y ),且b^=-2,代入得a^=58, 则回归方程y^=-2x+58,所以当 x=6 时,y=46,故选 A.
附: K 2
n(ad bc)2
.
(a b)(c d)(a c)(b d)
P(K2≥k) 0.050 0.010 0.001
k
3.841 6.635 10.828
【解析】 (1)由调查数据,男顾客中对该商场服务满意的比率为 40 0.8 ,因此男顾客对该商场服务满 50
意的概率的估计值为0.8.
支出费用为 3.00 万元的家庭购买水果和牛奶的年支出费用约为( )
A.1.795 万元
B.2.555 万元
C.1.915 万元
D.1.945 万元
【答案】A
【解析】
x
1 = ×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),
y
1 = ×(1.25+1.30+1.50+1.70
^
y=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+13.5t 上下,
这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010 年
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
--
(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为
统计部分案例及习题参考答案 (2)
部分案例和思考题参考答案第三章引入案例Ⅰ的数据进行统计分析参考:利用【数据】-【排序】可分别对“涨幅”、“成交量”进行排序,排序结果如下:表1 对“涨幅”按降序排列所得数据表2 对“成交量”按降序排列所得数据从表中所示数据,我们可知当天最爱青睐的前三支股票是华升股份、长江通信和万业企业,而市场交易最活跃的前三支股票是西部矿业、*ST梅雁、中海集运。
第四章:课堂实践案例1解答:我们可以先整理出每个未出现人数发生的次数(天数):图2 未出现人数的图形课堂实践案例2解答:(1)这是一个二项分布,采访一个住房为一次试验,遇到有人在家为成功。
于是:n=12,p=0.85,q=0.15,而且:平均有人在家的户数为n·p=12×0.85=10.2方差=n·p·q=12×0.85×0.15=1.53(2)用P(9)代表正好9房有人在家的概率。
于是:P(9)=12C9×0.859×0.153=220×0.2316169×0.003375=0.172 你可以查附录A核对这一结果。
在附录A中,p的值最大到0.5。
所以,要用这个表,你须将现在问题的“成功”重新定义为遇上滑人在家的住户。
这样,p=0.15。
根据n=12,p=0.15和r=3(遇上9户有人在有了就是遇上3户没有人在家),查出的结果会进一步确证概率为0.1720 。
(3)正好遇上7户有人在家的概率为:P(7)=12C7×0.857×0.155=729×0.320577×0.000076=0.0193(4)我们要求:P(至少10户有人在家)=P(10)+P(11)+P(12)你可以通过计算,也可通过查表得出:P(至少10户有人在家)=0.2924+0.3012+0.1422=0.7358 当然,我们可以用统计软件帮助计算。
卫生统计学案例分析二
总体均数的置信区间与参考值范围的区别联系
• 参考值范围:
案例二
• 已知正常成年男子血红蛋白均值为140g/L,今随机调 查某厂成年男子60人,测其血红蛋白均值为125g/L, 标准差15g/L。故认为该厂成年男子血红蛋白均值低于 一般成年男子。 • (1)该结论是否正确?为什么? • (2)有研究者根据该资料估计该地成年男子血红蛋白 均值为125g/L,该结论是否正确?为什么?(解法如第一题) • (3)解决此类问题可采用哪些统计分析方法?这些方 法有什么区别和联系?
• 3.男性血红蛋白含量的参考值范围:
• 女性血红蛋白含量的参考值范围:
• 制定参考值范围需要注意:
• 1.所谓正常人不是指完全正常的人,而是指排除了影响所研究指标的 疾病和有关因素的同质人群。 • 2.选择足够大的人群为调查对象, • 3.样本数量足够大(n》100) • 4.确定去单侧还是双侧正常值范围, • 5.选择适当的百分界限, • 6.选择正确的方法(百分位数法或近似正态法)。
谢 谢!
• (1)这是什么资料?该资料属于何种设计方案? • (2)拟比较三组小鼠细胞免疫功能是否有差异,可以采用哪些 统计方法?用该方法的条件是什么?思想是什么? • (3)如果想知道党参组和黄芪组小鼠细胞免疫功能是否有差异, 可以采用哪些统计方法? • (4)该研究者的统计处理方法是否正确?为什么?
案例六
• • •
• • • •
(1)该资料属于什么资料类型? (2)该资料属于何种设计方案? (3)比较治疗前后血红蛋白是否有差别可采用什么 统计方法?用该方法的条件是什么? (4)该医生的结论是否正确?为什么?
案例四
• 分别测得13名健康人和13名Ⅲ度肺气肿病人痰中抗胰蛋白酶含 量(g/L)如下表。某研究者根据此资料先计算差值并进行正态性 检验,服从统计后应用配对t检验:t=-5.276,P=0.000,故认为 Ⅲ度肺气肿病人痰中抗胰蛋白酶含量高于健康人。 • 健康人:2.7 2.2 4.1 4.3 2.6 1.9 1.7 0.6 1.9 1.3 1.5 1.7 1.3 • Ⅲ度肺气肿患者 :3.6 3.4 3.7 5.4 3.6 6.8 4.7 2.9 4.8 5.6 4.1 3.3 4.3 • • (1)请用excel计算健康人和Ⅲ度肺气肿病人痰中抗胰蛋白酶 含量的均数和标准差(请注明步骤)。 • (2)欲比较两组抗胰蛋白酶含量是否有差异,可以采用哪些统 计方法?用该方法的条件是什么?T 检验相关内容 (3)该医生的统计处理方法是否正确?为什么?(两独立样本 资料的t检验)
统计案例 人教B版 必修三
n(n11n 22 − n12 n 21 ) χ = n 1+ n 2+ n +1n +2
2
第三步:根据统计量的界限值判断是否接受推断假设
小结:
• 独立事件的概念 • 独立事件的判断①P(AB)=P(A)P(B) ②独立性检验 • 公式及字母的含义
n(n11n 22 − n12 n 21 ) χ = n1+ n 2+ n +1n +2
Hale Waihona Puke 作探究结论• 解:由
339 ( 43 × 121-205 ×13) χ = = 7.469 205 ×134 × 56 × 283
2 2
因为7.469 > 6.635,所以我们有99%的把握说:50 岁以上的人患慢性气管炎与吸烟习惯有关。
关于独立性检验完整步骤的一点说明
第一步:推断假设,假设所推断的变量无关 即:P(AB)=P(A)·P(B) 第二步:求统计量
研究 A B 、 A 与 B、 A与 B ,的独立性 与
都相互独立
若A与B独立,则 A B 也相互独立
独立性检验
例1 为了探究患慢性气管炎是否与吸烟有关,调 查了339名50岁以上的人,调查结果如下表示 患慢性气管炎 吸烟 不吸烟 43 13 56 未患慢性气管炎 合计 162 121 283
n11
n 21
n1+
n12
205 134 339
n +1
n 22
n 2+
n +2
合计
n
统计量
n(n11n 22 − n12 n 21 ) χ = n1+ n 2+ n +1n +2
江苏2018届高考数学总复习专题11.2统计与统计案例试题含解析
专题11.2 统计与统计案例【三年高考】1. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取▲ 件.【答案】18【解析】应从丙种型号的产品中抽取30060181000⨯=件,故答案为18.【考点】分层抽样【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 【答案】0.1【考点】方差【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】6【解析】46587666x+++++==【考点定位】平均数4. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】【考点】 折线图【名师点睛】将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.5. 【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】试题分析:由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.【考点】线性相关与线性回归方程的求法与应用.【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.6. 【2017课标1,文2】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】 试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B【考点】样本特征数【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平; 中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平; 平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.7. 【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】【考点】茎叶图、样本的数字特征【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 利用茎叶图对样本进行估计是,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.8.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中︒,B 月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C︒.下面叙述不正确的是.点表示四月的平均最低气温约为5C︒以上②七月的平均温差比一月的平均温差大①各月的平均最低气温都在0C︒的月份有5个③三月和十一月的平均最高气温基本相同④平均气温高于20C【答案】④【解析】︒均在虚线框内,所以各月的平均最低气温都在0℃以上,①正确;由试题分析:由图可知0C图可在七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,所以七月的平均温差比一月的平均温差大,②正确;由图可知三月和十一月的平均最高气温都大约在5C ︒,基本相同,③正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以④不正确. 考点:1、平均数;2、统计图.【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选②.9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).【答案】1.76【解析】试题分析:将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.考点:中位数的概念.【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力. 10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.【答案】①16;②29C BA139142考点: 统计分析【名师点睛】本题将统计与实际情况结合,创新味十足,是能力立意的好题,关键在于分析商品出售的所有可能的情况,分类讨论做到不重复不遗漏,另外,注意数形结合思想的运用.11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下 08 9 12 5 8 20 0 3 3 8 3 1 2则这组数据中的中位数是 .【答案】20【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20.12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 .(高中部)(初中部)男男女女60%70%【答案】137 【解析】由图可知该校女教师的人数为11070%150(160%)7760137⨯+⨯-=+=.13.【2015高考湖北,文2改编】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.【答案】169【解析】设这批米内夹谷的个数为x ,则由题意并结合简单随机抽样可知,282541534x =,即281534169254x =⨯≈. 14.【2015高考广东,文12】已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,所以样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为2125111x +=⨯+=,所以答案应填:11.15.【2015高考北京,文14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .【答案】乙;数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.16.【2015高考北京,文17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(I )估计顾客同时购买乙和丙的概率;(II )估计顾客在甲、乙、丙、丁中同时购买中商品的概率;(III )如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大? (Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为2000.21000=,顾客同时购买甲和丙的概率可以估计为1002003000.61000++=,顾客同时购买甲和丁的概率可以估计为1000.11000=,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 16.【2015高考广东,文17】某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图2.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中x 的值是0.0075(2)月平均用电量的众数是2202402302+=,因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户,抽取比例11125151055==+++,所以月平均用电量在[)220,240的用户中应抽取12555⨯=户【2018年高考命题预测】概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.【2018年高考考点定位】本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).【考点1】抽样方法、总体分布的估计【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.【考点针对训练】1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为 ,平均数为 .【答案】155;156.8【解析】根据中位数的定义知中位数由200.005200.0150.0200.5m ⨯+⨯+⨯=,解得5m =,所以中位数为:1505155+=;平均数为:1200.0051400.0151600.0201800.0052000.0032200.002156.8⨯+⨯+⨯+⨯+⨯+⨯=,所以答案为:155;156.8.2.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户? 【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中的值是0.0075.(2)月平均用电量的众数是2202402302+=;因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224.【考点2】相关性、最小二乘估计与统计案例 【备考知识梳理】1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关. 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.回归方程 (1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用表达式[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法. (2)回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数.∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为:∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a ).其中x =1n ∑i =1nx i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心.(3)相关系数①1()()nniii x x y y x yn x yr -------==∑∑r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系. 4.独立性检验(1)设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1. 2×2列联表构造一个随机变量2()()()()()n ad bc K a b c d a c b d -=++++其中d c b a n +++=为样本容量.(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验. (3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断①当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;②当χ2>2.706时,有90%的把握判定变量A ,B 有关联; ③当χ2>3.841时,有95%的把握判定变量A ,B 有关联; ④当χ2>6.635时,有99%的把握判定变量A ,B 有关联.【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.3.正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键.回归直线方程y =bx +a 必过样本点中心(x ,y ).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算2K 值,2K 值越大,说明“两个变量有关系”的可能性越大. 【考点针对训练】1.已知x 、y 的取值如下表所示,若y 与x 线性相关,且yˆ=0.95x +,则=____________.【答案】6.2 【解析】244310=+++=x ,5.447.68.43.42.2=+++=y ,样本中心点,在回归直线上,所以代入aˆ295.05.4+⨯=,所以6.2ˆ=a 2.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:22n(ad bc )K (a b )(c d )(a c )(b d )-=++++参照附表,在如下结论:A .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 中正确的是 . 【答案】C【解析】由表计算得:22100(45153010)==3.0355457525K ⨯-⨯⨯⨯⨯,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,填C .【两年模拟详解析】1. 【苏北三市(连云港、徐州、宿迁)2017届高三年级第三次调研考试】已知一组数据3,6,9,8,4,则该组数据的方差是__________. 【答案】 (或5.2)【解析】2. 【2016-2017学年度苏锡常镇四市高三教学情况调研(二)】下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据的平均数x ,则x 的值为 .【答案】19.7 【解析】3. 【南京市、盐城市2017届高三年级第一次模拟】已知样本数据12345,,,,x x x x x 的方差23s =,则样本数据123452,2,2,2,2x x x x x 的方差为 ▲ . 【答案】12【解析】由题意得方差为2224312s =⨯=4. 【2017年第三次全国大联考江苏卷】已知样本7,8,9,,x y 的平均数为,且60xy =,则此样本的方差为_____________. 【答案】2 【解析】因为78985x y++++=,所以16x y +=,而60xy =,所以610x y =⎧⎨=⎩或106x y =⎧⎨=⎩,从而样本的方差为22221[(1)01(2)2]25⨯-+++-+=.5. 【2017年高考原创押题预测卷02(江苏卷)】某人次上班途中所花的时间(单位:分钟)分别为9,11,10,8,12,则这组数据的标准差为_______. 【答案】2【解析】因为这组数据的平均数是10591110812=++++=x ,所以其方差25)109()1011()1010()108()1012(222222=-+-+-+-+-=s ,故所求这组数据的标准差2=s .6. 【淮安、宿迁、连云港、徐州苏北四市2016届高三第二次调研】交通部门对某路段公路上行驶的汽车速度实施监控,从速度在h km /9050-的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在h km /70以下的汽车有 辆.)【答案】75【解析】由频率分布直方图得,速度在h km /70以下的汽车所占频率为(0.020.03)100.5+⨯=,则速度在h km /70以下的汽车有1500.575⨯=辆7.【江苏省清江中学数学模拟试卷】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度大于25mm.【答案】40【解析】(0.0550.0250.015)10040⨯+⨯+⨯⨯=.8.【扬州市2015—2016学年度第一学期期末检测试题】某学校从高三年级共800名男生中随机抽取50名测量身高. 据测量被测学生身高全部介于155cm 和195cm 之间,将测量结果按如下方式分成八组:第一组[)160155,、第二组[)165160,、……、第八组[]195190,. 按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高180cm 以上(含180cm )的人数为 .【答案】144【解析】由图得,身高180cm 以上(含180cm )的频率为()150.0080.0160.0420.060.18-⨯++⨯+=,则人数为8000.18144⨯=9.【南京市、盐城市2016届高三年级第一次模拟考试数学】某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为 . 【答案】17【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人10.【苏州市2016届高三年级第一次模拟考试】若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为 . 【答案】2【解析】由题意得12x =,因此方差为221(12201)25++++=11.【江苏省扬州中学2015—2016学年第二学期质量检测】在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为90km/h ~120km/h ,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有________辆.【答案】1700【解析】2000(0.0350.030.02)101700⨯++⨯=12.【南京市、盐城市2016届高三年级第二次模拟考试】如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为 .【答案】【解析】950)002.0004.0(30=⨯+⨯13.【江苏省南京市2016届高三年级第三次学情调研适应性测试】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则月收入在[2500,3000)范围内的应抽出人.【答案】25⨯⨯=【解析】由题意得:0.00055001002514.【南京市2016届高三年级第三次模拟考试】甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:则甲、乙两位选手中成绩最稳定的选手的方差是.【答案】0.02【一年原创真预测】1. 以下四个命题中:R的值判断模型的拟合效果, 2R越大,模型的拟合效果越①在回归分析中,可用相关指数2好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③若数据123,,n x x x x 的方差为1,则1232,2,22n x x x x 的方差为2;④对分类变量与y 的随机变量2k 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为 . 【答案】2【入选理由】本题考查特称命题真假的判断,回归分析,相关系数,独立性检验等基础知识,意在考查考生转化能力,分析问题解决问题的能力,运算求解能力.此类知识属于高考冷门问题,近年高考有所重视,应多注意,故选此题.2.某单位为了了解某办公楼用电量y (度)与气温x (oC)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:得到的回归方程为a bx y+=ˆ,则a 0,b 0. 【答案】>,<【解析】依题意,画散点图知,两个变量负相关,所以0<b ,0>a .【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题. 3.2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计、统计案例【热点聚焦与扩展】纵观近几年的高考试题,统计是高考热点之一,往往以实际问题为背景,考查统计相关概念的计算,考查识图用图能力、数据处理能力以及分析问题解决问题的能力.小题、大题均有独立考查,大题也易于和概率一同考查.难度控制在中等以下.本专题在分析研究近几年高考题及各地模拟题的基础上,举例说明. (一)随机抽样:1、抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到容量为n 的样本2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤: (1)先将总体的N 个个体编号(2)确定分段间隔k ,设样本容量为n ,若N n 为整数,则N k n= (3)在第一段中用简单随机抽样确定第一个个体编号l ,则后面每段所确定的个体编号与前一段确定的个体编号差距为k ,例如:第2段所确定的个体编号为l k +,第m 段所确定的个体编号为()1l m k +-,直至完成样本 注:(1)若Nn不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被n 整除,再进行系统抽样.例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的500个个体参加系统抽样 (2)利用系统抽样所抽出的个体编号排成等差数列,其公差为k3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本.分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到 (二)频率分布直方图: 1、频数与频率(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数. (2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数 (3)各试验结果的频率之和等于12、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出 (1)极差:一组数据中最大值与最小值的差(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以有组距=极差/组数 (3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距” (5)频率分布直方图的特点: ① 频率=⨯频率组距组距,即分布图中每个小矩形的面积 ② 因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1(三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数.并按末位数之前的数位进行分类排列,相同的数据需在茎叶图中体现多次(四)统计数据中的数字特征:1、众数:一组数据中出现次数最多的数值,叫做众数2、中位数:将一组数据从小到大排列,位于中间位置的数称为中位数,其中若数据的总数为奇数个,则为中间的数;若数据的总数为偶数个,则为中间两个数的平均值.3、平均数:代表一组数据的平均水平,记为x ,设一组数据为:12,,,n x x x ,则有:12nx x x x n+++=4、方差:代表数据分布的分散程度,记为2s ,设一组数据为:12,,,n x x x ,其平均数为x ,则有:()()()2222121n s x x x xx x n ⎡⎤=-+-++-⎢⎥⎣⎦,其中2s 越小,说明数据越集中5、标准差:也代表数据分布的分散程度,为方差的算术平方根【经典例题】例1.(2019·全国高考真题(文))《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5B .0.6C .0.7D .0.8【答案】C 【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C .例2.(2018年理新课标I 卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是( ) A. 新农村建设后,种植收入减少B. 新农村建设后,其他收入增加了一倍以上C. 新农村建设后,养殖收入增加了一倍D. 新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 【答案】A详解:设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D 正确;故选A.例3.(2019·全国高考真题(理))演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差 【答案】A【解析】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.例4.(2018年江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.点睛:的平均数为.例5.(2017课标1,文2)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B例6.(2017课标3,文3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】A例7.(2019·全国高考真题(理))我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【解析】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.98 40=.例8.(2019·全国高考真题(文))某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客40 10女顾客30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)43,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.例9.(2019·全国高考真题(文))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成,A B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到()P C 的估计值为0.70. (1)求乙离子残留百分比直方图中,a b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 【答案】(1) 0.35a =,0.10b =;(2) 4.05,6. 【解析】(1)由题得0.200.150.70a ++=,解得0.35a =,由0.050.151()10.70b P C ++=-=-,解得0.10b =. (2)由甲离子的直方图可得,甲离子残留百分比的平均值为0.1520.2030.3040.2050.1060.057 4.05⨯+⨯+⨯+⨯+⨯+⨯=,乙离子残留百分比的平均值为0.0530.1040.1550.3560.2070.1586⨯+⨯+⨯+⨯+⨯+⨯=例10.(2015·全国高考真题(理))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w821()ii x x =-∑821()ii w w =-∑81()()iii x x y y =--∑ 81()()iii w w yy =--∑46.6 56.3 6.8 289.8 1.6 1469 108.8表中i i w x =,w =1881i i w =∑(Ⅰ)根据散点图判断,y=a+bx 与x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题: (ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,……,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:【答案】(Ⅰ)y c d x =+适合作为年销售y 关于年宣传费用x 的回归方程类型;(Ⅱ)100.668y x =+(Ⅲ)46.24 【解析】(Ⅰ)由散点图可以判断,y c d x =+适合作为年销售y 关于年宣传费用x 的回归方程类型.(Ⅱ)令w x =,先建立y 关于w 的线性回归方程,由于81821()()()iii ii w w yy d w w ==--=-∑∑=108.8=6816, ∴c y dw =-=563-68×6.8=100.6.∴y 关于w 的线性回归方程为100.668y w =+, ∴y 关于x 的回归方程为100.668y x =+.(Ⅲ)(ⅰ)由(Ⅱ)知,当x =49时,年销售量y 的预报值100.66849y =+=576.6,576.60.24966.32z =⨯-=.(ⅱ)根据(Ⅱ)的结果知,年利润z 的预报值0.2(100.668)13.620.12z x x x x =+-=-++,∴当x =13.6=6.82,即46.24x =时,z 取得最大值. 故宣传费用为46.24千元时,年利润的预报值最大.……12分【精选精练】1.(2019·全国高三月考(文))某企业引进现代化管理体制,生产效益明显提高.2018年全年总收入与2017年全年总收入相比增长了一倍,实现翻番.同时该企业的各项运营成本也随着收入的变化发生了相应变化.下图给出了该企业这两年不同运营成本占全年总收入的比例,下列说法正确的是( )A.该企业2018年设备支出金额是2017年设备支出金额的一半B.该企业2018年支付工资金额与2017年支付工资金额相当C.该企业2018年用于研发的费用是2017年用于研发的费用的五倍D.该企业2018年原材料的费用是2017年原材料的费用的两倍【答案】C【解析】由折线图可知:不妨设2017年全年的收入为t,则2018年全年的收入为2t,对于选项A,该企业2018年设备支出金额为0.2×2t=0.4t,2017年设备支出金额为0.4×t=0.4t,故A错误,对于选项B,该企业2018年支付工资金额为0.2×2t=0.4t,2017年支付工资金额为0.2×t=0.2t,故B错误,对于选项C,该企业2018年用于研发的费用是0.25×2t=0.5t,2017年用于研发的费用是0.1×t=0.1t,故C 正确,对于选项D,该企业2018年原材料的费用是0.3×2t=0.6t,2017年原材料的费用是0.15×t=0.15t,故D错误,故选:C.2.(2019·广东高考模拟(理))如图是2018年第一季度五省GDP情况图,则下列陈述中不正确的是A.2018年第一季度GDP增速由高到低排位第5的是浙江省B.与2017年同期相比,各省2018年第一季度的GDP总量实现了增长C.2017年同期河南省的GDP总量不超过4000亿元D.2018年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个【答案】D【解析】对于A,从折线统计图可得,2018年第一季度GDP增速由高到低排位依次为江苏、辽宁、山东、河南、浙江,故浙江省排在第五,对于B,从折线统计图可得,与2017年同期相比,各省2018年第一季度的GDP总量实现了增长率都为正值,所以与2017年同期相比,各省2018年第一季度的GDP 总量实现了增长, 对于C ,根据统计图可计算2017年同期河南省的GDP 总量为4067.43815.640001.066≈<,所以2017年同期河南省的GDP 总量不超过4000亿元,对于D, 2018年第一季度GDP 总量和增速由高到低排位均居同一位的省有两个,江苏、河南, 综述只有D 选项不正确, 故答案选D.3.(2019·上海格致中学高三)已知数据1x ,2x ,3x ,nx ⋅⋅⋅是上海普通职n (3n ≥,n *∈N )个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入1n x +,则这1n +个数据中,下列说法正确( )A .年收入平均数大大增大,中位数一定变大,方差可能不变B .年收入平均数大大增大,中位数可能不变,方差变大C .年收入平均数大大增大,中位数可能不变,方差也不变D .年收入平均数大大增大,中位数可能不变,方差可能不变 【答案】B【解析】因为数据1x ,2x ,3x ,n x ⋅⋅⋅是上海普通职n (3n ≥,n *∈N )个人的年收入, 而1n x +是世界首富的年收入,则1n x +会远大于1x ,2x ,3x ,n x ⋅⋅⋅,故这1n +个数据的平均值大大增加,但中位数可能不变,有可能稍微变大, 但由于数据的集中程度也受到1n x +比较大的影响,数据更加离散,则方差变大. 故选:B4.(2019·山东高三(文))为了节能减排,发展低碳经济,我国政府从2001年起就通过相关扶植政策推动新能源汽车产业发展.下面的图表反映了该产业发展的相关信息:6月 8.6 31.7 8.4 42.9 7月 9 53.6 8.4 47.7 8月 9.9 39 10.1 49.5 9月 12.7 64.4 12.1 54.8 10月 14.6 58.1 13.8 51 11月 17.3 36.9 16.9 37.6 1-12月 127 59.9 125.6 61.7 2019年1月 9.1 113 9.6 138 2月5.950.95.353.62019年2月份新能源汽车销量结构图根据上述图表信息,下列结论错误的是( )A .2018年4月份我国新能源汽车的销量高于产量B .2017年3月份我国新能源汽车的产量不超过3.4万辆C .2019年2月份我国插电式混合动力汽车的销量低于1万辆D .2017年我国新能源汽车总销量超过70万辆 【答案】C【解析】C 项:2019年2月份我国新能源汽车的销量为5.3万辆,其中插电式混合动力汽车所占的比例为0025,故插电式混合动力汽车的销量为5.30.25 1.3251,故C 项错误,故选C.5.(2019·江苏高考真题)已知一组数据6,7,8,8,9,10,则该组数据的方差是____. 【答案】53. 【解析】由题意,该组数据的平均数为678891086+++++=,所以该组数据的方差是22222215[(68)(78)(88)(88)(98)(108)]63-+-+-+-+-+-=. 6.(2019·江西白鹭洲中学高三月考(理))以下四个命题中:①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好;②在一组样本数据()()()112212,,,,...,,(2,,,...,n n n x y x y x y n x x x ≥不全相等)的散点图中,若所有样本点()()11,1,2,...x y i n =都在直线112y x =-+上,则这组样本数据的线性相关系数为12-;③对分类变量x 与y 的随机变量2k 来说,2k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为__________. 【答案】1【解析】①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好,①正确; ②相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为-1,②错误;③对分类变量x 与y 的随机变量2k 来说,2k 越大,判断“x 与y 有关系”的把握程度越大.③错误. 故正确命题个数为1. 故答案为:1.7.(2019·山东高三)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg )和年份代码x 绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x 分别为1~7).(1)根据散点图分析y 与x 之间的相关关系; (2)根据散点图相应数据计算得77111074,4517ii i i i yx y ====∑∑,求y 关于x 的线性回归方程;(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.(精确到0.01)附:回归方程y a bx =+中斜率和截距的最小二乘估计公式分别为:()()()121,niii nii x x y y b a y bx x x ==--==--∑∑.【答案】(1) 正相关关系;(2) 221853ˆ287yx =+. (3) 拟合效果较好. 【解析】(1)由散点图可以看出,点大致分布在某一直线的附近,且当x 由小变大时,y 也由小变大,从而y 与x 之间是正相关关系; (2)由题中数据可得()1123456747x =++++++=,11074107477y =⨯=, 从而717222222222211745177107442217ˆ123456774287i ii ii x y x ybxx ==-⋅-⨯⨯⨯===++++++-⨯-∑∑,1074221853ˆˆ47287ay b x =-⋅=-⨯=, 从而所求y 关于x 的线性回归方程为221853ˆ287yx =+. (3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好. 8.(2018·全国高考真题(文))某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:超过m 不超过m 第一种生产方式 第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,【答案】(1)第二种生产方式的效率更高. 理由见解析(2)80(3)能【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m+==.列联表如下:超过m不超过m第一种生产方式15 5第二种生产方式 5 15(3)由于()224015155510 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.(2018届宁夏回族自治区银川一中考前训练)某班级体育课举行了一次“投篮比赛”活动,为了了解本次投篮比赛学生总体情况,从中抽取了甲乙两个小组样本分数的茎叶图如图所示.5 6 5 86 0 1 3 6 2 4 6 97 1 2 7 1 38 0 1 8 1甲乙(1)分别求甲乙两个小组成绩的平均数与方差;(2)分析比较甲乙两个小组的成绩;(3)从甲组高于70分的同学中,任意抽取2名同学,求恰好有一名同学的得分在[80,90)的概率.【答案】(1),;,.(2)甲乙两个小组成绩相当; 乙组成绩比甲组成绩更稳定.(3).【解析】(1)记甲乙成绩的的平均数分别为,,则..记甲乙成绩的的方差分别为,,则..(2)因为,所以甲乙两个小组成绩相当;因为,所以乙组成绩比甲组成绩更稳定.(3)由茎叶图知,甲组高于70分的同学共4名,有2名在[70,80),记为,,有2名在[80,90)记为,.任取两名同学的基本事件有6个:(,),(,),(,),(,),(,),(,).恰好有一名同学的得分在[80,90)的基本事件数共4个:(,),(,),(,),(,).所以恰好有一名同学的得分在[80,90)的概率为.10.(2019·云南师大附中高三月考(文))某企业为提高生产质量,引入了一批新的生产设备,为了解生产情况,随机抽取了新、旧设备生产的共200件产品进行质量检测,统计得到产品的质量指标值如下表及图(所有产品质量指标值均位于区间(15,45]内),若质量指标值大于30,则说明该产品质量高,否则说明该产品质量一般.质量指标(15,20](20,25](25,30](30,35](35,40](40,45]合计频数 2 8 10 30 20 10 80(1)根据上述图表完成下列22⨯列联表,并判断是否有99%的把握认为产品质量高与引人新设备有关;新旧设备产品质量22⨯列联表产品质量高产品质量一般合计新设备产品旧设备产品合计(2)从旧设备生产的质量指标值位于区间(15,30]的产品中,按分层抽样抽取6件产品,再从这6件产品中随机选取2件产品进行质量检测,求至少有一件产品质量指标值位于(20,25]的概率.附:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k0.10 0.05 0.01 0.001k 2.706 3.841 6.635 10.828【答案】(1)列联表见解析,有;(2)5.【解析】(1)列联表如下:产品质量高产品质量一般合计新设备产品60 20 80 旧设备产品48 72 120 合计108 92 200∴22200(60724820)23.67 6.6351089280120K ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为产品质量高与引入新设备有关.(2)由题意,从(15,20]中抽取1件产品,记为a ,从(]20,25中抽取2件产品,记为b ,c ,从(]25,30中抽取3件产品,记为d ,e ,f ,从这6件产品中任选2件,共有15种可能情况(),a b ,(),a c ,(),a d ,(),a e ,(),a f ,(),b c ,(),b d ,(),b e ,(),b f ,(),c d ,(),c e ,(),c f ,(),d e ,(),d f ,(),e f ,记事件A 为至少有一件产品质量指标位于(]20,25,共有9种情况, 所以93()155P A ==. 11.(2018·北京高考真题(文))电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案】(Ⅰ)0.025;(Ⅱ)0.814;(Ⅲ)增加第五类电影的好评率,减少第二类电影的好评率. 【解析】(Ⅰ)由题意知,样本中电影的总部数是140503002008002102000+++++=, 第四类电影中获得好评的电影部数是2000.2550⨯=, 故所求概率为500.0252000=; (Ⅱ)设“随机选取1部电影,这部电影没有获得好评”为事件B .没有获得好评的电影共有1400.6200.83000.852000.758000.85100.91628⨯+⨯+⨯+⨯+⨯+⨯=部, 由古典概型概率公式得()16280.8142000P B ==;(Ⅲ)增加第五类电影的好评率, 减少第二类电影的好评率.12.(2019·甘肃临夏中学高三(文))某省高考改革实施方案指出:该省高考考生总成绩将由语文、数学、外语3门统一高考成绩和学生自主选择的学业水平等级性考试科目共同构成.该省教育厅为了解正就读高中的学生家长对高考改革方案所持的赞成态度,随机从中抽取了100名城乡家长作为样本进行调查,调查结果显示样本中有25人持不赞成意见.下面是根据样本的调查结果绘制的等高条形图.(1)根据已知条件与等高条形图完成下面的2×2列联表,并判断我们能否有95%的把握认为“赞成高考改革方案与城乡户口有关”?(2)利用分层抽样从持“不赞成”意见家长中抽取5名参加学校交流活动,从中选派2名家长发言,求恰好有1名城镇居民的概率.【答案】(1)没有把握;(2)35. 【解析】 (1)完成22⨯列联表,如下:赞成 不赞成 合计 城镇居民 30 15 45 农村居民 45 10 55 合计7525100代入公式,得2K 观测值: 22()100(300675)3.03 3.841()()()()45557525n ad bc k a b c d a c b d -⨯-==≈<++++⨯⨯⨯ ∴我们没有95%的把握认为”赞成高考改革方案与城乡户口有关”.(2)城乡户口与农村户口比为3:2,∴抽取5人中城镇户口的有3人,设为,,A B C ,农村户口的有2人,设为,a b ,。