【理科数学2010-2018高考真题分类】专题十一 概率与统计第三十三讲 回归分析与独立性检验

合集下载

理科数学2010-2019高考真题分类训练专题十一概率与统计第三十三讲回归分析与独立性检验答案

理科数学2010-2019高考真题分类训练专题十一概率与统计第三十三讲回归分析与独立性检验答案

专题十一 概率与统计第三十三讲 回归分析与独立性检验答案部分1.C 【解析】因为22.5x =,160y =,所以$160422.570a=-⨯=,42470166y =⨯+=,选C .2.B 【解析】∵10.0x =,8.0y =,ˆ0.76b=,∴ˆ80.76100.4a =-⨯=, ∴回归方程为ˆ0.760.4yx =+,把15x =代入上式得, ˆ0.76150.411.8y=?=(万元),选B . 3.A 【解析】由题意可知,相应的回归直线的斜率应为正,排除C 、D .且直线必过点(3,3.5),代入A 、B 得A 正确.4.A 【解析】画出散点图知0,0b a <>.5.D 【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为1,故选D.6.D 【解析】因为222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯,则有22224231χχχχ>>>,所以阅读量与性别关联的可能性最大.7.D 【解析】由回归方程为$y =0.8585.71知y 随x 的增大而增大,所以y 与具有正的线性相关关系,由最小二乘法建立的回归方程得过程知ˆ()ybx a bx y bx a y bx =+=+-=-, 所以回归直线过样本点的中心(x ,y ),利用回归方程可以预测估计总体,所以D 不正确.8.B 【解析】样本中心点是(3.5,42),则ˆˆ429.4 3.59.1ay bx =-=-⨯=,所以回归方程是ˆ9.49.1yx =+,把6x =代入得ˆ65.5y =. 9.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 10.【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,40.1749.32 2.89==-⨯=,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得71721()()2.89ˆ0.10328()ii i ii tt y y b tt ==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.11.【解析】(Ⅰ)由散点图可以判断,y c =+适宜作为年销售量y 关于年宣传费x 的回归方程类型.(Ⅱ)令w =y 关于w 的线性回归方程,由于81821()()108.8ˆ681.6()iii ii w w y y dw w ==--===-∑∑. ˆˆ56368 6.8100.6cy dw =-=-⨯=, 所以y 关于w 的线性回归方程为ˆ100.668y w =+,因此y 关于x 的回归方程为ˆ100.6y=+ (Ⅲ)(ⅰ)由(Ⅱ)知,当49x =时,年销售量y 的预报值ˆ100.6576.6y=+= 年利润z 的预报值ˆ576.60.24966.32z=⨯-=. (ⅱ)根据(Ⅱ)得结果知,年利润z 的预报值ˆ0.2(100.620.12zx x =+-=-+.13.66.82==,即46.24x =时,ˆz取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 12.【解析】(I ) 由所给数据计算得17t =(1+2+3+4+5+6+7)=417y =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3 7211()t tt =-∑=9+4+1+0+1+4+9=287111()()t tt y y =--∑=(3)( 1.4)(2)(1)(1)(0.7)-⨯-+-⨯-+-⨯-00.110.520.93 1.614+⨯+⨯+⨯+⨯=71117211()()140.528()t t tt y y btt ==--===-∑∑$,$ 4.30.54 2.3ay bt =-=-⨯=$. 所求回归方程为$0.5 2.3y t =+.13.【解析】(I)由频率颁布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下由2×2列联表中数据代入公式计算,得222112212211212()100(30104515)100 3.0307525455533n n n n n x n n n n ++++-⨯-⨯==≈⨯⨯⨯因为3.030<3.841,所以,没有理由认为“体育迷”与性别有关.(II )由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间12132311{(,),(,),(,),(,)a a a a a a a b Ω=12212231,(,),(,),(,),(,),a b a b a b a b3212(,),(,)}a b b b 其中i a 表示男性,1,2,3i =.j b 表示女性,1,2j =.Ω由10个基本事件组成,而且这些事件的出现时等可能的.用A 表示“任选2人中至少有1名是女性”这一事件,则11122122313212{(,),(,),(,),(,),(,),(,),(,)}A a b a b a b a b a b a b b b =∴7()10P A。

高考数学真题专题(理数)回归分析与独立性检验

高考数学真题专题(理数)回归分析与独立性检验

专题十一 概率与统计第三十三讲 回归分析与独立性检验一、选择题1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆy bx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为A .160B .163C .166D .1702.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归本线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为A .11.4万元B .11.8万元C .12.0万元D .12.2万元 3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为A .0.4 2.3y x =+B .2 2.4y x =-C .29.5y x =-+D .0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据得到的回归方程为ˆybx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b > 5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线112y x =+上,则这组样本数据的样本相关系数为A .−1B .0C .12D .16.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是7.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元二、解答题9.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5=-+yt ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+yt . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑0.55=≈2.646.参考公式:相关系数()()ni it t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =w =1881i i w =∑.(Ⅰ)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为121()()ˆ()niii nii u u v v u u β==--=-∑∑,ˆˆv u αβ=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i ni i tty y b t t ∧==--=-∑∑,ˆˆay bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(I )根据已知条件完成下面22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.21212211222112)(++++-=n n n n n n n n n χ, 附:。

2018年高考数学(理)考试大纲解读专题11 概率与统计--物理小金刚系列

2018年高考数学(理)考试大纲解读专题11 概率与统计--物理小金刚系列

(六)统计1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(七)概率1.事件与概率(1)了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.(2)了解两个互斥事件的概率加法公式.2.古典概型(1)理解古典概型及其概率计算公式.(2)会计算一些随机事件所含的基本事件数及事件发生的概率.3.随机数与几何概型(1)了解随机数的意义,能运用模拟方法估计概率.(2)了解几何概型的意义.(二十一)概率与统计1.概率(1)理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性. (2)理解超几何分布及其导出过程,并能进行简单的应用.(3)了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题.(4)理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题.(5)利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.概率与统计作为高考的必考内容,在2018年的高考中预计仍会以“一小一大”的格局呈现.对于概率部分,选择题或填空题中概率求值是高考命题的热点,以古典概型或几何概型为主线,考查随机事件的概率.解答题中则常与统计知识相结合,考查离散型随机变量的分布列与期望,需注意知识的灵活运用.对于统计部分,选择题、填空题中以考查抽样方法和用样本估计总体为主,兼顾两个变量的线性相关;解答题中则重点考查求回归直线方程及独立性检验.。

(完整版)2018年高考统计与概率专题

(完整版)2018年高考统计与概率专题

2018年高考统计与概率专题(全国卷1文)2.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B(全国卷1理)2.如图,正方形ABCD 内的图形来自中国古代的太极图。

正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8C .12D .π4【考点】:几何概型【思路】:几何概型的面积问题,=P 基本事件所包含的面积总面积.【解析】:()21212=82r S P S r ππ==,故而选B 。

(全国卷2理)6.安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有( )A .12种B .18种C .24种D .36种(全国卷2文)6。

如图,网格纸上小正方形的边长为1,粗实线画出的是某几何体的三视图,该几何体由一平面将一圆柱截去一部分后所得,则该几何体的体积为 A.90πB 。

63πC 。

42π D.36π【答案】B【解析】由题意,该几何体是由高为6的圆柱截取一半后的图形加上高为4的圆柱,故其体积为2213634632V πππ=⋅⋅⋅+⋅⋅=,故选B 。

(天津卷)文(3)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫。

从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为(A)45(B)35(C)25(D)15(全国卷2文)11.从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C。

2010-2018高考数学试题分类汇编理科版专题十一 概率与统计第三十二讲 统计初步答案

2010-2018高考数学试题分类汇编理科版专题十一  概率与统计第三十二讲  统计初步答案

专题十一 概率与统计第三十二讲 统计初步答案部分1.A 【解析】通解 设建设前经济收入为a ,则建设后经济收入为2a ,则由饼图可得建设前种植收入为0.6a ,其他收入为0.04a ,养殖收入为0.3a .建设后种植收入为0.74a ,其他收入为0.1a ,养殖收入为0.6a ,养殖收入与第三产业收入的总和为1.16a ,所以新农村建设后,种植收入减少是错误的.故选A .优解 因为0.60.372<⨯,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的.故选A .2.A 【解析】由折线图,7月份后月接待游客量减少,A 错误;选A .3.18【解析】应从丙种型号的产品中抽取30060181000⨯=件. 4.D 【解析】由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D .5.D 【解析】由图可知0℃在虚线框内,所以各月的平均最低气温都在0℃以上,A 正确;由图可知七月的平均温差比一月的平均温差大,B 正确;由图可知三月和十一月的平均最高气温都约为10℃,基本相同,C 正确;由图可知平均最高气温高于20℃的月份不是5个,D 不正确,故选D .6.C 【解析】由扇形统计图可得,该校女教师人数为11070150(160%)137⨯+⨯-=.7.D 【解析】根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化碳年排放量与年份负相关,选项D 错误.8.C 【解析】设样本数据1x ,2x ,⋅⋅⋅,10x 8=,即方差64DX =,而数据121x -,221x -,⋅⋅⋅,1021x -的方差22(21)2264D X DX -==⨯,16=.故选C .9.C 【解析】由10002540=,可得分段的间隔为25.故选C . 10.A 【解析】所抽人数为(350020004500)2%200++⨯=,近视人数分别为小学生350010%350⨯=,初中生450030%1350⨯=,高中生200050%1000⨯=,∴抽取的高中生近视人数为10002%20⨯=.选A .11.D 【解析】根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样方法,每个个体被抽到的概率都是n N,故123p p p ==,故选D . 12.C 【解析】因该地区小学、初中、高中三个学段学生的视力情况有较大差异,故最合理的抽样方法是按学段分层抽样,故选C .13.B 【解析】由图知道60分以上人员的频率为后4项频率的和,由图知道(0.030.0250.0150.01)*100.8P =+++=,故分数在60以上的人数为600×0.8=480人.14.B 【解析】由图可知去掉的两个数是87,99,所以8790291294+⨯+⨯+90917x ++=⨯,4x =.22222136[(8791)(9091)2(9191)2(9491)2]77s =-+-⨯+-⨯+-⨯=. 15.A 【解析】由概念知中位数是中间两数的平均数,即45+47=462,众数是45,极差为68-12=56.所以选A.16.90【解析】由茎叶图可得分数的平均数为8989909191905++++=. 17.4【解析】由茎叶图可知,在区间]151,139[的人数为20,再由系统抽样的性质可知人数为435720=⨯人. 18.24【解析】由频率分布直方图可得树木底部周长小于100cm 的频率是(0.025+0.015)×10=0.4,又样本容量是60,所以频数是0.4×60=24.19.1800【解析】分层抽样中各层的抽样比相同,样本中甲设备生产的有50件,则乙设备生产的有30件,在4800件产品中,甲、乙设备生产的产品总数比为5:3,所以乙设备生产的产品总数为1800件.20.60【解析】应从一年级抽取4604556300?+++名.21.10【解析】设五个班级的数据分别为a b c d e <<<<。

2018届高考数学(理)热点题型:概率与统计((有答案))

2018届高考数学(理)热点题型:概率与统计((有答案))

2018届高考数学(理)热点题型:概率与统计((有答案))D23456=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681. (2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59,P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29,P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为X 2 3 4 5 P59291081881E (X )=2×59+3×29+4×1081+5×881=22481.【类题通法】求离散型随机变量的均值和方差问题的一般步骤 第一步:确定随机变量的所有可能值; 第二步:求每一个可能值所对应的概率; 第三步:列出离散型随机变量的分布列; 第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求: ①顾客所获的奖励额为60元的概率; ②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和507元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由. 解 (1)设顾客所获的奖励额为X .①依题意,得P (X =60)=C 11C 13C 24=12,即顾客所获的奖励额为60元的概率为12.②依题意,得X 的所有可能取值为20,60. P (X =60)=12,P (X =20)=C 23C 24=12,即X 的分布列为X 20 60 P1212所以顾客所获的奖励额的数学期望为E (X )=20×12+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2. 以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X 1,则X 1的分布列为X 1 20 60 100 P162316X 1的数学期望为E (X 1)=20×16+60×23+100×16=60(元),X1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X240 60 80P162316X2的数学期望为E(X2)=40×16+60×23+80×16=60(元),X2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.89解 (1)由频率分布直方图知: 第3组的人数为5×0.06×40=12. 第4组的人数为5×0.04×40=8. 第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人. ①设“甲或乙进入第二轮面试”为事件A ,则 P (A )=1-C 310C 312=511,所以甲或乙进入第二轮面试的概率为511.②X 的所有可能取值为0,1,2,P (X =0)=C 24C 26=25,P (X =1)=C 12C 14C 26=815,P (X =2)=C 22C 26=115.所以X 的分布列为X 0 1 2 P25815115E (X )=0×25+1×815+2×115=1015=23.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X 服从超几何分布.【对点训练】某公司为了解用户对某产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2.P(C)=P(C B1C A1∪C B2C A2)10=P (C B 1C A 1)+P (C B 2C A 2) =P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,即P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,故P (C )=1020×1620+820×420=0.48.热点四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n ∑n i =1x i =8010=8, y =1n ∑n i =1y i=2010=2, 又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b ^=l xy l xx =2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0),故x 与y 之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y^=0.3×7-0.4=1.7(千元).【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r来确定,r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b^,a^的公式进行准确的计算.【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?非读书迷读书迷总计男15女45总计(2)将频率视为概率.1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X.若每次抽取的结果是相互独立的,求X 的分布列、期望E(X)和方差D(X).解(1)完成2×2列联表如下:非读书迷读书迷总计男401555女202545总计60 40 100K 2=100×(40×2560×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25.由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i (i =0,1,2,3). X 的分布列为X 0 1 2 3 P2712554125361258125均值E (X )=np =3×25=65,方差D (X )=np (1-p )=3×25×⎝⎛⎭⎪⎫1-25=1825.。

(2010-2019)高考数学真题分类汇编专题12概率统计文(含解析)

(2010-2019)高考数学真题分类汇编专题12概率统计文(含解析)

专题12概率统计历年考题细目表解答题2010概率统计综合题2010年新课标1文科19历年高考真题汇编1.【2019年新课标1文科06】某学校为了解1000名新生的身体素质,将这些学生编号1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生【解答】解::∵从1000名学生从中抽取一个容量为100的样本,∴系统抽样的分段间隔为10,∵46号学生被抽到,则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,以10为公差的等差数列,设其数列为{a n},则a n=6+10(n﹣1)=10n﹣4,当n=62时,a62=616,即在第62组抽到616.故选:C.2.【2018年新课标1文科03】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解答】解:设建设前经济收入为a,建设后经济收入为2a.A项,种植收入37%×2a﹣60%a=14%a>0,故建设后,种植收入增加,故A项错误.B项,建设后,其他收入为5%×2a=10%a,建设前,其他收入为4%a,故10%a÷4%a=2.5>2,故B项正确.C项,建设后,养殖收入为30%×2a=60%a,建设前,养殖收入为30%a,故60%a÷30%a=2,故C项正确.D项,建设后,养殖收入与第三产业收入总和为(30%+28%)×2a=58%×2a,经济收入为2a,故(58%×2a)÷2a=58%>50%,故D项正确.因为是选择不正确的一项,故选:A.3.【2017年新课标1文科02】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别是x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数 B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【解答】解:在A中,平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标,故A不可以用来评估这种农作物亩产量稳定程度;在B中,标准差能反映一个数据集的离散程度,故B可以用来评估这种农作物亩产量稳定程度;在C中,最大值是一组数据最大的量,故C不可以用来评估这种农作物亩产量稳定程度;在D中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”,故D不可以用来评估这种农作物亩产量稳定程度.故选:B.4.【2017年新课标1文科04】如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是()A.B.C.D.【解答】解:根据图象的对称性知,黑色部分为圆面积的一半,设圆的半径为1,则正方形的边长为2,则黑色部分的面积S,则对应概率P,故选:B.5.【2016年新课标1文科03】为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是()A.B.C.D.【解答】解:从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,有6种方法,红色和紫色的花在同一花坛,有2种方法,红色和紫色的花不在同一花坛,有4种方法,所以所求的概率为.另解:由列举法可得,红、黄、白、紫记为1,2,3,4,即有(12,34),(13,24),(14,23),(23,14),(24,13),(34,12),则P.故选:C.6.【2015年新课标1文科04】如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数.从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为( )A.B.C.D.【解答】解:从1,2,3,4,5中任取3个不同的数,有(1,2,3),(1,2,4),(1,2,5),(1,3,4),(1,3,5),(1,4,5)(2,3,4),(2,3,5),(2,4,5),(3,4,5)共10种,其中只有(3,4,5)为勾股数,故这3个数构成一组勾股数的概率为.故选:C.7.【2013年新课标1文科03】从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是()【解答】解:由题意知本题是一个等可能事件的概率,试验发生包含的事件是从4个不同的数中随机的抽2个,共有C42=6种结果,满足条件的事件是取出的数之差的绝对值等于2,有2种结果,分别是(1,3),(2,4),∴要求的概率是.故选:B.8.【2012年新课标1文科03】在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y x+1上,则这组样本数据的样本相关系数为()A.﹣1 B.0 C.D.1【解答】解:由题设知,所有样本点(x i,y i)(i=1,2,…,n)都在直线y x+1上,∴这组样本数据完全正相关,故其相关系数为1,故选:D.9.【2011年新课标1文科06】有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为()【解答】解:由题意知本题是一个古典概型,试验发生包含的事件数是3×3=9种结果,满足条件的事件是这两位同学参加同一个兴趣小组,由于共有三个小组,则有3种结果,根据古典概型概率公式得到P,故选:A.10.【2010年新课标1文科14】设函数y=f(x)为区间(0,1]上的图象是连续不断的一条曲线,且恒有0≤f(x)≤1,可以用随机模拟方法计算由曲线y=f(x)及直线x=0,x=1,y=0所围成部分的面积S,先产生两组(每组N个),区间(0,1]上的均匀随机数x1,x2,…,x n和y1,y2,…,y n,由此得到N个点(x,y)(i﹣1,2…,N).再数出其中满足y1≤f(x)(i=1,2…,N)的点数N1,那么由随机模拟方法可得S的近似值为.【解答】解:方法一:∵∫01f(x)dx的几何意义是函数f(x)(其中0≤f(x)≤1)的图象与x轴、直线x=0和直线x=1所围成图形的面积,∴根据几何概型易知∫01f(x)dx.方法二:这种随机模拟的方法是在[0,1]内生成了N个点,而满足几条曲线围成的区域内的点是N1个,所以根据比例关系,而正方形的面积为1,所以随机模拟方法得到的面积为.故答案为:.11.【2019年新课标1文科17】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2.P(K2≥k)0.0500。

2018届高考数学(理)大一轮复习教师用书第十一章第三节随机事件的概率Word版含解析

2018届高考数学(理)大一轮复习教师用书第十一章第三节随机事件的概率Word版含解析

第三节随机事件的概率突破点(一) 随机事件的频率与概率1.事件的分类2.频率和概率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数,称事件A 出现的比例f n (A )=n An 为事件A 出现的频率.(2)对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率fn (A )稳定在某个常数上,把这个常数记作P (A ),称为事件A 的概率,简称为A 的概率.事件A A 多,它在A 的概率附近摆动幅度越来越小,即概率是频率的稳定值,因此在试验次数足够的情况下,给出不同事件发生的次数,可以利用频率来估计相应事件发生的概率.[典例](2017·湖北七市联考)某电子商务公司随机抽取 1 000名网络购物者进行调查.这1 000名购物者2015年网上购物金额(单位:万元)均在区间[0.3,0.9]内,样本分组为:[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7),[0.7,0.8),[0.8,0.9],购物金额的频率分布直方图如下:电子商务公司决定给购物者发放优惠券,其金额(单位:元)与购物金额关系如下:本节主要包括2个知识点: 1.随机事件的频率与概率;互斥事件与对立事件.(2)以这1 000名购物者购物金额落在相应区间的频率作为概率,求一个购物者获得优惠券金额不少于150元的概率.[解](1)购物者的购物金额x与获得优惠券金额y的频率分布如下表:这1 000名购物者获得优惠券金额的平均数为:50×400+100×300+150×280+200×201 000=96.(2)由获得优惠券金额y与购物金额x的对应关系,由(1)有P(y=150)=P(0.6≤x<0.8)=0.28,P(y=200)=P(0.8≤x≤0.9)=0.02,从而,获得优惠券金额不少于150元的概率为P(y≥150)=P(y=150)+P(y=200)=0.28+0.02=0.3.1.某超市随机选取1 000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(1)(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?解:(1)从统计表可以看出,在这1 000位顾客中有200位顾客同时购买了乙和丙,所以顾客同时购买乙和丙的概率可以估计为2001 000=0.2.(2)从统计表可以看出,在这1 000位顾客中有100位顾客同时购买了甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最多购买了2种商品,所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为100+2001 000=0.3.(3)与(1)同理,可得:顾客同时购买甲和乙的概率可以估计为2001 000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001 000=0.6,顾客同时购买甲和丁的概率可以估计为1001 000=0.1.所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.2.如图,A 地到火车站共有两条路径L 1和L 2,现随机抽取100位从A 地到火车站的人进行调查,调查结果如下:(2)分别求通过路径L 1和L 2所用时间落在上表中各时间段内的频率;(3)现甲、乙两人分别有40分钟和50分钟时间用于赶往火车站,为了尽最大可能在允许的时间内赶到火车站,试通过计算说明,他们应如何选择各自的路径.解:(1)共调查了100人,其中40分钟内不能赶到火车站的有12+12+16+4=44(人), 用频率估计概率,可得所求概率为0.44.(2)选择L 1的有60人,选择L 2的有40人,故由调查结果得所求各频率为(3)记事件A 1,A 2分别表示甲选择L 1和L 2时,在40分钟内赶到火车站;记事件B1,B2分别表示乙选择L1和L2时,在50分钟内赶到火车站.由(2)知P(A1)=0.1+0.2+0.3=0.6,P(A2)=0.1+0.4=0.5,P(A1)>P(A2),故甲应选择L1;P(B1)=0.1+0.2+0.3+0.2=0.8,P(B2)=0.1+0.4+0.4=0.9,P(B2)>P(B1),故乙应选择L2.突破点(二)互斥事件与对立事件1.概率的基本性质(1)概率的取值范围:0≤P(A)≤1.(2)必然事件的概率:P(A)=1.不可能事件的概率:P(A)=0.2.互斥事件和对立事件[例1](1)从1,2,3①恰有一个是偶数和恰有一个是奇数;②至少有一个是奇数和两个都是奇数;③至少有一个是奇数和两个都是偶数;④至少有一个是奇数和至少有一个是偶数.上述事件中,是对立事件的是()A.①B.②④C.③D.①③(2)设条件甲:“事件A与事件B是对立事件”,结论乙:“概率满足P(A)+P(B)=1”,则甲是乙的()A.充分不必要条件B.必要不充分条件C.充要条件D.既不充分也不必要条件(3)在5张电话卡中,有3张移动卡和2张联通卡,从中任取2张,若事件“2张全是移动卡”的概率是310,那么概率是710的事件是()A.至多有一张移动卡B.恰有一张移动卡C.都不是移动卡D.至少有一张移动卡[解析](1)③中“至少有一个是奇数”即“两个奇数或一奇一偶”,而从1~7中任取两个数根据取到数的奇偶性可认为共有三个事件:“两个都是奇数”、“一奇一偶”、“两个都是偶数”,故“至少有一个是奇数”与“两个都是偶数”是对立事件,易知其余都不是对立事件.(2)若事件A与事件B是对立事件,则A∪B为必然事件,再由概率的加法公式得P(A)+P(B)=1,充分性成立.设掷一枚硬币3次,事件A:“至少出现一次正面”,事件B:“3次出现正面”,则P(A)=78,P(B)=18,满足P(A)+P(B)=1,但A,B不是对立事件,必要性不成立.故甲是乙的充分不必要条件.(3)“至多有一张移动卡”包含“一张移动卡,一张联通卡”,“两张全是联通卡”两个事件,它是“2张全是移动卡”的对立事件,其概率为1-310=710.[答案](1)C(2)A(3)A[方法技巧]事件间的关系的判断方法(1)判断事件间的关系时,可把所有的试验结果写出来,看所求事件包含哪几个试验结果,从而断定所给事件间的关系.(2)对立事件一定是互斥事件,也就是说不互斥的两个事件一定不是对立事件,在确定了两个事件互斥的情况下,就要看这两个事件的和事件是不是必然事件,这是判断两个事件是否为对立事件的基本方法.判断互斥事件、对立事件时,注意事件的发生与否都是对于同一次试验而言的,不能在多次试验中判断.(3)从集合的角度上看:事件A,B对应的基本事件构成了集合A,B,则A,B互斥时,A ∩B =∅;A ,B 对立时,A ∩B =∅且A ∪B =Ω(Ω为全集).两事件互斥是两事件对立的必要不充分条件.互斥事件、对立事件的概率[例2] 某商场有奖销售中,购满100元商品得1张奖券,多购多得.1 000张奖券为一个开奖单位,设特等奖1个,一等奖10个,二等奖50个.设1张奖券中特等奖、一等奖、二等奖的事件分别为A ,B ,C ,求:(1)P (A ),P (B ),P (C ); (2)1张奖券的中奖概率;(3)1张奖券不中特等奖且不中一等奖的概率. [解] (1)P (A )=11 000,P (B )=101 000=1100,P (C )=501 000=120. 故事件A ,B ,C 的概率分别为11 000,1100,120.(2)1张奖券中奖包含中特等奖、一等奖、二等奖.设“1张奖券中奖”这个事件为M ,则M =A ∪B ∪C .因为A ,B ,C 两两互斥,所以P (M )=P (A ∪B ∪C )=P (A )+P (B )+P (C ) =1+10+501 000=611 000.故1张奖券的中奖概率为611 000.(3)设“1张奖券不中特等奖且不中一等奖”为事件N ,则事件N 与“1张奖券中特等奖或中一等奖”为对立事件,所以P (N )=1-P (A ∪B )=1-⎝⎛⎭⎫11 000+1100=9891 000. 故1张奖券不中特等奖且不中一等奖的概率为9891 000.[方法技巧]求复杂互斥事件概率的两种方法(1)直接求解法:将所求事件的概率分解为一些彼此互斥的事件的概率的和;(2)间接法:先求该事件的对立事件的概率,再由P (A )=1-P (A )求解.当题目涉及“至多”“至少”型问题时,多考虑间接法.能力练通 抓应用体验的“得”与“失”1.[考点一]把红、黑、蓝、白4张纸牌随机地分发给甲、乙、丙、丁四个人,每人分得1张,事件“甲分得红牌”与事件“乙分得红牌”是( )A .对立事件B .不可能事件C .互斥事件但不是对立事件D .以上答案都不对解析:选C 由互斥事件和对立事件的概念可判断,应选C.2.[考点一]抽查10件产品,设事件A 为“至少有2件次品”,则事件A 的对立事件为( )A .至多有2件次品B .至多有1件次品C .至多有2件正品D .至少有2件正品解析:选B 因为“至少有n 个”的反面是“至多有n -1个”,又因为事件A 为“至少有2件次品”,所以事件A 的对立事件为“至多有1件次品”.3.[考点二]口袋中有100个大小相同的红球、白球、黑球,其中红球45个,从口袋中摸出一个球,摸出白球的概率为0.23,则摸出黑球的概率为( )A .0.45B .0.67C .0.64D .0.32解析:选D 由题可知,摸出红球的概率为0.45,摸出白球的概率为0.23,故摸出黑球的概率P =1-0.45-0.23=0.32.4.[考点二]围棋盒子中有多粒黑子和白子,已知从中取出2粒都是黑子的概率为17,都是白子的概率是1235.则从中任意取出2粒恰好是同一色的概率是( )A.17B.1235C.1735D .1解析:选C 设“从中取出2粒都是黑子”为事件A ,“从中取出2粒都是白子”为事件B ,“任意取出2粒恰好是同一色”为事件C ,则C =A ∪B ,且事件A 与B 互斥.所以P (C )=P (A )+P (B )=17+1235=1735.即任意取出2粒恰好是同一色的概率为1735.5.[考点二]某超市为了了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.(1)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值;(2)求一位顾客一次购物的结算时间不超过2分钟的概率.(将频率视为概率)解:(1)由已知得25+y +10=55,x +30=45,所以x =15,y =20.该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为1×15+1.5×30+2×25+2.5×20+3×10100=1.9(分钟).(2)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,A 1,A 2分别表示事件“该顾客一次购物的结算时间为2.5分钟”,“该顾客一次购物的结算时间为3分钟”,将频率视为概率得P (A 1)=20100=15,P (A 2)=10100=110.则P (A )=1-P (A 1)-P (A 2)=1-15-110=710.故一位顾客一次购物的结算时间不超过2分钟的概率为710.[全国卷5年真题集中演练——明规律] 1.(2016·全国甲卷)某险种的基本保费为a (单位:元),继续购买该保险的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:(1)记A )的估计值; (2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P (B )的估计值;(3)求续保人本年度平均保费的估计值.解:(1)事件A 发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为60+50200=0.55,故P (A )的估计值为0.55.(2)事件B 发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为30+30200=0.3,故P (B )的估计值为0.3.(3)由所给数据得调查的200名续保人的平均保费为0.85a ×0.30+a ×0.25+1.25a ×0.15+1.5a ×0.15+1.75a ×0.10+2a ×0.05=1.192 5a . 因此,续保人本年度平均保费的估计值为1.192 5a .2.(2015·新课标全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.B 地区用户满意度评分的频数分布表满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(1)B地区用户满意度评分的频率分布直方图如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.[课时达标检测] 重点保分课时——一练小题夯双基,二练题点过高考[练基础小题——强化运算能力]1.从装有2个红球和2个黑球的口袋内任取2个球,那么互斥而不对立的两个事件是( )A .“至少有一个黑球”与“都是黑球”B .“至少有一个黑球”与“都是红球”C .“至少有一个黑球”与“至少有一个红球”D .“恰有一个黑球”与“恰有两个黑球”解析:选D A 中的两个事件是包含关系,不是互斥事件;B 中的两个事件是对立事件;C 中的两个事件都包含“一个黑球一个红球”的事件,不是互斥关系;D 中的两个事件是互斥而不对立的关系.2.在一次随机试验中,彼此互斥的事件A ,B ,C ,D 的概率分别为0.2,0.2,0.3,0.3,则下列说法正确的是( )A .A ∪B 与C 是互斥事件,也是对立事件 B .B ∪C 与D 是互斥事件,也是对立事件 C .A ∪C 与B ∪D 是互斥事件,但不是对立事件 D .A 与B ∪C ∪D 是互斥事件,也是对立事件解析:选D 由于A ,B ,C ,D 彼此互斥,且A ∪B ∪C ∪D 是一个必然事件,故其事件的关系可由如图所示的Venn 图表示,由图可知,任何一个事件与其余3个事件的和事件必然是对立事件,任何两个事件的和事件与其余两个事件的和事件也是对立事件.3.甲、乙两人下棋,和棋的概率为12,乙获胜的概率为13,则下列说法正确的是( )A .甲获胜的概率是16B .甲不输的概率是12C .乙输了的概率是23D .乙不输的概率是12解析:选A “甲获胜”是“和棋或乙获胜”的对立事件,所以“甲获胜”的概率是P =1-12-13=16,故A 正确;“乙输了”等于“甲获胜”,其概率为16,故C 不正确;设事件A 为“甲不输”,则A 是“甲胜”、“和棋”这两个互斥事件的并事件,所以P (A )=16+12=23或设事件A 为“甲不输”,则A 是“乙获胜”的对立事件,所以P (A )=1-13=23,故B 不正确;同理,“乙不输”的概率为56,故D 不正确.4.某城市2016年的空气质量状况如下表所示:100<T ≤150时,空气质量为轻微污染,则该城市2016年空气质量达到良或优的概率为________.解析:由题意可知2016年空气质量达到良或优的概率为P =110+16+13=35.答案:355.口袋内装有一些除颜色不同之外其他均相同的红球、白球和黑球,从中摸出1个球,摸出红球的概率是0.42,摸出白球的概率是0.28,若红球有21个,则黑球有________个.解析:摸到黑球的概率为1-0.42-0.28=0.3.设黑球有n 个,则0.4221=0.3n ,故n =15.答案:15[练常考题点——检验高考能力]一、选择题1.某产品分甲、乙、丙三级,其中乙、丙两级均属次品,在正常生产情况下,出现乙级品和丙级品的概率分别是5%和3%,则抽检一个产品是正品(甲级)的概率为( )A .0.95B .0.97C .0.92D .0.08解析:选C 记抽检的产品是甲级品为事件A ,是乙级品为事件B ,是丙级品为事件C ,这三个事件彼此互斥,因而所求概率为P (A )=1-P (B )-P (C )=1-5%-3%=92%=0.92.2.容量为20的样本数据,分组后的频数如下表:A .0.35B .0.45C .0.55D .0.65解析:选B 数据落在[10,40)的概率为2+3+420=920=0.45,故选B.3.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A .134石B .169石C .338石D .1 365石解析:选B 这批米内夹谷约为28254×1 534≈169石,故选B.4.从某校高二年级的所有学生中,随机抽取20人,测得他们的身高(单位:cm)分别为:162,153,148,154,165,168,172,171,173,150, 151,152,160,165,164,179,149,158,159,175.根据样本频率分布估计总体分布的原理,在该校高二年级的所有学生中任抽一人,估计该生的身高在155.5 cm ~170.5 cm 之间的概率约为( )A.25B.12C.23D.13解析:选A 从已知数据可以看出,在随机抽取的这20位学生中,身高在155.5 cm ~170.5 cm 之间的学生有8人,频率为25,故可估计在该校高二年级的所有学生中任抽一人,其身高在155.5 cm ~170.5 cm 之间的概率约为25.5.若随机事件A ,B 互斥,A ,B 发生的概率均不等于0,且P (A )=2-a ,P (B )=4a -5,则实数a 的取值范围是( )A.⎝⎛⎭⎫54,2B.⎝⎛⎭⎫54,32 C.⎣⎡⎦⎤54,32D.⎝⎛⎦⎤54,43解析:选D由题意可得⎩⎪⎨⎪⎧0<P (A )<1,0<P (B )<1,P (A )+P (B )≤1,即⎩⎪⎨⎪⎧0<2-a <1,0<4a -5<1,3a -3≤1,解得54<a ≤43.6.做掷一个骰子的试验,事件A 表示“小于5的偶数点出现”,事件B 表示“小于5的点数出现”,则一次试验中,事件A +B -发生的概率为( )A.13B.12C.23D.56解析:选C 由于基本事件总数为6,故P (A )=26=13,P (B )=46=23,从而P (B -)=1-P (B )=1-23=13,又A 与B -互斥,故P (A +B -)=P (A )+P (B -)=13+13=23.故选C.二、填空题7.已知某台纺纱机在1小时内发生0次、1次、2次断头的概率分别是0.8,0.12,0.05,则这台纺纱机在1小时内断头不超过两次的概率和断头超过两次的概率分别为________,________.解析:断头不超过两次的概率P 1=0.8+0.12+0.05=0.97.于是,断头超过两次的概率P 2=1-P 1=1-0.97=0.03.答案:0.97 0.038.2014年6月,一篇关于“键盘侠”的时评引发了大家对“键盘侠”的热议(“键盘侠”一词描述了部分网民在现实生活中胆小怕事、自私自利,却习惯在网络上大放厥词的一种现象).某地新闻栏目对该地区群众对“键盘侠”的认可程度进行调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度,若该地区有9 600人,则可估计该地区对“键盘侠”持反对态度的有________人.解析:在随机抽取的50人中,持反对态度的频率为1-1450=1825,则可估计该地区对“键盘侠”持反对态度的有9 600×1825=6 912(人).答案:6 9129.现有10个数,它们能构成一个以1为首项,-3为公比的等比数列,若从这10个数中随机抽取一个数,则它小于8的概率是________.解析:由题意得a n =(-3)n -1,易知前10项中奇数项为正,偶数项为负,所以小于8的项为第一项和偶数项,共6项,即6个数,所以P =610=35. 答案:3510.若A ,B 互为对立事件,其概率分别为P (A )=4x ,P (B )=1y ,则x +y 的最小值为________.解析:由题意,x >0,y >0,4x +1y =1.则x +y =(x +y )·⎝⎛⎭⎫4x +1y =5+⎝⎛⎭⎫4y x +x y ≥9,当且仅当x =2y 时等号成立,故x +y 的最小值为9.答案:9 三、解答题11.某河流上的一座水力发电站,每年六月份的发电量Y (单位:万千瓦时)与该河上游在六月份的降雨量X (单位:毫米)有关.据统计,当X =70时,Y =460;X 每增加10,Y 增加5.已知近20年X的值为140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160.(1)完成如下的频率分布表: 近20年六月份降雨量频率分布表(2)率,求今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率.解:(1)在所给数据中,降雨量为110毫米的有3个,为160毫米的有7个,为200毫米的有3个.故近20年六月份降雨量频率分布表为(2)由已知可得Y =X2+425,故P (“发电量低于490万千瓦时或超过530万千瓦时”) =P (Y <490或Y >530)=P (X <130或X >210) =P (X =70)+P (X =110)+P (X =220) =120+320+220=310. 故今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率为310.12.某人在如图所示的直角边长为4米的三角形地块的每个格点(指纵、横直线的交叉点以及三角形的顶点)处都种了一株相同品种的作物.根据历年的种植经验,一株该种作物的年收获量 Y (单位:kg)与它的“相近”作物株数X 之间的关系如下表所示:1米.(1)完成下表,并求所种作物的平均年收获量;(2)的概率.解:(1)所种作物的总株数为1+2+3+4+5=15,其中“相近”作物株数为1的作物有2株,“相近”作物株数为2的作物有4株,“相近”作物株数为3的作物有6株,“相近”作物株数为4的作物有3株.列表如下:所种作物的平均年收获量为51×2+48×4+45×6+42×315=102+192+270+12615=69015=46.(2)由(1)知,P(Y=51)=215,P(Y=48)=415.故在所种作物中随机选取一株,它的年收获量至少为48 kg的概率为P(Y≥48)=P(Y=51)+P(Y=48)=215+415=25.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题十一 概率与统计
第三十三讲 回归分析与独立性检验
一、选择题
1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关
系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相
关关系,设其回归直线方程为ˆˆˆy bx a =+.已知101
225i i x ==∑,10
1
1600i i y ==∑,ˆ4b =.该
班某学生的脚长为24,据此估计其身高为
A .160
B .163
C .166
D .170
2.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户
家庭,得到如下统计数据表:
根据上表可得回归本线方程ˆˆˆy
bx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为
A .11.4万元
B .11.8万元
C .12.0万元
D .12.2万元 3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =,
则由该观测数据算得的线性回归方程可能为
A .0.4 2.3y x =+
B .2 2.4y x =-
C .29.5y x =-+
D .0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据
得到的回归方程为ˆy
bx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b > 5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不
全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线1
12
y x =+上,则这组样本数据的样本相关系数为
A .−1
B .0
C .1
2
D .1
6.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关
系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是
7.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关
系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )
C .若该大学某女生身高增加1cm ,则其体重约增加0.85kg
D .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表
根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销
售额为
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
二、解答题
9.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)
的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模
型①:ˆ30.413.5=-+y
t ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+y
t . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)
的折线图
(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化
处理量.
附注:参考数据:
7
1
9.32i
i y
==∑,7
1
40.17i i i t y ==∑
0.55=
≈2.646.
参考公式:相关系数()()
n
i i
t t y y r --=
∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:
1
2
1
()()
()n
i
i i n
i
i t
t y y b t
t ==--=
-∑∑,=.a y bt -
11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单
位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···
,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中i w =w =
18
8
1
i i w =∑.
(Ⅰ)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年
宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;
(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回
答下列问题:
(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?
附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅,(,)n n u v ,其回归线v u αβ=+的斜率和
截距的最小二乘估计分别为
1
2
1
()()
ˆ()
n
i
i
i n
i
i u u v v u u β
==--=-∑∑,ˆˆv u α
β=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数
据如下表:
(Ⅰ)求y 关于t 的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收
入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:
()()
()
1
2
1
n
i
i i n
i i t
t
y y b t t ∧
==--=
-∑∑,ˆˆa
y bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取
了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(I )根据已知条件完成下面22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?
(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育
迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
2
1212
211222112
)(++++-=
n n n n n n n n n χ, 附:。

相关文档
最新文档