专题18 统计与统计案例(命题猜想)-2016年高考数学(理)命题猜想与仿真押题(原卷版)

合集下载

2016届高考数学理命题猜想专题18统计与统计案例(解析版)

2016届高考数学理命题猜想专题18统计与统计案例(解析版)

【命题热点突破一】抽样方法某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x ,某件产品A 被抽到的概率为y ,则x ,y 的值分别为( )A .25,14B .20,16 C .25,1600 D .25,16 【【答案】】D【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.【变式探究】从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.【【答案】】74【【解析】】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.【命题热点突破二】用样本估计总体(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图18-3所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )图18-3A .91,91.5B .91,92C .91.5,91.5D .91.5,92(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.【【答案】】(1)C(2)6912【特别提醒】统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.【变式探究】(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图18-4所示,则原始的茎叶图可能是()图18-5(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图18-6所示,数据分组依次如下:[70,90),[90,110),[110,130),[130,150].估计该班数学成绩的平均分数为()图18-6A.112B.114C.116D.120【【答案】】(1)B(2)B【命题热点突破三】统计案例例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).(1)应收集多少名女生的样本数据?(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图18-7所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)结合列联表可得K 2的观测值k =300×(165×30-45×60)75×225×210×90=10021≈4.762>3.841. 所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.【特别提醒】 在计算K 2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.【变式探究】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y 之间的关系.(1)求小李这5天的平均投篮命中率;(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率. 解:(1)小李这5天的平均投篮命中率y -= 0.4+0.5+0.6+0.6+0.45=0.5.(2)易知x -=1+2+3+4+55=3, 设线性回归方程为y ^=b ^x +a ^,则由公式可得b ^==(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)(-2)2+(-1)2+02+12+22=0.01,所以a ^=y --b ^x -=0.5-0.01×3=0.47, 所以y ^=b ^x +a ^=0.01x +0.47.当x =6时,y ^=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.【特别提醒】 回归直线一定过样本点的中心(x ,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.【高考真题解读】1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .167B .137C .123D .93【答案】 B2.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 【答案】 C【解析】 法一 由题意知,x 1+x 2+…+x 10=10x ,s 1则y =1n [(2x 1-1)+(2x 2-1)+…+(2x 10-1)] =1n[2(x 1+x 2+…+x 10)-n]=2x -1,所以S 2==2s 1,故选C.3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )01228 9 2 5 80 0 03 3 8 1 2A .19B .20C .21.5D .23【答案】 B4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 【答案】 D【解析】从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y∧=b∧x+a∧,其中b∧=0.76,a∧=y-b∧x.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元【答案】B6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A .6B .8C .12D .18 【答案】 C【解析】 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有200.40=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12.7.(2014·陕西,9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a ,4B .1+a ,4+aC .1,4D .1,4+a【答案】 A8.(2014·湖南,2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3【答案】 D【解析】 因为采取简单随机抽样、系统抽样和分层抽取样本时,总体中每个个体被抽中的概率相等,故选D.9.(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A .200,20B .100,20C .200,10D .100,10【答案】A10.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.【答案】 60【解析】 420×300=60(名).11.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】 6【解析】 这组数据的平均数为16(4+6+5+8+7+6)=6.12.(2015·湖南,12)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:1314150 0 3 4 5 6 6 8 8 91 1 12 2 23 34 45 5 56 678 0 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.【答案】 41 3.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。

2016届高考数学三轮讲练测核心热点总动员(新课标版)专题18概率与统计大题(理)(原卷版)

2016届高考数学三轮讲练测核心热点总动员(新课标版)专题18概率与统计大题(理)(原卷版)

【名师精讲指南篇】【高考真题再现】1.【2013⋅新课标全国】一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为,且各件产品是否为优质品相互独立(1)求这批产品通过检验的概率;(2)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X (单位:元),求X 的分布列及数学期望.2.【2014高考全国1】 从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下图频率分布直方图:(I )求这500件产品质量指标值的样本平均值x 和样本方差2s (同一组的数据用该组区间的中点值作代表);(II )由直方图可以认为,这种产品的质量指标Z 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(i )利用该正态分布,求()187.8212.2P Z <<;(ii )某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间()187.8,212.2的产品件数.利用(i )的结果,求EX .12.2≈若()2~,Z N μσ则()0.6826P Z μσμσ-<<+=,()220.9544P Z μσμσ-<<+=.3.【2014新课标Ⅱ理)】某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数( (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121niii ni i t t y y b t t ==--=-∑∑,ˆˆay bt =-. 4.【2015全国Ⅱ理18】某公司为了解用户对其产品的满意度,从,A B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:7383 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C :“A 地区用户的满意度等级高于B 地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率. 5.【2015全国Ⅰ理19】某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋅⋅⋅数据作了初步处理,得到下面的散点图及一些统计量的值.年销售量/t 年宣传费/千元366206005805605405205004805654525048464442403834表中i w =,8118i i w w ==∑,(1)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系式0.2z y x =-,根据(2)的结果回答下列问题:①年宣传费49x =时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ()22,u v ,⋅⋅⋅,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆv u αβ=-. 【热点深度剖析】1.纵观2013年和2014年2015年的高考题对本热点的考查,可以发现概率和统计、统计案例相结合是高考命题的热点,在2012年高考中,结合实际问题将函数和概率问题巧妙结合在一起,新颖别致,但是题目难度不大,这也体现了“新题不难”的命题特点,主要考查生活中的概率统计知识和方法.求离散型随机变量的分布列和数学期望的方法,以及生活中最大利润的判断;2013年考查相互独立事件的概率计算、离散型随机变量的分布列、期望,考查学生的逻辑推理能力以及基本运算能力;2014年主要考查了频率分布直方图,正态分布的3 原则,二项分布的期望及回归分析.2015年分别考查了回归分析、茎叶图。

2016年高考地理命题猜想与仿真押题 (仿真押题)(解析版)专题03 水体运动规律 含解析

2016年高考地理命题猜想与仿真押题 (仿真押题)(解析版)专题03 水体运动规律 含解析

读“江西省南部某小流域水循环示意图”,完成1~2题。

1.对该地区河流水文状况影响最小的因素是( )A。

土地开发利用状况及规模B.气温日变化及其年变化C。

土壤类型及地形坡度D.降水量大小及降水强度2。

下列叙述正确的是()A。

影响地表径流的主导因素是地形地势、人类活动B.影响水汽蒸发的主导因素是洋流性质、海陆位置C。

影响水汽输送的主导因素是大气环流、太阳辐射D。

影响大气降水的主导因素是海陆位置、纬度高低答案1。

B 2。

CL湖原是新疆最大的淡水湖,近年来已演变成微咸水湖.现在该湖西部沿岸芦苇广布,而东部沿岸几乎没有.下图示意L湖及周边地区,读图回答3~4题。

3。

正确描述甲、乙两河与L湖相互关系的是()A。

甲河秋季输入L湖泥沙最多B。

甲河流量变化深受L湖影响C.乙河对L湖具有排盐作用D.乙河主要靠大气降水补给为主4.有关L湖及其周边自然环境叙述不正确的是()A。

L湖最高水位出现在夏季,最低水位出现在冬季B。

L湖水位近年来有不断下降趋势C.L湖及其周边地区气候干旱,物理风化显著D。

L湖流域内降水丰富,河流发育好答案 3.C 4。

D海绵城市,是能够像海绵一样吸水的城市.就是在城市小区里布置若干地块,用吸水材料建设(如图),作为海绵体,暴雨的时候就作为蓄水的地方,那些被海绵体充分吸收的雨水还可以再次利用,如浇花、洗车等,在一定程度上缓解水资源紧张局面.据此回答5~6题。

5。

“海绵城市"最主要是改变了水循环环节中的()A。

径流B。

降水 C.下渗D。

蒸腾(蒸发)6.“海绵城市”的建设有利于( )①缓解城市缺水问题②补充地下水③延长径流集聚时间④解决城市内涝问题A.①②B。

②③ C.③④ D.①④答案 5.C 6.A下图为“理想大陆周围洋流分布的模式图",读图回答7~8题。

7。

正确反映“中低纬度海区逆时针方向流动”规律的洋流是()A。

③④B。

④⑤C。

⑤⑥D。

③⑤8。

有关洋流对地理环境的影响,正确的说法有()A.同纬度地区,冬季①沿岸气温低于②B.在寒暖流交汇的海区,如①③交汇区都形成重要渔场C。

2016届高考数学理仿真押题专题18统计与统计案例(解析版)

2016届高考数学理仿真押题专题18统计与统计案例(解析版)

1.某全日制大学共有学生5400人,其中专科生有1500人,本科生有3000人,研究生有900人.现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本容量为180,则应在专科生、本科生与研究生这三类学生中分别抽取( ) A .55人,80人,45人 B .40人,100人,40人 C .60人,60人,60人 D .50人,100人,30人【答案】D2.在某中学生歌手比赛现场上,7位评委为某选手打出的分数的茎叶统计图如图Z18-1所示,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( ) A .5和1.6 B .85和1.6 C .85和0.4 D .5和0.4 【答案】B3.某车间为了规定工时定额,需要确定加工一个零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法得回归方程y ^=0.67x +54.9.现发现表中有一个数据看不清,请你推断出该数据为( ) A .67 B .68 C .69 D .70 【答案】B【解析】 由表易知x =10+20+30+40+505=30,而回归直线必过点(x ,y),则y =0.67×30+54.9=75.设模糊的数据为a ,则a +62+75+81+895=75,解得a =68.4.某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,若从初中生中抽取了30人,则n =________. 【答案】100【解析】 由题易知n 3500+1500=301500,解得n =100.5.为了考查是否喜欢运动与性别的关系,得到一个2×2列联表,经计算得K 2的观测值k =6.697,则有________%以上的把握认为是否喜欢运动与性别有关. 【答案】99【解析】 根据独立性检验的临界值表可得.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的直方图如图所示,假设得分的中位数为m e ,众数为m 0,平均数为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x 【答案】D7.给出下列四个命题:①质检员每隔10分钟从匀速传递的产品生产流水线上抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②将一组数据中的每个数据都加上同一个常数后,方差不变;③设随机变量ξ服从正态分布N(0,1),若P(ξ≥1)=p ,则P(-1<ξ<0)=12-p ; ④在回归直线方程y ^=0.1x +10中,当x 每增加1个单位时,y ^平均增加0.1个单位. 其中真命题的个数是( ) A .1 B .2 C .3 D .4 【答案】C8.已知总体中各个个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a ,b 的取值分别是( ) A .10,11 B .10.5,10.5 C .10,10 D .10,12 【答案】B【解析】 根据中位数的定义可知a +b2=10.5,故总体的平均数为2+3+3+7+10.5+10.5+12+13.7+18.3+2010=10.要使方差最小,只需(a -10)2+(b -10)2最小,即(a -10)2+(11-a)2最小,即2a 2-42a +221最小,当a =--422×2=10.5时,2a 2-42a +221最小,此时b =21-10.5=10.5.9.某种产品的广告支出x 与销售额y(单位:万元)之间有如下对应数据:根据上表可得回归直线方程y ^=b ^x +a ^中的b ^为6.5.若要使销售额不低于100万元,则至少需要投入广告费为(x 为整数)( ) A .10万元 B .11万元 C .12万元 D .13万元 【答案】D【解析】 因为x =5,y =50,所以50=6.5×5+a ^,解得a ^=17.5,所以回归直线方程为y ^=6.5x +17.5.由6.5x +17.5≥100,解得x≥16513,因为x 为整数,所以至少需要投入广告费为13万元. 10.从气象意义上来说春季进入夏季的标志为:连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数): ①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.4. 则肯定进入夏季的地区为( ) A .甲、乙、丙 B .甲、丙 C .乙、丙 D .甲 【答案】B11.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y ^=b ^x +a ^,根据中间两组数据(4,3)和(5,4)求得的直线方程为y =bx +a ,则b ^________b ,a ^________a .(填“>”或“<”) 【答案】< >【解析】 方法一:画出散点图,粗略估计回归直线的位置,再画出过点(4,3),(5,4)的直线,如图所示.由图易知b ^<b ,a ^>a.方法二:由公式可得b ^=0.7,a ^=0.35.由题意可得b =1,a =-1,所以b ^<b ,a ^>a.12.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1000户.从普通家庭中用简单随机抽样的方法抽取990户,从高收入家庭中用简单随机抽样的方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,请估计该地拥有3套或3套以上住房的家庭所占的比例是________.【答案】5.7%13.一个容量为20的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8且前4项和S 4=28,则此样本数据的平均数和中位数分别是________. 【答案】23,23【解析】 设公差为d ,则a 1+2d =8,4a 1+6d =28,解得a 1=4,d =2,所以此样本数据的中位数是a 10+a 112=a 1+192d =4+19=23,平均数是S 2020=a 1+192d =23.14.某校在一次期末考试中,全校学生的数学成绩都介于60分到140分之间(满分150分),为了估计该校学生的数学考试情况,从该校2000名学生的数学成绩中随机抽取50名学生的数学成绩,将统计结果按如下方式分成八组:第一组[60,70),第二组[70,80),……,第八组[130,140].该图是按照上述分组得到的频率分布直方图的一部分. (1)求第七组的频率,并将频率分布直方图补充完整;(2)估计该校2000名学生这次考试的数学成绩的平均分(同一组数据使用中间值作代表); (3)估计该校在这次考试中数学成绩在[100,140]的人数.15.从某大学随机选取7名女大学生,其身高x(单位:cm)和体重y(单位:kg)的有关数据如下表:(1)求出回归方程; (2)利用(1)中的回归方程,分析这7名女大学生的身高和体重的变化,并预测一名身高为172 cm 的女大学生的体重.解:(1)易知x =163+164+165+166+167+168+1697=166, y =52+52+53+55+54+56+567=54. 设回归方程为y ^=b ^x +a ^,代入公式,经计算得b ^=0.75, a ^=y -b ^x =54-0.75×166=-70.5, 所以回归方程为y ^=0.75x -70.5.16.在一次数学测验后,班级学委对选答题的选题情况进行统计,如下表:(1)在统计结果中,如果把几何证明选讲和极坐标与参数方程称为“几何类”,把不等式选讲称为“代数类”,我们可以得到如下2×2列联表.能否认为选做“几何类”或“代数类”与性别有关,若有关,你有多大的把握?(2)在原始统计结果中,如果不考虑性别因素,按分层抽样的方法从选做不同选答题的同学中随机选出7名同学进行座谈.已知这名学委和2名数学课代表都在选做“不等式选讲”的同学中.①求在这名学委被选中的条件下,2名数学课代表也被选中的概率; ②记抽取到数学课代表的人数为X ,求X 的分布列及数学期望E(X). 下面临界值表仅供参考:解:(1)由题意知K 2的观测值k =42×(16×12-8×6)24×18×20×22=25255≈4.582>3.841, 所以有95%的把握认为选做“几何类”或“代数类”与性别有关. (2)由题可知在选做“不等式选讲”的18名同学中,要选取3名同学. ①令事件A 为“这名学委被选中”,事件B 为“2名数学课代表被选中”,则P(AB)=C 33C 318,P(A)=C 217C 318,所以P(B|A)=P (AB )P (A )=C 33C 217=217×16=1136.17.某市积极倡导学生参与绿色环保活动,其中代号为“环保卫士——12369”的绿色环保活动小组对2014年全年的空气污染指数API 进行监测,下表是在这一年内随机抽取的100天的统计结果.(1)若该市某企业每天由空气污染造成的经济损失P (单位:元)与空气污染指数API (记为t )的关系为P =⎩⎪⎨⎪⎧0,0≤t≤100,4t -400,100<t≤300,1500,t>300,在这一年内随机抽取一天,估计该天经济损失P 在区间(200,600]内的概率;(2)若本次抽取的样本数据有30天是在供暖季节,其中有8天为重度污染,完成2×2列联表,并判断是否有95%的把握认为该市本年度空气重度污染与供暖有关.下面临界值表供参考:参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )。

2016届高考数学理命题猜想专题04算法、推理证明、排列、组合与二项式定理(解析版)

2016届高考数学理命题猜想专题04算法、推理证明、排列、组合与二项式定理(解析版)

命题猜想四 算法、推理证明、排列、组合与二项式定理【考向解读】1.高考中主要利用计数原理求解排列数、涂色、抽样问题,以小题形式考查;2.二项式定理主要考查通项公式、二项式系数等知识,近几年也与函数、不等式、数列交汇,值得关注.2.直接证明和间接证明的考查主要作为证明和推理数学命题的方法,常与函数、数列及不等式等综合命题.3.以选择题、填空题的形式考查古典概型、几何概型及相互独立事件的概率;4.二项分布、正态分布的应用是考查的热点;5.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.6.在概率与统计的交汇处命题,以解答题中档难度出现.【命题热点突破一】程序框图(1)(2015·全国卷Ⅰ)执行图 所示的程序框图,如果输入的t =0.01,则输出的n =( )A .5B .6C .7D .8(2)执行如图 所示的程序框图,其输出结果是( )A .-54 B.12 C.54 D .-12【答案】(1)C(2)A【解析】【感悟提升】程序框图中单纯的顺序结构非常简单,一般不出现在高考中,在高考中主要出现的是以“条件结构”和“循环结构”为主的程序框图.以“条件结构”为主的程序框图主要解决分段函数求值问题,以“循环结构”为主的程序框图主要解决数列求和、统计求和、数值求积等运算问题,这两种类型的程序框图中,关键因素之一就是“判断条件”,在解题中要切实注意判断条件的应用.【变式探究】某程序框图如图所示,若该程序运行后输出的S的值为72,则判断框内填入的条件可以是()A.n≤8? B.n≤9? C.n≤10? D.n≤11?【答案】A【解析】【命题热点突破二】合情推理与演绎推理例2、(1)(2015·山东卷)观察下列各式:C01=40;C03+C13=41;C05+C15+C25=42;C07+C17+C27+C37=43;……照此规律,当n∈N*时,C02n-1+C12n-1+C22n-1+…+C n-1=________.2n-1(2)我们把平面内与直线垂直的非零向量称为直线的法向量,在平面直角坐标系中,利用求动点轨迹方程的方法可以求出过点A(-2,3),且法向量为n=(-1,2)的直线方程为(-1)×(x +2)+2×(y-3)=0,化简得x-2y+8=0.类比上述方法,在空间直角坐标系中,经过点A(1,2,3),且法向量为n=(-1,2,-3)的平面的方程为________.【答案】(1)4n-1(2)x-2y+3z-6=0【解析】(1)归纳可知,C02n-1+C12n-1+C22n-1+…+C n-1=4n-1.2n-1(2)类比直线方程的求解方法,可得平面的方程为(-1)×(x-1)+2×(y-2)+(-3)×(z-3)=0,即x-2y+3z-6=0.【感悟提升】由特殊结论得出一般结论的推理是归纳推理,归纳出的一般性结论要包含已知的特殊结论;根据已有结论推断相似对象具有相应结论的推理就是类比推理.归纳和类比得出的结论未必正确,其正确性需要通过演绎推理进行证明.合情推理和演绎推理在解决数学问题中是相辅相成的.【变式探究】已知cos π3=12,cos π5cos 2π5=14,cos π7cos 2π7·cos 3π7=18,……根据以上等式,可猜想的一般结论是________________.【答案】cos π2n +1cos 2π2n +1…cos nπ2n +1=12n (n ∈N *) 【解析】从已知等式的左边来看,3,5,7,…是通项为2n +1的等差数列,等式的右边是通项为12n 的等比数列.由以上分析可以猜想出一般结论为cos π2n +1cos 2π2n +1…cos nπ2n +1=12n (n ∈N *).【命题热点突破三】排列与组合例3、四名大学生到三家企业应聘,每名大学生至多被一家企业录用,则每家企业至少录用一名大学生的情况有( )A .24种B .36种C .48种D .60种【答案】D【解析】每家企业至少录用一名大学生的情况有两类:一类是每家企业均只录用一名大学生,有C 34A 33=24(种);一类是其中有一家企业录用两名大学生,有C 24A 33=36(种).所以一共有24+36=60(种)情况.【感悟提升】解决排列组合问题的基本方法有直接法和间接法.直接法就是采用分类、分步的方法逐次求解,间接法是从问题的对立面求解.不论是直接法还是间接法,都要遵循“特殊元素、特殊位置优先考虑”的原则.注意几种典型的排列组合问题:相邻问题(捆绑法)、不相邻问题(插空法)、定序问题(组合法)、分组分配问题(先分组后分配)等.【变式探究】已知直线x a +y b =1(a ,b 是非零常数)与圆x 2+y 2=100有公共点,且公共点的横坐标和纵坐标均为整数,那么这样的直线有________条.【答案】60 【解析】【命题热点突破四】二项式定理例4、(1)(2015·天津卷)在⎝⎛⎭⎫x -14x 6的展开式中,x 2的系数为________. (2)若⎝⎛⎭⎫x 2-1x n 的展开式的二项式系数之和为64,则其常数项为( ) A .-20 B .-15 C .15 D .20【答案】(1)1516 (2)C【解析】【感悟提升】(1)二项式定理中最关键的是通项公式,求展开式中特定的项或者特定项的系数均是利用通项公式和方程思想解决的.(2) 二项展开式的系数之和通常是通过对二项式及其展开式中的变量赋值得出的,注意根据展开式的形式给变量赋值.【变式探究】(2015·全国卷Ⅱ)(a+x)(1+x)4的展开式中x的奇数次幂项的系数之和为32,则a=________.【答案】3【解析】(a+x)(1+x)4的展开式中x的奇数次幂项一部分来自第一个因式取a,第二个因式取C14x及C34x3;另一部分来自第一个因式取x,第二个因式取C04x0,C24x2及C44x4.所以系数之和为aC14+aC34+C04+C24+C44=8a+8=32,所以a=3.【高考真题解读】1.(2015·重庆,7)执行如图所示的程序框图,输出的结果为()A.(-2,2) B.(-4,0)C.(-4,-4) D.(0,-8)【答案】 B【解析】2.(2015·福建,6)阅读如图所示的程序框图,运行相应的程序,则输出的结果为( )A .2B .1C .0D .-1【答案】 C【解析】 当i =1,S =0进入循环体运算时,S =0,i =2;S =0+(-1)=-1,i =3;S =-1+0=-1,i =4;∴S =-1+1=0,i =5;S =0+0=0,i =6>5,故选C.3.(2015·北京,3)执行如图所示的程序框图,若输出k 的值为8,则判断框内可填入的条件是( )A .s ≤34B .s ≤56C .s ≤1112D .s ≤2524【答案】 C【解析】 由程序框图,k 的值依次为0,2,4,6,8,因此s =12+14+16=1112(此时k =6)还必须计算一次,因此可填s ≤1112,选C.4.(2015·新课标全国Ⅱ,8)下边程序框图的算法思路源于我国古代数学名著《九章算术》中的“更相减损术”.执行该程序框图,若输入的a ,b 分别为14,18,则输出的a =( )A .0B .2C .4D .14【答案】 B 【解析】5.(2015·山东,13)执行如图所示的程序框图,输出的T 的值为________.【答案】 116【解析】6.(2015·广东,12)某高三毕业班有40人,同学之间两两彼此给对方仅写一条毕业留言,那么全班共写了________条毕业留言(用数字作答).【答案】 1 560【解析】 依题两两彼此给对方写一条毕业留言相当于从40人中任选两人的排列数,所以全班共写了A 240=40×39=1 560条毕业留言.7.(2015·北京,9)在(2+x )5的展开式中,x 3的系数为________(用数字作答).【答案】 40【解析】 展开式通项为:T r +1=C r 525-r x r ,∴当r =3时,系数为C 35·25-3=40. 8.(2015·天津,12)在⎝⎛⎭⎫x -14x 6的展开式中,x 2的系数为________. 【答案】 1516【解析】 ⎝⎛⎭⎫x -14x 6的展开式的通项T r +1=C r 6x 6-r ⎝⎛⎭⎫-14x r =C r 6⎝⎛⎭⎫-14r x 6-2r ;当6-2r =2时,r =2,所以x 2的系数为C 26⎝⎛⎭⎫-142=1516. 9.(2015·四川,6)用数字0,1,2,3,4,5组成没有重复数字的五位数,其中比40 000大的偶数共有( )A .144个B .120个C .96个D .72个【答案】 B【解析】10. (2015·陕西,4)二项式(x +1)n (n ∈N +)的展开式中x 2的系数为15,则n =( )A .4B .5C .6D .7【答案】C【解析】 由题意易得:C n -2n =15,C n -2n =C 2n =15,即n (n -1)2=15,解得n =6.。

2016届高考数学理命题猜想专题04算法、推理证明、排列、组合与二项式定理(原卷版)

2016届高考数学理命题猜想专题04算法、推理证明、排列、组合与二项式定理(原卷版)

命题猜想四 算法、推理证明、排列、组合与二项式定理【考向解读】1.高考中主要利用计数原理求解排列数、涂色、抽样问题,以小题形式考查;2.二项式定理主要考查通项公式、二项式系数等知识,近几年也与函数、不等式、数列交汇,值得关注.2.直接证明和间接证明的考查主要作为证明和推理数学命题的方法,常与函数、数列及不等式等综合命题.3.以选择题、填空题的形式考查古典概型、几何概型及相互独立事件的概率;4.二项分布、正态分布的应用是考查的热点;5.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.6.在概率与统计的交汇处命题,以解答题中档难度出现.【命题热点突破一】程序框图(1)(2015·全国卷Ⅰ)执行图 所示的程序框图,如果输入的t =0.01,则输出的n =( )A .5B .6C .7D .8(2)执行如图 所示的程序框图,其输出结果是( )A .-54 B.12 C.54 D .-12【感悟提升】程序框图中单纯的顺序结构非常简单,一般不出现在高考中,在高考中主要出现的是以“条件结构”和“循环结构”为主的程序框图.以“条件结构”为主的程序框图主要解决分段函数求值问题,以“循环结构”为主的程序框图主要解决数列求和、统计求和、数值求积等运算问题,这两种类型的程序框图中,关键因素之一就是“判断条件”,在解题中要切实注意判断条件的应用.【变式探究】某程序框图如图所示,若该程序运行后输出的S的值为72,则判断框内填入的条件可以是()A.n≤8? B.n≤9? C.n≤10? D.n≤11?【命题热点突破二】合情推理与演绎推理例2、(1)(2015·山东卷)观察下列各式:C01=40;C03+C13=41;C05+C15+C25=42;C07+C17+C27+C37=43;……照此规律,当n∈N*时,=________.C02n-1+C12n-1+C22n-1+…+C n-12n-1(2)我们把平面内与直线垂直的非零向量称为直线的法向量,在平面直角坐标系中,利用求动点轨迹方程的方法可以求出过点A(-2,3),且法向量为n =(-1,2)的直线方程为(-1)×(x +2)+2×(y -3)=0,化简得x -2y +8=0.类比上述方法,在空间直角坐标系中,经过点A(1,2,3),且法向量为n =(-1,2,-3)的平面的方程为________.【感悟提升】由特殊结论得出一般结论的推理是归纳推理,归纳出的一般性结论要包含已知的特殊结论;根据已有结论推断相似对象具有相应结论的推理就是类比推理.归纳和类比得出的结论未必正确,其正确性需要通过演绎推理进行证明.合情推理和演绎推理在解决数学问题中是相辅相成的.【变式探究】已知cos π3=12,cos π5cos 2π5=14,cos π7cos 2π7·cos 3π7=18,……根据以上等式,可猜想的一般结论是________________.【命题热点突破三】排列与组合例3、四名大学生到三家企业应聘,每名大学生至多被一家企业录用,则每家企业至少录用一名大学生的情况有( )A .24种B .36种C .48种D .60种【感悟提升】解决排列组合问题的基本方法有直接法和间接法.直接法就是采用分类、分步的方法逐次求解,间接法是从问题的对立面求解.不论是直接法还是间接法,都要遵循“特殊元素、特殊位置优先考虑”的原则.注意几种典型的排列组合问题:相邻问题(捆绑法)、不相邻问题(插空法)、定序问题(组合法)、分组分配问题(先分组后分配)等.【变式探究】已知直线x a +y b =1(a ,b 是非零常数)与圆x 2+y 2=100有公共点,且公共点的横坐标和纵坐标均为整数,那么这样的直线有________条.【命题热点突破四】二项式定理例4、(1)(2015·天津卷)在⎝⎛⎭⎫x -14x 6的展开式中,x 2的系数为________. (2)若⎝⎛⎭⎫x 2-1x n 的展开式的二项式系数之和为64,则其常数项为( ) A .-20 B .-15 C .15 D .20【感悟提升】(1)二项式定理中最关键的是通项公式,求展开式中特定的项或者特定项的系数均是利用通项公式和方程思想解决的.(2) 二项展开式的系数之和通常是通过对二项式及其展开式中的变量赋值得出的,注意根据展开式的形式给变量赋值.【变式探究】(2015·全国卷Ⅱ)(a+x)(1+x)4的展开式中x的奇数次幂项的系数之和为32,则a=________.【高考真题解读】1.(2015·重庆,7)执行如图所示的程序框图,输出的结果为()A.(-2,2) B.(-4,0)C.(-4,-4) D.(0,-8)2.(2015·福建,6)阅读如图所示的程序框图,运行相应的程序,则输出的结果为()A.2 B.1 C.0 D.-13.(2015·北京,3)执行如图所示的程序框图,若输出k的值为8,则判断框内可填入的条件是()A .s ≤34B .s ≤56C .s ≤1112D .s ≤25244.(2015·新课标全国Ⅱ,8)下边程序框图的算法思路源于我国古代数学名著《九章算术》中的“更相减损术”.执行该程序框图,若输入的a ,b 分别为14,18,则输出的a =( )A .0B .2C .4D .145.(2015·山东,13)执行如图所示的程序框图,输出的T 的值为________.6.(2015·广东,12)某高三毕业班有40人,同学之间两两彼此给对方仅写一条毕业留言,那么全班共写了________条毕业留言(用数字作答).7.(2015·北京,9)在(2+x )5的展开式中,x 3的系数为________(用数字作答).8.(2015·天津,12)在⎝⎛⎭⎫x -14x 6的展开式中,x 2的系数为________. 9.(2015·四川,6)用数字0,1,2,3,4,5组成没有重复数字的五位数,其中比40 000大的偶数共有()A.144个B.120个C.96个D.72个10. (2015·陕西,4)二项式(x+1)n(n∈N+)的展开式中x2的系数为15,则n=()A.4 B.5 C.6 D.7。

【高考一本解决方案】2017版高考数学理科新课标版考题训练:专题十八 统计与统计案例.doc

1.(2016·山东,3,易)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.1401.D[考向2]由频率分布直方图可知,每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,所以每周的自习时间不少于22.5小时的人数是200×0.7=140. 2.(2016·课标Ⅲ,4,易)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个2.D平均最高气温高于20 ℃的为七、八月份,∴D错.3.(2013·安徽,5,易)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数3.C [考向1,3]五名男生成绩的平均数是x -男=86+94+88+92+905=90,五名女生成绩的平均数是x -女=88+93+93+88+935=91,五名男生成绩的方差是s 2男=15(16+16+4+4+0)=8, 五名女生成绩的方差是s 2女=15(9+4+4+9+4)=6, 由s 2男>s 2女知应该选C.4.(2014·山东,7,中)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .184.C [考向2]由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取志愿者200.40=50(人).所以第三组共有50×0.36=18(人),其中有疗效的人数为18-6=12.5.(2014·天津,9,易)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.5.[考向1]【解析】 一年级本科生人数占总人数的比例为44+5+5+6=420=15,所以应从一年级本科生中抽取的学生数为300×15=60.【答案】 606.(2015·湖南,12,易)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.6.[考向1,2]【解析】根据系统抽样原理,应将数据按照顺序分成7组,每组5人.区间[139,151]恰好包含第3组到第6组的数据,所以应该从中抽取4人.【答案】 47.(2014·江苏,6,易)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.7.[考向2]【解析】由频率分布直方图可知,在抽测的60株树木中,底部周长小于100 cm 的频率是(0.015+0.025)×10=0.4,所以底部周长小于100 cm的株数是60×0.4=24.【答案】248.(2016·四川,16,12分,中)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.8.[考向2]解:(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85.而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.9.(2015·广东,17,12分,中)某工厂36名工人的年龄数据如下表.(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的平均值x -和方差s 2;(3)36名工人中年龄在x --s 与x -+s 之间有多少人?所占的百分比是多少(精确到0.01%)? 9.[考向3]解:(1)依题意所抽样本编号是一个首项为2,公差为4的等差数列,故其所有样本编号依次为2,6,10,14,18,22,26,30,34,对应样本的年龄数据依次为44,40,36,43,36,37,44,43,37. (2)由(1)可得其样本的平均值为x -=44+40+36+43+36+37+44+43+379=40,方差为s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=19[42+02+(-4)2+32+(-4)2+(-3)2+42+32+(-3)2]=1009. (3)由(2)知s =103,∴x --s =3623,x -+s =4313,∴年龄在x --s 与x -+s 之间共有23人,所占百分比为2336≈63.89%.10.(2015·课标Ⅱ,18,12分,中)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 8276 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 7665 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C :“A 地区用户的满意度等级高于B 地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.10.[考向2,3]解:(1)两地区用户满意度评分的茎叶图如下:通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散. (2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”;C B2表示事件:“B 地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C =(C B1C A1)∪(C B2C A2). P(C)=P((C B1C A1)∪(C B2C A2)) =P(C B1C A1)+P(C B2C A2) =P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.高考中以考查分层抽样和系统抽样为主,一般以选择题或填空题的形式出现,难度较小,为容易题,分值为5分.对于分层抽样,主要考查各组中样本数的计算,即样本容量与总体容量成比例的特性;系统抽样则主要考查分组数和由第一组中抽取的样本推算其他各组应抽取的样本,即等距离的特性.1(1)(2012·山东,4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C.则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15(2)(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .200,20B .100,20C .200,10D .100,10【解析】 (1)由题意,可知系统抽样中每一组的样本数为96032=30,因为第一组抽取的样本号码为9,所以第k 组抽取的号码为9+30×(k -1).由451≤9+30×(k -1)≤750,得16≤k≤25(k ∈Z),所以k =16,17,…,25,共10个,即应该有10人做问卷B.(2)由题意知,该地区中小学生共有10 000名,故样本容量为10 000×2%=200.由分层抽样知应抽取的高中生人数为200×2 00010 000=40,其中近视人数为40×50%=20.【答案】 (1)C (2)A解题(1)的关键是掌握系统抽样的原理及步骤;题(2)在扇形统计图中,根据抽取的比例计算样本容量,根据条形统计图计算抽取的高中生近视人数.1.(2013·陕西,4)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .141.B 由系统抽样原理,应分成42组,第一组1-20,第二组21-40,…,第42组821-840.区间[481,720]包含481-500,501-520,…,701-720共12组,所以抽取的42人中,编号在该区间内的共有12人.2.(2016·重庆巴蜀一模,5)一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( ) A .12,24,15,9 B .9,12,12,7 C .8,15,12,5 D .8,16,10,62.D 因为40800=120,故各层中依次抽取的人数分别为160×120=8,320×120=16,200×120=10,120×120=6.,分层抽样和系统抽样中的计算(1)系统抽样总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组Nn 个(有零头时要先去掉).若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +N n ,…,k +(n -1)Nn .(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.统计图表是高考考查的重点之一,考查频率最高的是频率分布直方图,其次是茎叶图.主要考查形式有:①画出(或补全)频率分布直方图或茎叶图;②利用频率分布直方图或茎叶图中的数据进行某些计算,如求频率、频数、平均值、众数、中位数、概率等.选择题、填空题、解答题各种题型都有可能出现,难度一般不大,属容易题或中档题.2(2014·广东,17,13分)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如下:(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值; (2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.【解析】 (1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n 1=7,n 2=2,所以f 1=725=0.28,f 2=225=0.08.(2)频率分布直方图如图所示:(3)工人们日加工零件数落在区间(30,35]的概率为0.2,设日加工零件数落在区间(30,35]的人数为随机变量ξ,则ξ~B(4,0.2),故4人中,至少有1人的日加工零件数落在区间(30,35]的概率为:1-C 04(0.2)0(0.8)4=1-0.409 6=0.590 4.第(1)问,统计日加工零件数落在区间(40,45]和(45,50]的频数n 1和n 2,f 1,f 2由n 1,n 2计算得出;第(2)问根据频率组距算出频率分布直方图中每一个小长方形的高,完成频率分布直方图;第(3)问,可用独立重复试验公式进行计算,由于情况较多,可先计算其对立事件的概率.1.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是( ) A .19 B .20 C .21.5 D .231.B 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.选B.2.(2016·广东惠州调研,4)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -2.D 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数m 0=5.平均数x -=130×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,即m 0<m e <x -,故选D.,提取频率分布直方图中的数据(1)组距、频率:频率分布直方图中每个矩形的宽表示组距,高表示频率组距,面积表示该组数据的频率,各个矩形的面积之和为1; (2)众数:最高小长方形底边中点的横坐标;(3)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; (4)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和; (5)参数:若纵轴上存在参数,则根据所有小长方形的面积之和为1,列方程即可求得参数值.用样本的数字特征估计总体涉及到的量有频数、频率、平均数、方差、标准差、众数、中位数、极差等.其中高考考查较多的是频率、平均数和方差,主要形式有: (1)用样本的频率、平均数或方差估计总体的相关特征; (2)计算样本的平均数和方差,对数据做出合理的解释.选择题、填空题、解答题中均有可能出现,难度不大,为中低档题.3(1)(2015·湖北,2)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( ) A .134石 B .169石 C .338石 D .1 365石(2)(2014·陕西,9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a ,4 B .1+a ,4+a C .1,4 D .1,4+a【解析】 (1)由条件可知,夹谷所占比例约为28254,所以米内夹谷约为1 534×28254≈169(石).(2)方法一:y -=110(y 1+y 2+…+y 10)=110(x 1+x 2+…+x 10+10a)=110(x 1+x 2+…+x 10)+a =1+a ,s 2=110[(y 1-y -)2+…+(y 10-y -)2]=110[(x 1-1)2+…+(x 10-1)2]=110[(x 1-x -)2+…+(x 10-x -)2]=4.方法二:由数据平移的性质,可知y -=x -+a =1+a , 由D(aX +b)=a 2DX ,可知s 2=12×4=4. 【答案】 (1)B (2)A1.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( ) A .8 B .15 C .16 D .321.C 若x 1,x 2,…,x n 的标准差为s ,则ax 1+b ,ax 2+b ,…,ax n +b 的标准差为as ,由题意知s =8,则所求标准差为2×8=16.2.(2013·辽宁,16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.2.【解析】 设y i =x i -7,i =1,2,3,4,5,则y 1+y 2+…+y 5=0,y 21+y 22+…+y 25=20.不妨设x 1<x 2<…<x 5,则y 1<y 2<…<y 5,由此可知-4≤y 1<0<y 5≤4.当y 5=4时,y 21+y 22+y 23+y 24=4,无解;当y 5=3时,y 21+y 22+y 23+y 24=11,y 1=-3,y 2=-1,y 3=0,y 4=1,符合要求,此时x 5=10.所以样本数据中的最大值是10. 【答案】 10,与平均数和方差有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为mx -+a ; (2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑n i =1 (x i -x -)2=1n ∑n i =1x 2i-x -2,即各数平方的平均数减去平均数的平方.求s 2时,可根据题目的具体情况,结合题目给出的参考数据,灵活选用公式形式.1.(2016·湖南常德一模,5)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003,这600名学生分住在三个营区.从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区.三个营区被抽中的人数依次为( ) A .25,17,8 B .25,16,9 C .26,16,8 D .24,17,91.A [考向1]总体数为600,样本的容量是50,600÷50=12.因此,每隔12个号码能抽到一名,由于随机抽得第一个号码为003,按照系统抽样的操作步骤在第Ⅰ营区应抽到25人,第Ⅱ营区应抽到17人,第Ⅲ营区应抽到8人.故选A.2.(2015·湖北武汉第二次调研,8)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45)的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.32.C [考向2]由频率分布直方图知,年龄在[20,30)的频率为(0.01+0.07)×5=0.4.设年龄在[30,35),[35,40),[40,45)的网民出现的频率为x ,y ,z ,则⎩⎪⎨⎪⎧x +z =2y ,x +y +z =1-0.4,解得y=0.2,即年龄在[35,40)的频率为0.2,故选C.3.(2015·山东滨州一模,13)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).学校要对这三个小组的活动效果进行抽样调查,用分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a 的值为________.3.[考向1]【解析】 三个小组的人数分别是60,40,a +20,总人数为a +120.根据分层抽样的原理,得60a +120=1230,解得a =30. 【答案】 304.(2015·江西南昌一模,13)一所中学共有4 000名学生,为了引导学生树立正确的消费观,需抽样调查学生每天使用零花钱的数量(取整数元)情况,分层抽取容量为300的样本,作出频率分布直方图如图所示,请估计在全校所有学生中,一天使用零花钱在6元~14元的学生大约有________人.4.[考向2]【解析】 由频率分布直方图知,一天使用零花钱在[6,14)的频率为1-(0.02+2×0.03)×4=0.68.根据用样本估计总体的原理,估计在全校所有学生中,一天使用零钱在6元~14元的学生大约有4 000×0.68=2 720人. 【答案】 2 7205.(2016·北京东城区模拟,17,12分)汽车的碳排放量比较大,某地规定,从2014年开始,将对二氧化碳排放量超过130 g/km 的轻型汽车进行惩罚性征税.检测单位对甲、乙两品牌轻型汽车各抽取5辆进行二氧化碳排放量检测,记录如下(单位:g/km).经测算得乙品牌轻型汽车二氧化碳排放量的平均值为x -乙=120 g/km.(1)从被检测的5辆甲品牌轻型汽车中任取2辆,则至少有一辆二氧化碳排放量超过130 g/km 的概率是多少?(2)求表中x 的值,并比较甲、乙两品牌轻型汽车二氧化碳排放量的稳定性.5.[考向3]解:(1)“至少有一辆二氧化碳排放量超过130 g/km ”的对立事件是“2辆车的二氧化碳排放量都不超过130 g/km ”,所以“至少有一辆二氧化碳排放量超过130 g/km ”的概率是P =1-C 23C 25=1-310=710.(2)由100+120+x +100+1605=120,得x =120.所以s 2乙=15[(100-120)2+(120-120)2+(120-120)2+(100-120)2+(160-120)2]=480. 又x -甲=120,s 2甲=15[(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)2]=600. ∵x -甲=x -乙=120,s 2甲>s 2乙,∴乙品牌轻型汽车二氧化碳的排放量稳定.6.(2016·云南昆明二模,18,12分)某校高三(1)班全体女生的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如图①②所示,据此解答如下问题: (1)求高三(1)班全体女生的人数;(2)求分数在[80,90)之间的女生人数,并计算频率分布直方图中[80,90)之间的矩形的高; (3)若要从分数在[80,100)之间的试卷中任取两份分析女生失分情况,在抽取的试卷中,求至少有一份分数在[90,100)之间的概率.6.[考向2]解:(1)由茎叶图知,分数在[50,60)之间的频数为2,由频率分布直方图知,分数在[50,60)之间的频率为0.008×10=0.08,所以全班人数为20.08=25(人).(2)茎叶图中可见部分共有21人,所以[80,90)之间的女生人数为25-21=4,∴分数在[80,90)之间的频率为425=0.16,∴频率分布直方图中[80,90)间的矩形的高为0.1610=0.016.(3)在[80,100)之间的试卷共有6份,任取两份的取法种数为C 26=15,至少有一份分数在[90,100)之间的取法种数为C 22+C 12C 14=9,所以所求的概率为P =915=35.1.(2015·福建,4,易)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y --b ^x -.据此估计,该社区一户年收入为15万元家庭的年支出为( ) A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 1.B 由题意知,x -=8.2+8.6+10.0+11.3+11.95=10,y -=6.2+7.5+8.0+8.5+9.85=8.又∵b ^=0.76,∴a ^=0.4,∴y ^=0.76x +0.4,∴当x =15时,y ^=11.8.2.(2014·湖北,4,易)根据如下样本数据得到的回归方程为y ^=bx +a ,则( ) A .a>0,b>0 B .a>0,b<0 C .a<0,b>0 D .a<0,b<02.B 如图,画出散点图,知a>0,b<0.3.(2014·江西,6,中)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A.成绩 B .视力 C .智商 D .阅读量 3.D 分别依据表1~表4计算K 2得 ⎝⎛⎭⎫以下式中a =5220×32×16×36. K 21=52×(6×22-10×14)220×32×16×36=82a ,K 22=52×(4×20-12×16)220×32×16×36=1122a ,K 23=52×(8×24-8×12)220×32×16×36=962a ,K 24=52×(14×30-2×6)220×32×16×36=4082a ,其中最大的是K 24,所以根据独立性检验原理可知,阅读量与性别有关联的可能性最大. 4.(2013·福建,11,中)已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x +a′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′4.C 计算得x -=3.5,y -=136,画出散点图,并根据各个点和回归中心画出回归直线的大体图形.由图易知b ^<b ′,a ^>a ′,所以选C.5.(2012·湖南,4,中)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg5.D ∵0.85>0,∴y 与x 正相关,∴A 正确;∵线性回归方程经过样本点的中心(x -,y -),∴B 正确;∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85,∴C 正确;体重58.79 kg 为估计值,故选D.6.(2016·课标Ⅲ,18,12分,中)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t -)(y i -y -)∑ni =1(t i -t -)2∑ni =1(y i -y -)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑n i =1(t i -t -)(y i -y -)∑n i =1(t i -t -)2,a ^=y --b ^t -.6.解:(1)由折线图中数据和附注中参考数据得t -=4,∑7i =1(t i -t -)2=28,∑7i =1(y i -y -)2=0.55,∑7i =1(t i -t -)(y i -y -)=∑7i =1t i y i -t -∑7i =1y i =40.17-4×9.32=2.89, r ≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑7i =1(t i -t -)(y i -y -)∑7i =1(t i -t -)2=2.8928≈=0.103, a ^=y --b ^t -≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t.所以将2016年对应的t =9代入回归方程得:y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.7.(2015·课标Ⅰ,19,12分,中)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w -=18∑8i =1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x ,根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑n i =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.7.解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68, c ^=y --d ^w -=563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x.(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x)-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.本考向在高考中灵活性不强,主要考查点有:(1)线性回归方程中系数的计算.公式不要求记忆,试卷会给出公式,会用即可; (2)正相关、负相关与系数b(斜率)的关系,有时也会涉及截距;(3)根据线性回归方程进行预测.注意:预测值是估计值,而不是精确值; (4)画散点图或根据散点图判断数据的相关性;(5)回归直线一定经过回归中心(x -,y -).题目难度一般为容易题或中档题,各种题型都会出现.1(2014·课标Ⅱ,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑n i =1(t i -t -)(y i -y -)∑n i =1(t i -t )2,a ^=y --b ^t -.【解析】 (1)由所给数据计算得t -=17(1+2+3+4+5+6+7)=4, y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑7i =1(t i -t -)2=9+4+1+0+1+4+9=28, ∑7i =1(t i -t -)(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑7i =1(t i -t -)(y i -y -)∑7i =1(t i -t -)2=1428=0.5, a ^=y --b ^t -=4.3-0.5×4=2.3.所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.(1)根据回归方程的定义求出回归方程;(2)将待预测的t 代入(1)中回归方程,得预测结果.求线性回归方程的最大难点是系数计算较为繁琐,计算时要仔细认真,随时做好检查,防止错误数据给后续步骤带来连锁反应.为避免出错,以及出错后便于检查,可将公式分解分别求值.(2016·山东东营一模,3)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为y ^=-10x +200,则下列结论正确的是( ) A .y 与x 具有正的线性相关关系B .若r 表示变量y 与x 之间的线性相关系数,则r =-10C .当销售价格为10元/件时,销售量为100件。

2016年高考数学(新课标版) 专题18 概率与统计大题(理) 含解析

【名师精讲指南篇】【高考真题再现】1.【2013 新课标全国】一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为,且各件产品是否为优质品相互独立(1)求这批产品通过检验的概率;(2)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.【解析】(1)利用相互独立事件模型计算概率;(2)在(1)的基础上,利用对立事件算出X为400、500、800时的概率,进而列出分布列,求出期望.2.【2014高考全国1】从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下图频率分布直方图:(I)求这500件产品质量指标值的样本平均值x和样本方差2s(同一组的数据用该组区间的中点值作代表);(II )由直方图可以认为,这种产品的质量指标Z 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(i )利用该正态分布,求()187.8212.2P Z <<;(ii )某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间()187.8,212.2的产品件数.利用(i )的结果,求EX .12.2≈若()2~,Z N μσ则()0.6826P Z μσμσ-<<+=,()220.9544P Z μσμσ-<<+=.3.【2014新课标Ⅱ理)】某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121niii ni i t t yy b t t ==--=-∑∑,ˆˆay bt =-.(II )由(I )知,ˆ0.50b=>,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号9t =代入(I )中的回归方程,得ˆ0.59 2.3 6.8y=⨯+=千元,故预测该地区2015年农村居民家庭人均纯收入为6.8千元 4.【2015全国Ⅱ理18】某公司为了解用户对其产品的满意度,从,A B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.则可得1122B A B A C C C C C =.所以1122()()B A B A P C P C C C C =1122()()B A B A P C C P C C =+1122()()()()B A B A P C P C P C P C =+.由题意及所给数据可得1A C ,2A C ,1B C ,2B C 发生的频率分别为1620,420,1020,820. 故可得1()A P C 16=20,2()=A P C 420,1()=B P C 1020,2()B P C 8=20,故101684()=+0.4820202020P C ⨯⨯=.即C 的概率为0.48. 5.【2015全国Ⅰ理19】某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋅⋅⋅数据作了初步处理,得到下面的散点图及一些统计量的值.年宣传费/千元表中i w =,18i i w w ==∑,(1)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系式0.2z y x =-,根据(2)的结果回答下列问题:①年宣传费49x =时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ()22,u v ,⋅⋅⋅,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆniii ni i u u v v u u β==--=-∑∑,ˆˆv u αβ=-.【热点深度剖析】1.纵观2013年和2014年2015年的高考题对本热点的考查,可以发现概率和统计、统计案例相结合是高考命题的热点,在2012年高考中,结合实际问题将函数和概率问题巧妙结合在一起,新颖别致,但是题目难度不大,这也体现了“新题不难”的命题特点,主要考查生活中的概率统计知识和方法.求离散型随机变量的分布列和数学期望的方法,以及生活中最大利润的判断;2013年考查相互独立事件的概率计算、离散型随机变量的分布列、期望,考查学生的逻辑推理能力以及基本运算能力;2014年主要考查了频率分布直方图,正态分布的3 原则,二项分布的期望及回归分析.2015年分别考查了回归分析、茎叶图。

2016年高考英语命题猜想与仿真押题——专题03 形容词和副词(命题猜想)(教师版) 含解析

【考向解读】单项填空题对形容词和副词的考查重点是词义辨析、形容词和副词的比较、倍数关系以及形容词和副词在特殊语境中的应用等。

对此考生还应掌握形容词和副词比较级和最高级的构成方法及形容词作定语或表语这一基本考点.【命题热点突破一】形容词、副词的基本用法例1.(2015·高考浙江卷,T14)Listening is thus an active,not a________,behavior consisting of hearing,understanding and remembering。

A.considerate B.sensitiveC.reliable D.passive答案:D1.形容词(短语)、副词作状语形容词(短语)作状语,说明句子中主语或宾语的状态;而副词作状语一般情况下用来修饰句子的谓语动词或置于句首修饰全句,作评注性状语。

Thankfully,I managed to get through the game and the pain was worth it in the end。

谢天谢地,我终于打完比赛了,所有的辛苦最终都是值得的。

Lighthearted and optimistic,she is the sort of woman to spread sunshine to people through her smile.她无忧无虑、积极乐观,是那种用微笑给别人带来快乐的人.2.形容词、副词的顺序(1) 形容词作定语修饰由no,any,some和every构成的复合词,需要后置.多个形容词修饰名词的排列顺序:限定词(these/those)+序数词+基数词/量词+描绘性形容词(beautiful)+大小、长短、高低+形状+年龄+颜色+来源(American)+材料+用途(writing)+名词。

It's a charming small French clock,made of brass and dating from the nineteenth century。

【精品】2016年高考数学(新课标版) 专题18 概率与统计大题(文) 含解析

【名师精讲指南篇】【高考真题再现】1.【2013 新课标全国】为了比较两种治疗失眠症的药(分别成为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果来看,哪种药的效果好?(2)完成茎叶图,从茎叶图来看,哪种药疗效更好?【解析】(1)利用平均数公式进行计算;(2)绘制茎叶图,进行观察.2.【2014高考全国1文】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:(II )估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III )根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 【解析】(1)(2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=.3. 【2015全国II 文18)】某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得出A 地区用户满意评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表(1)在答题卡上作出地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:4.【2015全国I文19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,,8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.千元565452504846444240383634表中i w =18i i w w ==∑(1)根据散点图判断,y a bx =+与y c =+y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与,x y 的关系为0.2z y x =-,根据(2)的结果回答下列问题:(i )年宣传费49x =时,年销售量及年利润的预报值是多少? (ii )年宣传费x 为何值时,年利润的预报值最大? 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121niii nii u u v v u u β==--=-∑∑,v u αβ=-.解析(1)由散点图变化情况选择y c =+.6.8=,即26.846.24x ==(千元)时,年利润的预报值最大, 【热点深度剖析】1.纵观2013年和2014年2015年的高考题对本热点的考查,可以发现概率和统计、统计案例相结合是高考命题的热点, 2013年考查了茎叶图、利用样本数据估计总体,考查学生的数据处理能力,这也体现了高考对新课标的新增内容的要求,试题难度不大,但是要求同学们对相关的基础知识掌握必须准确,2014年考查了频率分布表,频率分布直方图,平均数与方差的计算,主要考查生活中的概率统计知识和方法. 2015年分别考查了频率分布直方图、线性回归分析.从近几年的高考试题来看,古典概型、频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.独立性检验、回归分析高考对此部分内容考查较少,主要是以小题形式考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有解答题出现.,根据近三年高考趋势预测2016年高考,频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,由于连续3年大题都没考古典概型、独立性检验,故应注意和概率知识的结合,同时应注意独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题. 【重点知识整合】一,统计初步 1.简单随机抽样简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法. 2.系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.(2)系统抽样的步骤:①编号.采用随机的方式将总体中的个体编号.②分段.先确定分段的间隔k .当N n (N 为总体中的个体数,n 为样本容量)是整数时,k =N n;当N n不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N ′能被n 整除,这时k =N ′n.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S . ④按照事先确定的规则抽取样本.通常是将S 加上间隔k ,得到第2个个体编号S +k ,再将(S +k )加上k ,得到第3个个体编号S +2k ,这样继续下去,获得容量为n 的样本.其样本编号依次是:S ,S +k ,S +2k ,…,S +(n -1)k . 3.分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当. (2)分层抽样的步骤①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.(3)分层抽样的优点分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用. 4.绘制频率分布直方图把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1. 5.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.6.平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 7.方差、标准差(1)设样本数据为x 1,x 2,…,x n 样本平均数为x -,则s 2=1n =1n叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小. 8.两个变量的线性相关 (1)散点图将样本中n 个数据点(xi ,yi )(i =1,2,…,n )描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系. (2)正相关、负相关如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. 9.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x 、y 的一组观察值为(x i ,y i )(i =1,2,…,n ),则回归直线方程y ^=a ^+b ^x 的系数为:⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧b^=∑i =1n x i y i -n x ·y ∑i =1n x i 2-n x 2=∑i =1n (x i -x -)(y i -y -)∑i =1n (x i -x -)2a^=y --b ^x其中x -=1n ∑i =1n x i ,y -=1n ∑i =1ny i ,(x -,y -)称作样本点的中心.a ^,b ^表示由观察值用最小二乘法求得的a ,b 的估计值,叫回归系数. 10.独立性检验(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量. (2)两个分类变量X 与Y 的频数表,称作2×2列联表.二.随机事件的概率1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件. (1)在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件. (2)在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件. (3)必然事件与不可能事件统称为确定事件.(4)在条件S 下可能发生也可能不发生的事件,叫做随机事件. (5)确定事件和随机事件统称为事件,一般用大写字母,,,A B C 表示.2.频率与概率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数A n 为事件A 出现的频数,称事件A 出现的比例()An n f A n=为事件A 出现的频率.(2)对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率()n f A 稳定在某个常数上,把这个常数记作()p A ,称为事件A 的概率,简称为A 的概率. 3.互斥事件与对立事件互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即A B 为不可能事件(AB φ=),则称事件A 与事件B 互斥,其含义是:事件A 与事件B 在任何一次试验中不会同时发生. 一般地,如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥.对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即A B 为不可能事件,而AB 为必然事件,那么事件A 与事件B 互为对立事件,其含义是:事件A 与事件B 在任何一次试验中有且仅有一个发生.互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件. 4.事件的关系与运算B或A B +)B (或AB )B 为不可能事件,那么称事件B φ= B 为不可能事件,B 为必然事件,那么称事件与事件B 互为对立事件B φ=B =Ω事件A 的概率:在大量重复进行同一试验时,事件A 发生的频率nm总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()p A .由定义可知()01p A ≤≤,显然必然事件的概率是1,不可能事件的概率是0. 5.概率的几个基本性质(1)概率的取值范围:()01p A ≤≤. (2)必然事件的概率:()1p A =. (3)不可能事件的概率:()0p A =. (4)互斥事件的概率加法公式: ①()()()p A B p A p B =+(,A B 互斥),且有()()()1p A A p A p A +=+=. ②()()()()1212n n p A A A p A p A p A =+++ (12,,,n A A A 彼此互斥).(5)对立事件的概率:()()1P A P A =-. 三.古典概型1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A 由几个基本事件组成.如果一次试验中可能出现的结果有n 个,即此试验由n 个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是n1.如果某个事件A 包含的结果有m 个,那么事件A 的概率P (A )=nm . 基本事件的特点(1)任何两个基本事件是互斥的.(2)任何事件都可以表示成基本事件的和(除不可能事件).2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性. ②每个基本事件发生的可能性相等,即等可能性.概率公式:P (A )=A 包含的基本事件的个数基本事件的总数.四.几何概型1.(1)随机数的概念:随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的. (2)随机数的产生方法①利用函数计算器可以得到0~1之间的随机数;②在Scilab 语言中,应用不同的函数可产生0~1或a~b 之间的随机数. 2.几何概型(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性. (3)几何概型的解题步骤:首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件A 构成的区域长度(角度、弧长等),最后代公式()p A =构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件A 分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.3.几种常见的几何概型(1)设线段l 是线段L 的一部分,向线段L 上任投一点.若落在线段l 上的点数与线段L 的长度成正比,而与线段l 在线段l 上的相对位置无关,则点落在线段l 上的概率为: P=l 的长度/L 的长度(2)设平面区域g 是平面区域G 的一部分,向区域G 上任投一点,若落在区域g 上的点数与区域g 的面积成正比,而与区域g 在区域G 上的相对位置无关,则点落在区域g 上概率为: P=g 的面积/G 的面积(3)设空间区域上v 是空间区域V 的一部分,向区域V 上任投一点.若落在区域v 上的点数与区域v 的体积成正比,而与区域v 在区域v 上的相对位置无关,则点落在区域V 上的概率为:P=v 的体积/V 的体积五.条件概率 1.条件概率及其性质(1)对于任何两个事件A 和B ,在已知事件A 发生的条件下,事件B 发生的概率叫做条件概率,用符号()/p B A 来表示,其公式为()()()/p AB p B A P A =.在古典概型中,若用()n A 表示事件A 中基本事件的个数,则()()()/n AB p B A n A =. (2)条件概率具有的性质: ①()0/1p B A ≤≤;② 如果B 和C 是两互斥事件,则()()()///p B C A p B A p C A =+.2.相互独立事件(1)对于事件A 、B ,若A 的发生与B 的发生互不影响,则称A 、B 是相互独立事件. (2)若A 与B 相互独立,则()()/p B A p B =,()()()()()/p AB p B A P A P A P B =⋅=⋅.(3)若A 与B 相互独立,则A 与B ,A 与B ,A 与B 也都相互独立. (4)若()()()p AB P A P B =⋅,则A 与B 相互独立. 【应试技巧点拨】 1.三种抽样方法的比较在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;中位数的估计值,应使中位数左右两边的直方图面积相等;最高小长方形的中点所对应的数据值即为这组数据的众数.3.方差是刻画一组数据离散程度的量,方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.5.判断两变量是否有相关关系很容易将相关关系与函数关系混淆.相关关系是一种非确定性关系,即是非随机变量与随机变量之间的关系,而函数关系是一种因果关系.6.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同)7.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程.8.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断.【考场经验分享】1.进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同;(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.2.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.5.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据.6.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.076应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断.7. 概率计算题的核心环节就是把一个随机事件进行类似本题的分拆,这中间有三个概念,事件的互斥,事件的对立和事件的相互独立,在概率的计算中只要弄清楚了这三个概念,根据实际情况对事件进行合理的分拆,就能把复杂事件的概率计算转化为一个个简单事件的概率计算,达到解决问题的目的.8.在解含有相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的每个事件分拆为若干个相互独立事件的乘积,这两个事情做好了,问题的思路就清晰了,接下来就是按照相关的概率值进行计算的问题了.9.相当一类概率应用题都是比如掷硬币、掷骰子、摸球等概率模型赋予实际背景后得出来的,我们在解题时就要把实际问题再还原为我们常见的一些概率模型,这就要根据问题的具体情况去分析,对照常见的概率模型,把不影响问题本质的因素去除,抓住问题的本质.【名题精选练兵篇】1.【2016广西钦州上学期期末,文18】某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图因故都受到不同程度的损坏,但可见部分如下,据此解答如下问题:(Ⅰ)求分数在[50,60)的频率及全班人数;(Ⅱ)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高;(Ⅲ)若规定:90分(包含90分)以上为优秀,现从分数在80分(包含80分)以上的试卷中任取两份分析学生失分情况,求在抽取的试卷中至少有一份优秀的概率.2.【2016河北唐山二模,文18】二手车经销商小王对其所经营的某一型号二手汽车的使用年数x (0<x ≤10)与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:(Ⅰ)试求y 关于x 的回归直线方程;(参考公式:b ˆ=i =1∑x i y i -n ·x -y-n i =1∑x 2i -nx-2,a ˆ=y --b ˆx -.)(Ⅱ)已知每辆该型号汽车的收购价格为w =0.05x 2-1.75x +17.2万元,根据(Ⅰ)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大? 解:(Ⅰ)由已知:x -=6,y -=10,5i =1∑x i y i =242,5i =1∑x 2i =220,^b =ni =1∑x i y i -nx -y-ni =1∑x 2i -nx-2=-1.45,a ˆ=y --^bx-=18.7;所以回归直线的方程为^y =-1.45x +18.7 (Ⅱ)z =-1.45x +18.7-(0.05x 2-1.75x +17.2)=-0.05x 2+0.3x +1.5 =-0.05(x -3)2+1.95,所以预测当x =3时,销售利润z 取得最大值.3.【2016吉林长春质量监测二,文18】近年来我国电子商务行业迎来篷布发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门也推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为35,对服务的好评率为34,其中对商品和服务都做出好评的交易为80次.(1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关? (2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率.2()0.150.100.050.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.828P K k k ≥4.【2016辽宁省沈阳质量监测一,文19】为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只,(Ⅰ)求22 列联表中的数据x ,y ,A ,B 的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?10000005016.6710.8285020603==≈>⨯⨯. 所以至少有99.9%的把握认为疫苗有效.5.【2016新疆乌鲁木齐一诊,文19】某城市居民月生活用水收费标准为1.6,022.7,23.54.0,3.5 4.5t t W t t t t t ≤<⎧⎪≤<⎨⎪≤≤⎩()=(t 为用水量,单位:吨;W 为水费,单位:元),从该市抽取的未注射 注射未注射 注射100户居民的月均用水量的频率分布直方图如图所示.(I)求这100户居民的月均用水量的中位数及平均水费;(II)从每月所交水费在14元-18元的用户中,随机制取户,求2户的水费都超过16元的概率.()()⨯+⨯+⨯⨯+⨯+⨯⨯⨯0.50 2.250.28 2.750.12 3.25 2.70.08 3.750.04 4.2540.5⎤⎦=(元)…6分5.052756.【山东省青岛市2015届高三上学期期末】右图为某校语言类专业N名毕业生的综合测评成绩(百分制)分布直方图,已知80~90分数段的学员数为21人(I)求该专业毕业总人数N和90~95分数段内的人数n;(II)现欲将90~95分数段内的n名人分配到几所学校,从中安排2人到甲学校去,若n人中仅有两名男生,求安排结果至少有一名男生的概率.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【命题热点突破一】抽样方法
某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x ,某件产品A 被抽到的概率为y ,则x ,y 的值分别为( )
A .25,14
B .20,1
6
C .25,1600
D .25,1
6
【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
【变式探究】
从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.
(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图18-3所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )
图18-3
A .91,91.5
B .91,92
C .91.5,91.5
D .91.5,92
(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.
【特别提醒】 统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.
【变式探究】
(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图18-4所示,则原始的茎叶图可能是( )
图18-5
(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图18-6所示,数据分组依次如下:
[70,90),[90,110),[110,130),[130,150].
估计该班数学成绩的平均分数为( )
图18-6
A.112
B.114
C.116
D.120
【命题热点突破三】统计案例
例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).
(1)应收集多少名女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图18-7所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.
(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
附:K2=n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
【特别提醒】在计算K2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.
【变式探究】
为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y之间的关系.
(1)求小李这5天的平均投篮命中率;
(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率.
【特别提醒】回归直线一定过样本点的中心(x,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.
【高考真题解读】
1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则
该校女教师的人数为(
)
A .167
B .137
C .123
D .93
2.(2015·安徽,6)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )
A .8
B .15
C .16
D .32
3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( )
0 1 2 2
8 9 2 5 8
0 0 0 3 3 8 1 2
A .19
B .20
C .21.5
D .23
4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是(
)
A .逐年比较,2008年减少二氧化硫排放量的效果最显著
B .2007年我国治理二氧化硫排放显现成效
C .2006年以来我国二氧化硫年排放量呈减少趋势
D .2006年以来我国二氧化硫年排放量与年份正相关
5. (2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程y

=b

x+a

,其中b

=0.76,a

=y-b

x.据此估计,该社区一户年收入
为15万元家庭的年支出为( )
A.11.4万元B.11.8万元
C.12.0万元D.12.2万元
6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8 C.12 D.18
7.(2014·陕西,9)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
8.(2014·湖南,2)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2<p3B.p2=p3<p1
C.p1=p3<p2D.p1=p2=p3
9.(2014·广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20 C.200,10 D.100,10
10.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.11.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.
12.(2015·湖南,12)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:
1 3
1 4
1 5 0 0 3 4 5 6 6 8 8 9
1 1 1
2 2 2
3 3
4 4
5 5 5
6 6
7
8 0 1 2 2 3 3 3
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
13.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
:。

相关文档
最新文档