2019届高考理数11.5抽样方法与总体分布的估计
高考数学总复习:第十一篇 第1讲 抽样方法与总体分布的估计

抓住3个考点
2.频率分布直方图与茎叶图 (1)当总体很大或不便获得时,可以用样本的频率分布去估 计总体的频率分布,我们把反映样本频率分布的表格称为 求极差 频率分布表.绘制频率分布表的步骤为:①_______; 决定组距和组数 将数据分组 列频率分布表 ②_______________;③___________;④_____________. (2)利用直方图反映样本的频率分布,这样的直方图称为频率 分布直方图.画频率分布直方图的一般步骤是:①绘制频率 分布表;②作直角坐标系,把横轴分成若干段,每一段对应 一个组的组距;③在上面标出的各点中,分别以相邻两点为 频率 组距 端点的线段为底作矩形,它的高等于该组的____.此时,每 个矩形的面积恰好就是该组的频率,显然所有矩形的面积之 和为___. 1
答案
C
抓住3个考点
突破3个考向
揭秘3年高考
2.(2013· 西安模拟)甲校有3 600名学生,乙校有5 400名学 生,丙校有1 800名学生.为统计三校学生某方面的情
况,计划采用分层抽样法,抽取一个容量为90的样
本,应该在这三校分别抽取的学生人数是 A.30,30,30 C.20,30,10 B.30,45,15 D.30,50,10 ( ).
5.(2013· 长沙模拟)如图是某学校一名篮球运 动员在五场比赛中所得分数的茎叶图,则 该运动员在这五场比赛中得分的方差为________. 1 2 (注:方差 s = [(x1- x )2+(x2- x )2+…+(xn- x )2], n
其中 x 为 x1,x2,…,xn 的平均数)
1 1 x = (8+9+10+13+15)=11,s2= ×(9+4 5 5 +1+4+16)=6.8. 解析
抽样方法与总体分布的估计

频数为0.32×150=48.
•
PPT文档演模板
答案 B
抽样方法与总体分布的估计
5.(长沙模拟)如图是某学校一名篮球运动 员在五场比赛中所得分数的茎叶图,则
•该运动员在这五场比赛中得分的方差为________.
答案 6.8
PPT文档演模板
抽样方法与总体分布的估计
考向一 抽样方法
•【例1】从某厂生产的802辆轿车中抽取80辆测试某项 性 能.请合理选择抽样方法进行抽样,并写出抽样过 程. [审题视点] 因为802不能整除80,为了保证“等距” 分段,应先剔除2个个体.
PPT文档演模板
抽样方法与总体分布的估计
•(3)平均数
样本数据的算术平均数,即 =__________________. (4)方差与标准差
方差:s2=__________________________________.
标准差:s= _____________________________________.
抽样方法与总体分布的估计
•
考点自测
1.(山东)采用系统抽样方法从960人中抽取32人做 问卷调查.为此将他们随机编号为1,2,…, 960,分组后在第一组采用简单随机抽样的方法 抽到的号码为9.抽到的32人中,编号落入区间 [1,450]的人做问卷A,编号落入区间[451,750]的 人做问卷B,其余的人做问卷C.则抽到的人中, 做问卷B的人数为 ( ). •A.7 B.9 C.10 D.15
PPT文档演模板
抽样方法与总体分布的估计
•第三步:从第1段即1,2,…,10这10个编号中,用简单随 机抽样的方法抽取一个编号(如5)作为起始编号; •第四步:从5开始,再将编号为15,25,…,795的个体抽 出,得到一个容量为80的样本.
高考数学抽样方法与总体分布的估计

*第十二章统计●网络体系总览●考点目标定位1.了解简单随机抽样、分层抽样及系统抽样的意义,会用它们对简单实际问题进行抽样.2.会用样本频率分布估计总体分布.3.会用样本估计总体平均值和方差.●复习方略指南在本章的复习中,要理解几种抽样方法的区别与联系.应充分注意一些重要概念的实际意义,理解概率统计中处理问题的基本思想方法,掌握所学的概率统计知识的实际应用.这部分内容高考命题趋向主要以选择题、填空题为主,重点考查基础知识、基本概念及其简单的应用.对有关概率统计的应用题要多加关注.12.1 抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比较(略).4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100解析:这个问题我们研究的是运动员的年龄情况.因此应选D. 答案:D2.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.310C 3B.89103⨯⨯C.103 D.101 解析:用简单随机抽样法从中抽取,则每个个体被抽到的概率都相同为103,所以选C. 答案:C3.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.160解析:∵n40=0.125,∴n =320.故选B. 答案:B4.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).解析:由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47●典例剖析【例1】 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B. 答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.剖析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意qq a --⋅1)1(31=21,a 1(1+q +q 2)=21.∴a 1=1,q =4.∴后三组频数最高的一组的频数为16.答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.(2)频率分布直方图如下:(h )1.0.0.0.0.(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义. ●闯关训练 夯实基础1.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6 hB.0.9 hC.1.0 hD.1.5 h解析:505.020)5.11(1025⨯++⨯+⨯=0.9.答案:B2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,7解析:45×10020=51×45=9,25×10020=5,30×51=6.答案:B3.某单位共有N 个职工,要从N 个职工中采用分层抽样法抽取n 个样本,已知该单位的某一部门有M 个员工,那么从这一部门中抽取的职工数为___________.答案:NMn4.下图是容量为100的样本的频率分布直方图,试根据图形中的数据填空:(1)样本数据落在范围[6,10)内的频率为___________;(2)样本数据落在范围[10,14)内的频数为___________; (3)总体在范围[2,6)内的概率约为___________. 答案:(1)0.32 (2)36 (3)0.085.举例说明简单随机抽样和分层抽样两种抽样方法,无论使用哪一种抽样方法,总体中的每一个个体被抽到的概率都相等.解:袋中有160个小球,其中红球48个,蓝球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为16020=81. (2)使用分层抽样:四种球的个数比为3∶4∶1∶2.红球应抽103×20=6个;蓝球应抽104×20=8个;白球应抽101×20=2个;黄球应抽102×20=4个.由于486=648=162=324=81,所以,按颜色区分,每个球被抽到的概率也都是81.培养能力6.某工厂生产的产品,可分为一等品、二等品、三等品三类,根据抽样检验的记录有一等品54个、二等品140个、三等品6个.(1)估计三种产品的概率; (2)画出频率分布条形图. 解:(1)0.27,0.7,0.03. (2)频率分布条形图如下.7.有点难度哟!某县政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级人事部门为了了解职工对机构改革的意见,要从中抽取一个容量为20的样本,试说明具体实施办法,并证明用这种抽样方法可使总体中每个个体被抽到的概率相等.解:因机构改革关系到所有人的利益,故采用分层抽样方法较宜.∵10020=51,∴10×51=2,70×51=14,20×51=4.故从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.副处级以上干部被抽到的概率为102=51,一般干部被抽到的概率为7014=51,工人被抽到的概率为204=51,即每个个体被抽到的概率都是10020=51.8.有点难度哟!从一个养鱼池中捕得m 条鱼,作上记号后再放入池中,数日后又捕得n 条鱼,其中k 条有记号,请估计池中有多少条鱼.解:设池中有N 条鱼,第一次捕得m 条作上记号后放入水池中,则池中有记号的鱼占Nm;第二次捕得n 条,则这n 条鱼是一个样本,其中有记号的鱼占nk.我们用样本来估计总体分布,令n k =N m ,∴N =k mn . 探究创新9.有点难度哟!1936年,美国进行总统选举,竞选的是民主党的罗斯福和共和党的兰登,罗斯福是在任的总统.美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封,在调查史上,样本容量这么大是少见的,杂志社花费了大量的人力和物力,他们相信自己的调查统计结果,即兰登将以57%对43%的比例获胜,并大力进行宣传.最后选举结果却是罗斯福以62%对38%的巨大优势获胜,连任总统.这个调查使《文学摘要》杂志社威信扫地,不久只得关门停刊.试分析这次调查失败的原因.解:失败的原因:抽样方法不正确.样本不是从总体(全体美国公民)中随机地抽取,1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.1929~1933年的世界经济危机,使美国经济遭到沉重打击,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民却从中得到了好处.所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性.●思悟小结1.采用什么抽样方法,要视情况来定:当总体中的个体较少时,一般可用随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样.2.用样本估计总体,是研究统计问题的一个基本思想方法.用样本估计总体,本节主要研究在整体上用样本的频率分布估计总体的分布.●教师下载中心 教学点睛1.常用的抽样方法有三种:简单随机抽样、系统抽样、分层抽样,其中第一种是最简单、最基本的抽样方法.三种抽样方法的共同点:都是等概率抽样,体现了抽样的公平性;三种抽样方法各有其特点和适用的范围.2.总体分布反映了总体在各个范围内取值的概率.当总体中所取不同数值比较少时,常用条形图表示相应样本的频率分布;否则,常用频率分布直方图表示相应样本的频率分布.3.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.4.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.5.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.6.条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.拓展题例【例1】用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是___________.解析:不妨设在第1组中随机抽到的号码为x ,则在第16组中应抽出的号码为120+x . 设第1组抽出的号码为x ,则第16组应抽出的号码是8×15+x =126,∴x =6. 答案:6【例2】 (2004年苏、锡、常、镇四市模拟题)某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为____________.解析:分层抽样应按各层所占的比例从总体中抽取. ∵120∶16∶24=15∶2∶3,又共抽出20人,∴各层抽取人数分别为20×2015=15人,20×202=2人,20×203=3人. 答案:15人、2人、3人。
【2019版课标版】高考数学文科精品课件§11.5 抽样方法与总体分布的估计

§11.5抽样方法与总体分布的估计考纲解读分析解读 1.掌握简单随机抽样、系统抽样、分层抽样等常用抽样方法,体会三种抽样方法的区别与联系及具体的操作步骤.2.会用样本的频率分布估计总体的分布,会用样本的数字特征估计总体的数字特征.3.样本数字特征及频率分布直方图为高考热点.有关统计内容及方法主要以选择题、填空题的形式呈现,分值约为5分,属容易题;抽样方法和各种统计图表与概率的有关内容相结合也会出现在解答题中,分值约为12分,属中档题.五年高考考点一随机抽样1.(2015湖北,2,5分)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石答案B2.(2014湖南,2,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D3.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案184.(2015湖南,13,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.答案45.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.答案60教师用书专用(6—11)6.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案B7.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()图1图2A.200,20B.100,20C.200,10D.100,10答案A8.(2013课标全国Ⅰ,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C9.(2013湖南,2,5分)某学校有男、女学生各500名.为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法答案D10.(2013陕西,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B11.(2013江西,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案D考点二用样本估计总体1.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A2.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D3.(2015重庆,3,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19B.20C.21.5D.23答案B4.(2015安徽,6,5分)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.32答案C5.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.16.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.教师用书专用(7—15)7.(2014山东,7,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18答案C8.(2013福建,4,5分)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.120答案B9.(2013重庆,4,5分)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5B.5,5C.5,8D.8,8答案C10.(2013辽宁,5,5分)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60答案B11.(2015江苏,2,5分)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.答案612.(2014江苏,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.答案2413.(2013湖北,11,5分)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为;(2)在这些用户中,用电量落在区间[100,250)内的户数为.答案(1)0.0044(2)7014.(2013江苏,6,5分)抽样统计甲、乙两位射击运动员的运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为.答案215.(2013广东,17,12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201530(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.解析(1)样本均值为==22.(2)由(1)知样本中优秀工人占的比例为=,故推断该车间12名工人中有12×=4名优秀工人.(3)设事件A:从该车间12名工人中,任取2人,恰有1名优秀工人,则P(A)==.三年模拟A组2016—2018年模拟·基础题组考点一随机抽样1.(2018江西重点中学盟校第一次联考,1)要从已编号(1~70)的70枚最新研制的某型导弹中随机抽取7枚来进行发射试验,用系统抽样方法确定所选取的7枚导弹的编号可能是()A.5,10,15,20,25,30,35B.3,13,23,33,43,53,63C.1,2,3,4,5,6,7D.1,8,15,22,29,36,43答案B2.(2017湖南永州模拟,3)某学校高一、高二、高三年级的学生人数之比为4∶3∶3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为()A.15B.20C.25D.30答案 A3.(2018江苏南京联合体学校调研,3)为检验某校高一年级学生的身高情况,现采用先分层抽样后简单随机抽样的方法抽取一个容量为210的样本,已知每个学生被抽取的概率为0.3,且男女生的比例是4∶3,则该校高一年级女生的人数是 .答案 3004.(2016广东东莞高三模拟,12)要考察某公司生产的500克袋装牛奶中三聚氰胺的含量是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是 . (下面摘取了随机数表第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76(第7行) 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79(第8行) 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54(第9行) 答案 068考点二 用样本估计总体5.(2018四省名校(南宁二中等)第一次大联考,3)如图是2017年国庆中秋长假期间某客运站客运量比去年同期增减情况的条形图.根据图中的信息,以下结论中不正确的是( )A.总体上,今年国庆长假期间客运站的客流比去年有所增长B.10月3日、4日的客流量比去年增长较多C.10月6日的客流量最小D.10月7日同比去年客流量有所下滑答案 C6.(2017广东清远清新一中一模,5)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1234562 50 2 3 3 1 2 4 4 8 9 5 5 5 7 7 8 8 9 0 0 1 1 4 7 9 1 7 8A.46,45,56B.46,45,53C.47,45,56D.45,47,53答案 A7.(2017山西大学附属中学第二次模拟,3)某高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2B.24,4C.25,2D.25,4 答案 C8.(2017上海浦东新区期中联考,9)从总体中抽取一个样本:3、7、4、6、5,则总体标准差的估计值为 . 答案B 组 2016—2018年模拟·提升题组(满分:55分时间:50分钟)一、选择题(每小题5分,共20分)1.(2018山东师大附中第三次模拟,6)下图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是()A.51B.58C.61D.62答案D2.(2018山东济南外国语学校12月考试,4)给出下列四个命题:①将A,B,C三种个体按3∶1∶2的比例分层抽样调查,若抽取的A个体的个体数为12个,则样本容量为30;②一组数据1、2、3、4、5的平均数、中位数相同;③甲组数据的方差为5,乙组数据为5、6、9、10、5,那么这两组数据中较稳定的是甲;④统计的10个样本数据为95,105,114,116,120,120,122,125,130,134,则样本数据落在[114.5,124.5]内的频率为0.4.其中真命题为()A.①②B.②③C.③④D.②④答案D3.(2017安徽淮北第二次模拟,4)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1℃,()甲乙9826892m0311A.2B.C.10D.答案B4.(2016广东惠州第一中学第二次调研,5)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)的统计图如图所示,假设得分值的中位数为m,众数为n,平均数为,则()A.m=n=B.m=n<C.m<n<D.n<m<答案D二、填空题(每小题5分,共10分)5.(2018陕西榆林第二中学第七次模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为.答案1006.(2016安徽安庆二模,15)某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,根据统计结果绘制的频率分布直方图如下,则她们的平均运动时间大约是分钟.答案56.5三、解答题(共25分)7.(2018四省名校(南宁二中等)第一次大联考,18)在某单位的食堂中,食堂每天以10元/千克的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2千克,如果当天卖不完,剩下的米粉以2元/千克的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80千克米粉,以x(千克)(其中50≤x≤100)表示米粉的需求量,T(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求T的分布列和数学期望.解析(1)一千克米粉的售价是4.4×5=22元.当50≤x≤80时,T=22x-10×80+2(80-x)=20x-640.当80<x≤100时,T=22×80-10×80=960.故T=-设利润不少于760元为事件A,当50≤x≤80时,由20x-640≥760解得x≥70,所以70≤x≤80.当80<x≤100时,960>760显然成立,故70≤x≤100.由直方图可知,当70≤x≤100时,P(A)=10×(0.03+0.015+0.02)=0.65.(2)当x=55时,T=20×55-640=460;当x=65时,T=20×65-640=660;当x=75时,T=20×75-640=860;当x>80时,T=960.所以T的可能取值为460,660,860,960.P(T=460)=0.015×10=0.15,P(T=660)=0.02×10=0.2,P(T=860)=0.03×10=0.3,P(T=960)=(0.015+0.02)×10=0.35.故T的分布列为T460660860960P0.150.20.30.35E(T)=460×0.15+660×0.2+860×0.3+960×0.35=795.8.(2017湖北襄阳四中五模,18)为了引导居民合理用水,某市决定全面实施阶梯水价,阶梯水价原则上以住宅(一套住宅为一户)的月用水量为基准定价,具从该市随机抽取了10户家庭,统计了同一个月的用水量,得到如图所示的茎叶图.(1)现要在这10户家庭中任意选取3户,求取到第二阶梯水量的户数X的分布列和均值;(2)用抽到的10户家庭作为样本估计全市的居民用水情况,从全市依次随机抽取10户,若抽到n户月用水量为第二阶梯水量的可能性最大,求出n的值.0 1 2 379 123345 02解析(1)由茎叶图可知,抽取的10户家庭中用水量为一阶的有2户,二阶的有6户,三阶的有2户.取到第二阶梯水量的户数X的可能取值为0,1,2,3.则P(X=k)=-,可得P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=.故X的分布列为:X0123PEX=0×+1×+2×+3×=.(2)设从全市依次随机抽取10户,抽到Y户月用水量为第二阶梯水量,则Y~B.P(Y=k)=-(k=0,1,2,…,10).设t=-=-(k=1,2,…,10).若t>1,则k<6.6,P(Y=k-1)<P(Y=k).若t<1,则k>6.6,P(Y=k-1)>P(Y=k),∴k取6时P(Y=k)取到最大值.经过验证k=6时符合题意.∴n=6.C组2016—2018年模拟·方法题组方法1抽样方法1.(2017安徽亳州二中5月模拟)某学校有2500名学生,其中高一1000人,高二900人,高三600人,为了了解学生的身体健康状况,采用分层抽样的方法,从该校学生中抽取100人,若样本中高一和高三的人数分别为a,b,且直线ax+by+8=0与以A(1,-1)为圆心的圆交于B,C两点,且∠BAC=120°,则圆A的方程为()A.(x-1)2+(y+1)2=1B.(x-1)2+(y+1)2=2C.(x-1)2+(y+1)2=D.(x-1)2+(y+1)2=答案C2.(2017山东潍坊高考三模,5)一个总体中有600个个体,随机编号为001,002,…,600,利用系统抽样的方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为()A.056,080,104B.054,078,102C.054,079,104D.056,081,106答案D方法2频率分布直方图的应用3.(2017湖南长沙二模,18)质量指标值m m<185185≤m<205m≥205等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如图所示的频率分布直方图:(1)根据抽样调查的数据,能否认为该企业生产这种产品符合“一、二等品至少要占到全部产品的92%”的规定?(2)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率.解析(1)根据抽样调查数据知,一、二等品所占比例的估计值为0.200+0.300+0.260+0.090+0.025=0.875,由于该估计值小于0.92,故不能认为该企业生产的这种产品符合“一、二等品至少要占到全部产品的92%”的规定.(2)由频率分布直方图知,一、二、三等品的频率分别为0.375、0.5和0.125,故可抽取一等品3件,二等品4件,三等品1件,再从这8件产品中随机抽取4件,一、二、三等品都有的情形有2种,①一等品2件,二等品1件,三等品1件;②一等品1件,二等品2件,三等品1件,故所求的概率P=····=.方法3求样本的数字特征及用其估计总体的数字特征4.(2016贵州遵义航天高中模拟,3)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5答案B5.(2017河北衡水武邑中学二模,14)已知一组正数x1,x2,x3的方差s2=(++-12),则数据x1+1,x2+1,x3+1的平均数为.答案3。
新高考数学总复习专题十一抽样方法与总体分布的估计课件

位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分
位数也称为第三四分位数或上四分位数等. 4)计算一组n个数据的第p百分位数的步骤如下: ①按从小到大排列原始数据; ②计算i=n×p%; ③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据,若i是 整数,则第p百分位数为第i项与第(i&的一等级产品有20件,B生产线生产的一
等级产品有35件,由样本频率估计总体概率,得该工厂生产产品为一等级
产品的概率估计值为
20 35 200
=
11 40
,当产品产量为2
000件时,估计该工厂一
等级产品获利2 000× 11 ×10=5 500(元).
40
11.4 抽样方法与总体散布的估计
考点一 随机抽样 1.简单随机抽样 1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤ n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个 体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样; 如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽 到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样,放回 简单随机抽样和不放回简单随机抽样统称为简单随机抽样. 2)最常用的方法:随机数法和抽签法.
A.2.25吨 B.2.24吨 C.2.06吨 D.2.04吨
解析 由频率散布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5= 0.04.同理,月均用水量在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]的频率分 别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0. 02)=2×0.5×a,解得a=0.30,设中位数为x吨.因为前5组的频率之和为0.04+ 0.08+0.15+0.21+0.25=0.73>0.5,前4组的频率之和为0.04+0.08+0.15+0.21= 0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.
2019年高考数学复习同步练习 第1讲 抽样方法与总体分布的估计

第十一章统计与概率第1讲抽样方法与总体分布的估计一、选择题1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( ).A.总体 B.个体是每一个零件C.总体的一个样本 D.样本容量解析200个零件的长度是总体的一个样本.答案 C2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).A.1100B.125C.15D.14解析从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是nN=15.答案 C3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ).A. 65B.65C. 2 D.2解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.答案 D4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ).A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错. 答案 C5.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ). A .5,10,15,20,25B .2,4,8,16,32C .1,2,3,4,5D .7,17,27,37,47解析 利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,故选D. 答案 D6.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ).A.57.2,3.6 B.57.2,56.4 C.62.8,63.6 D.62.8,3.6 解析平均数增加,方差不变.答案 D二、填空题7.体育彩票000001~100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的抽样方法是________.解析系统抽样的步骤可概括为:总体编号,确定间隔,总体分段,在第一段内确定起始个体编号,每段内规则取样等几步.该抽样符合系统抽样的特点.答案系统抽样8.某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是________.解析低于60分学生所占频率为(0.002+0.006+0.012)×10=0.2,故低于60分的学生人数为1 000×0.2=200,所以不低于60分的学生人数为1 000-200=800.答案8009.沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于________.解析由n600+500+550=11550,得n=33(人).答案 3310.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是__________________________________________________________________.解析 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54. 答案 54 三、解答题11.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解 (1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.13.汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO 2排放量超过130 g/km 的MI 型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI 型品牌的新车各抽取了5辆进行CO 2排放量检测,记录如下(单位:g/km):经测算发现,乙类品牌车CO 2排放量的均值为x 乙=120 g/km. (1)求甲类品牌汽车的排放量的平均值及方差;(2)若乙类品牌汽车比甲类品牌汽车CO 2的排放量稳定性好,求x 的取值范围. 解 (1)甲类品牌汽车的CO 2排放量的平均值x 甲=80+110+120+140+1505=120(g/km),甲类品牌汽车的CO 2排放量的方差s2甲=(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)25=600.(2)由题意知乙类品牌汽车的CO2排放量的平均值x乙=100+120+x+y+1605=120(g/km),得x+y=220,故y=220-x,所以乙类品牌汽车的CO2排放量的方差s2乙=(100-120)2+(120-120)2+(x-120)2+(220-x-120)2+(160-120)25,因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以s2乙<s2甲,解得90<x<130.14.已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工(2)的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.解(1)由题意,第5组抽出的号码为22.因为k+5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为10名职工的平均体重为x=110(81+70+73+76+78+79+62+65+67+59)=71,所以样本方差为:s2=110(102+12+22+52+72+82+92+62+42+122)=52.(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81).记“体重为76公斤的职工被抽取”为事件A,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个.故所求概率为P(A)=410=25.第2讲变量间的相关关系与统计案例一、选择题1.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是( )A.①③ B.②④ C.②⑤ D.④⑤解析由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,故选C.答案 C2.已知x,y取值如下表:从所得的散点图分析可知:y与x线性相关,且y=0.95x+a,则a=().A.1.30 B.1.45 C.1.65 D.1.80解析依题意得,x=16×(0+1+4+5+6+8)=4,y=16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线y^=0.95x+a必过样本中心点(x,y),即点(4,5.25),于是有5.25=0.95×4+a,由此解得a=1.45,选B.答案 B3.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ).A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生.答案 D4.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为().A.63.6万元B.65.5万元C.67.7万元D.72.0万元解析x=4+2+3+54=3.5(万元),y=49+26+39+544=42(万元),∴a^=y-b^x=42-9.4×3.5=9.1,∴回归方程为y^=9.4x+9.1,∴当x=6(万元)时,y^=9.4×6+9.1=65.5(万元).答案 B5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C6.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程y^=bx+a,则“(x0,y 0)满足线性回归方程y^=bx+a”是“x0=x1+x2+…+x1010,y0=y1+y2+…+y1010”的( ).A.充分不必要条件 B.必要不充分条件C.充要条件 D.既不充分也不必要条件解析x0,y0为这10组数据的平均值,又因为线性回归方程y^=bx+a必过样本中心(x,y),因此(x,y)一定满足线性回归方程,但满足线性回归方程的除了(x,y)外,可能还有其他样本点.答案 B二、填空题7.已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是________相关(填“正”或“负”).解析如图所示:通过观察图象可知变量x与变量y是正相关.答案 正8.考古学家通过始祖鸟化石标本发现:其股骨长度x (cm)与肱骨长度y (cm)的线性回归方程为y ^=1.197x -3.660,由此估计,当股骨长度为50 cm 时,肱骨长度的估计值为________ cm.解析 根据线性回归方程y ^=1.197x -3.660,将x =50代入得y =56.19,则肱骨长度的估计值为56.19 cm. 答案 56.199.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①有95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%.解析 K 2≈3.918>3.841,而P (K 2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①. 答案 ①10.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.解析 由题意父亲身高x cm 与儿子身高y cm 对应关系如下表:则x =173+170+1763=173,y =170+176+1823=176, i =13(x i -x )(y i -y )=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)(182-176)=18,∑i =13(x i -x )2=(173-173)2+(170-173)2+(176-173)2=18.∴b ^=1818=1.∴a ^=y -b^ x =176-173=3. ∴线性回归直线方程y ^=b ^x +a ^=x +3.∴可估计孙子身高为182+3=185(cm). 答案 185 三、解答题7.某班主任对全班50名学生进行了作业量多少的调查.数据如下表:(1)(2)试通过计算说明在犯错误的概率不超过多少的前提下认为喜欢玩游戏与作业量的多少有关系? 附:K 2=(a +b )(c +d )(a +c )(b +d )解 (1)(2)将表中的数据代入公式K 2=(a +b )(c +d )(a +c )(b +d )得到K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024,查表知P (K 2≥5.024)=0.025,即说明在犯错误的概率不超过0.025的前提下认为喜欢玩游戏与作业量的多少有关系.8.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x+a^; (3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:∑i =14x 2i =86,x =3+4+5+64=4.5(吨),y =2.5+3+4+4.54=3.5(吨).已知∑i =14x i y i =66.5, 所以,由最小二乘法确定的回归方程的系数为:b^=∑i =14x i y i -4x ·y∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a^=y -b ^x =3.5-0.7×4.5=0.35. 因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).5.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:求线性回归方程,再对被选取的2组数据进行检验. (1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b^x +a ^. 解 (1)设抽到不相邻两组数据为事件A ,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种,所以P (A )=1-410=35. (2)由数据,求得x =12,y =27.11×25+13×30+12×26=977,112+132+122=434, 由公式,求得b ^=52,a ^=y -b ^ x =-3.所以y 关于x 的线性回归方程为y ^=52x -3.6.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知从全部105人中随机抽取1人为优秀的概率为27. (1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.附 K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)(2)k =105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ),则所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P(A)=836=29.第3讲随机事件的概率一、选择题1.把12人平均分成两组,再从每组里任意指定正、副组长各一人,其中甲被指定为正组长的概率是( )A.112B.16C.14D.13解析甲所在的小组有6人,则甲被指定正组长的概率为1 6 .答案 B2.加工某一零件需经过三道工序,设第一、二、三道工序的次品率分别为170、169、168,且各道工序互不影响,则加工出来的零件的次品率为( )A.368B.369C.370D.170解析加工出来的零件的次品的对立事件为零件是正品,由对立事件公式得加工出来的零件的次品率6968673170696870p=-⨯⨯=.答案 C3.盒中装有10个乒乓球,其中6个新球,4个旧球.不放回地依次取出2个球使用,在第一次取出新球的条件下,第二次也取到新球的概率为().A.35 B.110 C.59 D.25解析第一次结果一定,盒中仅有9个乒乓球,5个新球4个旧球,所以第二次也取到新球的概率为5 9.答案 C4.把一枚硬币连续抛两次,记“第一次出现正面”为事件A,“第二次出现正面”为事件B,则P(B|A)等于().A.12 B.14 C.16 D.18解析法一P(B|A)=P(AB)P(A)=1412=12.法二A包括的基本事件为{正,正},{正,反},AB包括的基本事件为{正,正},因此P(B|A)=1 2.答案 A5.从1,2,3,4这四个数中一次随机地取两个数,则其中一个数是另一个数的两倍的概率是( ).A.16B.13C.19D.12解析采用枚举法:从1,2,3,4这四个数中一次随机取两个数,基本事件为:{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共6个,符合“一个数是另一个数的两倍”的基本事件有{1,2},{2,4},共2个,所以所求的概率为1 3 .答案 B6.从装有3个红球、2个白球的袋中任取3个球,则所取的3个球中至少有1个白球的概率是().A.110 B.310 C.35 D.910解析从装有3个红球、2个白球的袋中任取3个球通过列举知共有10个基本事件;所取的3个球中至少有1个白球的反面为“3个球均为红色”,有1个基本事件,所以所取的3个球中至少有1个白球的概率是1-110=910.答案 D二、填空题7.对飞机连续射击两次,每次发射一枚炮弹.设A={两次都击中飞机},B={两次都没击中飞机},C={恰有一次击中飞机},D={至少有一次击中飞机},其中彼此互斥的事件是________,互为对立事件的是________.解析设I为对飞机连续射击两次所发生的所有情况,因为A∩B=∅,A∩C =∅,B∩C=∅,B∩D=∅.故A与B,A与C,B与C,B与D为彼此互斥事件,而B∩D=∅,B∪D=I,故B与D互为对立事件.答案 A 与B 、A 与C 、B 与C 、B 与D B 与D8.在△ABC 中,角A 、B 、C 所对的边分别是a 、b 、c ,A =30°,若将一枚质地均匀的正方体骰子先后抛掷两次,所得的点数分别为a 、b ,则满足条件的三角形有两个解的概率是_______.解析 要使△ABC 有两个解,需满足的条件是⎩⎨⎧a >b sin A ,b >a 因为A =30°,所以⎩⎨⎧b <2a ,b >a满足此条件的a ,b 的值有b =3,a =2;b =4,a =3;b =5,a=3;b =5,a =4;b =6,a =4;b =6,a =5,共6种情况,所以满足条件的 三角形有两个解的概率是636=16. 答案 169.甲、乙两颗卫星同时监测台风,在同一时刻,甲、乙两颗卫星准确预报台风的概率分别为0.8和0.75,则在同一时刻至少有一颗卫星预报准确的概率为________.解析 由对立事件的性质知在同一时刻至少有一颗卫星预报准确的概率为1-(1-0.8)(1-0.75)=0.95. 答案 0.9510.在100件产品中有95件合格品,5件不合格品.现从中不放回地取两次,每次任取一件,则在第一次取到不合格品后,第二次再次取到不合格品的概率为________.解析 设A ={第一次取到不合格品},B ={第二次取到不合格品},则P (AB )=C 25C 2100,所以P (B |A )=P (AB )P (A )=5×4100×995100=499答案 499 三、解答题11.甲、乙二人进行一次围棋比赛,约定先胜3局者获得这次比赛的胜利,比赛结束.假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立.已知前2局中,甲、乙各胜1局.(1)求再赛2局结束这次比赛的概率;(2)求甲获得这次比赛胜利的概率.解记A i表示事件:第i局甲获胜,i=3,4,5,B j表示事件:第j局乙获胜,j=3,4.(1)记A表示事件:再赛2局结束比赛.A=A3A4+B3B4.由于各局比赛结果相互独立,故P(A)=P(A3A4+B3B4)=P(A3A4)+P(B3B4)=P(A3)P(A4)+P(B3)P(B4)=0.6×0.6+0.4×0.4=0.52.(2)记B表示事件:甲获得这次比赛的胜利.因前两局中,甲、乙各胜一局,故甲获得这次比赛的胜利当且仅当在后面的比赛中,甲先胜2局,从而B=A3A4+B3A4A5+A3B4A5,由于各局比赛结果相互独立,故P(B)=P(A3A4)+P(B3A4A5)+P(A3B4A5)=P(A3)P(A4)+P(B3)P(A4)P(A5)+P(A3)P(B4)P(A5)=0.6×0.6+0.4×0.6×0.6+0.6×0.4×0.6=0.648.12.某公务员去开会,他乘火车、轮船、汽车、飞机去的概率分别为0.3,0.2,0.1,0.4,且只乘一种交通工具去开会.(1)求他乘火车或乘飞机去开会的概率;(2)求他不乘轮船去开会的概率;(3)如果他乘某种交通工具去开会的概率为0.5,请问他有可能是乘何种交通工具去开会的?解(1)记“他乘火车去开会”为事件A1,“他乘轮船去开会”为事件A2,“他乘汽车去开会”为事件A3,“他乘飞机去开会”为事件A4,这四个事件不可能同时发生,故它们是彼此互斥的.故P(A1+A4)=P(A1)+P(A4)=0.3+0.4=0.7.(2)设他不乘轮船去开会的概率为P,则P=1-P(A2)=1-0.2=0.8.(3)由于0.3+0.2=0.5,0.1+0.4=0.5,1-(0.3+0.2)=0.5,1-(0.1+0.4)=0.5,故他有可能乘火车或轮船去开会,也有可能乘汽车或飞机去开会.13.黄种人群中各种血型的人所占的比如下表所示:可以输给AB型血的人,其他不同血型的人不能互相输血.小明是B型血,若小明因病需要输血,问:(1)任找一个人,其血可以输给小明的概率是多少?(2)任找一个人,其血不能输给小明的概率是多少?解(1)对任一人,其血型为A,B,AB,O型血的事件分别记为A′,B′,C′,D′,它们是彼此互斥的.由已知,有P(A′)=0.28,P(B′)=0.29,P(C′)=0.08,P(D′)=0.35.因为B,O型血可以输给B型血的人,故“可以输给B型血的人”为事件B′+D′.根据互斥事件的概率加法公式,有P(B′+D′)=P(B′)+P(D′)=0.29+0.35=0.64.(2)法一由于A,AB型血不能输给B型血的人,故“不能输给B型血的人”为事件A′+C′,且P(A′+C′)=P(A′)+P(C′)=0.28+0.08=0.36.法二因为事件“其血可以输给B型血的人”与事件“其血不能输给B型血的人”是对立事件,故由对立事件的概率公式,有P(B′+D′])=1-P(B′+D′)=1-0.64=0.36.即:任找一人,其血可以输给小明的概率为0.64,其血不能输给小明的概率为0.36.14.如图,A地到火车站共有两条路径L1和L2,据统计,通过两条路径所用的时间互不影响,所用时间落在各时间段内的频率如下表:(1)为了尽最大可能在各自允许的时间内赶到火车站,甲和乙应如何选择各自的路径?(2)用X表示甲、乙两人中在允许的时间内能赶到火车站的人数,针对(1)的选择方案,求X的分布列和数学期望.解(1)A i表示事件“甲选择路径L i时,40分钟内赶到火车站”,B i表示事件“乙选择路径L i时,50分钟内赶到火车站”,i=1,2.用频率估计相应的概率可得P(A1)=0.1+0.2+0.3=0.6,P(A2)=0.1+0.4=0.5,∵P(A1)>P(A2),∴甲应选择L1;P(B1)=0.1+0.2+0.3+0.2=0.8,P(B2)=0.1+0.4+0.4=0.9,∵P(B2)>P(B1),∴乙应选择L2.(2)A,B分别表示针对(1)的选择方案,甲、乙在各自允许的时间内赶到火车站,由(1)知P(A)=0.6,P(B)=0.9,又由题意知,A,B独立,∴P(X=0)=P(AB)=P(A)P(B)=0.4×0.1=0.04,P(X=1)=P(A B+A B)=P(A)P(B)+P(A)P(B)=0.4×0.9+0.6×0.1=0.42,P(X=2)=P(AB)=P(A)P(B)=0.6×0.9=0.54.∴X的分布列为∴E(X)=0×0.04+1×第4讲古典概型一、选择题1.将一颗质地均匀的骰子(它是一种各面上分别标有点数1,2,3,4,5,6的正方体玩具)先后抛掷3次,至少出现一次5点向上的概率是( )A.5216B.25216C.31216D.91216解析抛掷3次,共有6×6×6=216个事件.一次也不出现5,则每次抛掷都有5种可能,故一次也未出现5的事件总数为5×5×5=125.于是没有出现一次5点向上的概率P=125216,所求的概率为1-125216=91216.答案 D2.一个袋子中有5个大小相同的球,其中有3个黑球与2个红球,如果从中任取两个球,则恰好取到两个同色球的概率是().A.15 B.310 C.25 D.12解析基本事件有C25=10个,其中为同色球的有C23+C22=4个,故所求概率为410=25.答案 C3.甲、乙两人各写一张贺年卡,随意送给丙、丁两人中的一人,则甲、乙将贺年卡送给同一人的概率是().A.12 B.13 C.14 D.15解析(甲送给丙,乙送给丁),(甲送给丁,乙送给丙),(甲、乙都送给丙),(甲、乙都送给丁),共四种情况,其中甲、乙将贺年卡送给同一人的情况有两种,所以P=24=12.答案 A4.甲从正方形四个顶点中任意选择两个顶点连成直线,乙从该正方形四个顶点中任意选择两个顶点连成直线,则所得的两条直线相互垂直的概率是( )A.318B.418C.518D.618解析正方形四个顶点可以确定6条直线,甲乙各自任选一条共有36个等可能的基本事件.两条直线相互垂直的情况有5种(4组邻边和对角线),包括10个基本事件,所以概率等于5 18 .答案 C5.一块各面均涂有油漆的正方体被锯成1 000个大小相同的小正方体,若将这些小正方体均匀地搅混在一起,则任意取出一个正方体其三面涂有油漆的概率是( ).A.112B.110C.325D.1125解析小正方体三面涂有油漆的有8种情况,故所求其概率为:81 000=1125.答案 D6.将号码分别为1,2,3,4的四个小球放入一个袋中,这些小球仅号码不同,其余完全相同,甲从袋中摸出一个小球,其号码为a,放回后,乙从此口袋中再摸出一个小球,其号码为b,则使不等式a-2b+4<0成立的事件发生的概率为().A.18 B.316 C.14 D.12解析由题意知(a,b)的所有可能结果有4×4=16个.其中满足a-2b+4<0的有(1,3),(1,4),(2,4),(3,4),共4个,所以所求概率为1 4.答案 C二、填空题7.在集合A={2,3}中随机取一个元素m,在集合B={1,2,3}中随机取一个元素n,得到点P(m,n),则点P在圆x2+y2=9内部的概率为________.解析由题意得到的P(m,n)有(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),共6个,在圆x2+y2=9的内部的点有(2,1),(2,2),所以概率为26=13.答案1 38. 现有10个数,它们能构成一个以1为首项,3-为公比的等比数列,若从这10个数中随机抽取一个数,则它小于8的概率是.解析组成满足条件的数列为:.19683,6561,2187,729,243,81,27.9,3,1-----从中随机取出一个数共有取法10种,其中小于8的取法共有6种,因此取出的这个数小于8的概率为53.答案 539.甲、乙二人参加普法知识竞答,共有10个不同的题目,其中6个选择题,4 个判断题,甲、乙二人依次各抽一题,则甲、乙两人中至少有一人抽到选择题的概率是________.解析 方法1:设事件A :甲乙两人中至少有一人抽到选择题.将A 分拆为B :“甲选乙判”,C :“甲选乙选”,D :“甲判乙选”三个互斥事件, 则P (A )=P (B )+P (C )+P (D ).而P (B )=C 16C 14C 110C 19,P (C )=C 16C 15C 110C 19,P (D )=C 14·C 16C 110C 19,∴P (A )=2490+3090+2490=7890=1315. 方法2:设事件A :甲乙两人中至少有一人抽到选择题,则其对立事件为A :甲乙两人均抽判断题.∴P (A )=C 14C 13C 110C 19=1290,∴P (A )=1-1290=7890=1315.故甲、乙两人中至少有一人抽到选择题的概率为1315.答案 131510.三位同学参加跳高、跳远、铅球项目的比赛.若每人都选择其中两个项目,则有且仅有两人选择的项目完全相同的概率是________(结果用最简分数表示).解析 根据条件求出基本事件的个数,再利用古典概型的概率计算公式求解.因为每人都从三个项目中选择两个,有(C 23)3种选法,其中“有且仅有两人选择的项目完全相同”的基本事件有C 23C 13C 12个,故所求概率为C 23C 13C 12(C 23)3=23. 答案 23 三、解答题11.某地区有小学21所,中学14所,大学7所,现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查.(1)求应从小学、中学、大学中分别抽取的学校数目;(2)若从抽取的6所学校中随机抽取2所学校做进一步数据分析,①列出所有可能的抽取结果;②求抽取的2所学校均为小学的概率.解(1)由分层抽样的定义知,从小学中抽取的学校数目为6×2121+14+7=3;从中学中抽取的学校数目为6×1421+14+7=2;从大学中抽取的学校数目为6×721+14+7=1.故从小学、中学、大学中分别抽取的学校数目为3,2,1.(2)①在抽取到的6所学校中,3所小学分别记为A1,A2,A3,2所中学分别记为A4,A5,1所大学记为A6,则抽取2所学校的所有可能结果为(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),(A3,A4),(A3,A5),(A3,A6),(A4,A5),(A4,A6),(A5,A6),共15种.②从6所学校中抽取的2所学校均为小学(记为事件B)的所有可能结果为(A1,A2),(A1,A3),(A2,A3),共3种.所以P(B)=315=15.12.从某小组的2名女生和3名男生中任选2人去参加一项公益活动.(1)求所选2人中恰有一名男生的概率;(2)求所选2人中至少有一名女生的概率.解析设2名女生为a1,a2,3名男生为b1,b2,b3,从中选出2人的基本事件有:(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),(b1,b2),(b1,b3),(b2,b3),共10种.(1) 设“所选2人中恰有一名男生”的事件为A,则A包含的事件有:(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),共6种,∴P(A)=610=35,故所选2人中恰有一名男生的概率为3 5 .(2)设“所选2人中至少有一名女生”的事件为B,则B包含的事件有:(a1,。
抽样方法、总体分布的估计

简单随机抽样、系统抽 题型一 样 ①抽签法、随机数表法 思维提 ; 示 ②系统抽样的步骤.
题型二 思维提示
分层抽样 由差异明显的几部 分组成的总体适于 用分层抽样
题型三 思维提示
频率分布条形图的有关 问题 条形图与频率分布直方 图的区别
例3
为了估计某人的射击技术状况,在他的 训练记录中抽取了50次进行检验,他命中的 环数如下:
(3)注意频率分布条形图和频率分布直方图
是两个不同的概念.虽然它们的横轴表示 的内容是相同的,但是频率分布条形图的 纵轴(矩形的高)表示频率;频率分布直方图 的纵轴(矩形的高)表示频率与组距的比值, 其相应组距上的频率等于该组距上的矩形 的面积. (4)无论样本容量多大,用样本频率分布估 计总体分布时,所作的只是一种估计,可 能出现误差甚至错误,也允许存在误 差.当然希望这种误差越小越好,因此常 在条件许可下,适当增加样本容量,合理
(1)请作出频率分布表,并画出频率分布直
方图; (2)估计纤度落在[1.38,1.50)中的概率及纤 度小于1.40的概率是多少? (3)统计方法中,同一组数据常用该组区间 的中点值(例如:区间[1.30,1.34)的中点值 是1.32)作为代表.据此,估计纤度的期 望. [分析] 按题目要求作出频率分布表、绘出 频率分布.抽样方法 全体 (1)总体:所要考查的对象的 个体 叫做总体,其中每一个要考察的对象称
为 .总体与个体之间的关系类似 从总体中抽取一部分个体 集合与元素之间的关系. 样本的容量 (2)样本: 叫做总 体的一个样本,样本中个体的数目称 为 .样本和总体之间的 关系类似于子集与集合之间的关系.
分组 频数 [解] (1)频率分布表如下: [1.30,1.34) 4 [1.34,1.38) 25 [1.38,1.42) 30 [1.42,1.46) 29 [1.46,1.50) 10 [1.50,1.54) 2 100 合计
高中数学:抽样方法与总体分布的估计

抽样方法与总体分布的估计 一、高考考点梳理1.随机抽样例1.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A.p 1=p 2<p 3B.p 2=p 3<p 1C.p 1=p 3<p 2D.p 1=p 2=p 32.用样本估计总体通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的频率分布;另一种是用样本的数字特征估计总体的数字特征(1)用样本的频率分布估计总体的频率分布①频率分布直方图的理解a.纵轴表示组距频率,即小长方形的高=组距频率; b.小长方形的面积=组距×组距频率=频率; c.数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.②频率分布折线图a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;b.总体密度曲线:随着样本容量的增加,作图时所分组数不断增多,组距减小,相应的频率分布折线图会越来越接近一条光滑曲线,即总体密度曲线。
③茎叶图的特点茎是指中间的一列数,通常为十位;叶是从茎的旁边生长出来的数,通常为个位。
(2)用样本的数字特征估计总体的数字特征①平均数、中位数、众数 数字特征 样本数据 平均数样本数据的算数平均数 中位数将数据按大小顺序依次排列, 处在最中间位置的一个数据(或最中间两个数据的平均数) 众数出现次数最多的数据②样本方差与标准差设样本的元素为n x x x ,,,21 ,样本的平均数为x ,则a.样本方差:()()()[]2222121s x x x x x x nn -++-+-= b.样本标准差: ()()()[]222211s x x x x x x n n -++-+-=③关于平均数、方差的有关性质a.若n x x x ,,,21 的平均数为x ,则a ,,,21+++n mx a mx a mx 的平均数为a x m +;b.若n x x x ,,,21 的方差为s 2,则a ,,,21+++n mx a mx a mx 的方差为22m s 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§11.5抽样方法与总体分布的估计考纲解读分析解读 1.掌握简单随机抽样、系统抽样、分层抽样等常用抽样方法,体会三种抽样方法的区别与联系及具体的操作步骤.2.会用样本的频率分布估计总体的分布,会用样本的数字特征估计总体的数字特征.3.样本数字特征及频率分布直方图为高考热点.有关统计内容及方法主要以选择题、填空题的形式呈现,分值约为5分,属容易题;抽样方法和各种统计图表与概率的有关内容相结合也会出现在解答题中,分值约为12分,属中档题.五年高考考点一随机抽样1.(2015湖北,2,5分)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石答案B2.(2014湖南,2,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D3.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案184.(2015湖南,13,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.答案45.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.答案60教师用书专用(6—11)6.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案B7.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()图1图2A.200,20B.100,20C.200,10D.100,10答案A8.(2013课标全国Ⅰ,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C9.(2013湖南,2,5分)某学校有男、女学生各500名.为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法答案D10.(2013陕西,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B11.(2013江西,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08B.07C.02D.01答案D考点二用样本估计总体1.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A2.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D3.(2015重庆,3,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19B.20C.21.5D.23答案B4.(2015安徽,6,5分)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.32答案C5.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.16.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000. (3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.教师用书专用(7—15)7.(2014山东,7,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18答案C8.(2013福建,4,5分)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.120答案B9.(2013重庆,4,5分)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5B.5,5C.5,8D.8,8答案C10.(2013辽宁,5,5分)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60答案B11.(2015江苏,2,5分)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.答案612.(2014江苏,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.答案2413.(2013湖北,11,5分)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为;(2)在这些用户中,用电量落在区间[100,250)内的户数为.答案(1)0.0044(2)7014.(2013江苏,6,5分)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为.答案215.(2013广东,17,12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201530(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.解析(1)样本均值为==22.(2)由(1)知样本中优秀工人占的比例为=,故推断该车间12名工人中有12×=4名优秀工人.(3)设事件A:从该车间12名工人中,任取2人,恰有1名优秀工人,则P(A)==.三年模拟A组2016—2018年模拟·基础题组考点一随机抽样1.(2018江西重点中学盟校第一次联考,1)要从已编号(1~70)的70枚最新研制的某型导弹中随机抽取7枚来进行发射试验,用系统抽样方法确定所选取的7枚导弹的编号可能是()A.5,10,15,20,25,30,35B.3,13,23,33,43,53,63C.1,2,3,4,5,6,7D.1,8,15,22,29,36,43答案B2.(2017湖南永州模拟,3)某学校高一、高二、高三年级的学生人数之比为4∶3∶3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为()A.15B.20C.25D.30答案A3.(2018江苏南京联合体学校调研,3)为检验某校高一年级学生的身高情况,现采用先分层抽样后简单随机抽样的方法抽取一个容量为210的样本,已知每个学生被抽取的概率为0.3,且男女生的比例是4∶3,则该校高一年级女生的人数是.答案3004.(2016广东东莞高三模拟,12)要考察某公司生产的500克袋装牛奶中三聚氰胺的含量是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是.(下面摘取了随机数表第7行至第9行) 84421753315724550688770474476721763350258392120676(第7行) 63016378591695556719981050717512867358074439523879(第8行) 33211234297864560782524207443815510013429966027954(第9行)答案068考点二用样本估计总体5.(2018四省名校(南宁二中等)第一次大联考,3)如图是2017年国庆中秋长假期间某客运站客运量比去年同期增减情况的条形图.根据图中的信息,以下结论中不正确的是()A.总体上,今年国庆长假期间客运站的客流比去年有所增长B.10月3日、4日的客流量比去年增长较多C.10月6日的客流量最小D.10月7日同比去年客流量有所下滑答案C6.(2017广东清远清新一中一模,5)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()1 2 3 4 5 6250233 124489 5557788 90011479 178A.46,45,56B.46,45,53C.47,45,56D.45,47,53答案A7.(2017山西大学附属中学第二次模拟,3)某高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为()A.20,2B.24,4C.25,2D.25,4答案C8.(2017上海浦东新区期中联考,9)从总体中抽取一个样本:3、7、4、6、5,则总体标准差的估计值为. 答案B组2016—2018年模拟·提升题组(满分:55分时间:50分钟)一、选择题(每小题5分,共20分)1.(2018山东师大附中第三次模拟,6)下图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是()A.51B.58C.61D.62答案D2.(2018山东济南外国语学校12月考试,4)给出下列四个命题:①将A,B,C三种个体按3∶1∶2的比例分层抽样调查,若抽取的A个体的个体数为12个,则样本容量为30;②一组数据1、2、3、4、5的平均数、中位数相同;③甲组数据的方差为5,乙组数据为5、6、9、10、5,那么这两组数据中较稳定的是甲;④统计的10个样本数据为95,105,114,116,120,120,122,125,130,134,则样本数据落在[114.5,124.5]内的频率为0.4.其中真命题为()A.①②B.②③C.③④D.②④答案D3.(2017安徽淮北第二次模拟,4)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1℃,则甲地该月11时的平均气温的标准差为()A.2B.C.10D.答案B4.(2016广东惠州第一中学第二次调研,5)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)的统计图如图所示,假设得分值的中位数为m,众数为n,平均数为,则()A.m=n=B.m=n<C.m<n<D.n<m<答案D二、填空题(每小题5分,共10分)5.(2018陕西榆林第二中学第七次模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为.答案1006.(2016安徽安庆二模,15)某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,根据统计结果绘制的频率分布直方图如下,则她们的平均运动时间大约是分钟.答案56.5三、解答题(共25分)7.(2018四省名校(南宁二中等)第一次大联考,18)在某单位的食堂中,食堂每天以10元/千克的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2千克,如果当天卖不完,剩下的米粉以2元/千克的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80千克米粉,以x(千克)(其中50≤x≤100)表示米粉的需求量,T(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求T的分布列和数学期望.解析(1)一千克米粉的售价是4.4×5=22元.当50≤x≤80时,T=22x-10×80+2(80-x)=20x-640.当80<x≤100时,T=22×80-10×80=960.故T=设利润不少于760元为事件A,当50≤x≤80时,由20x-640≥760解得x≥70,所以70≤x≤80.当80<x≤100时,960>760显然成立,故70≤x≤100.由直方图可知,当70≤x≤100时,P(A)=10×(0.03+0.015+0.02)=0.65.(2)当x=55时,T=20×55-640=460;当x=65时,T=20×65-640=660;当x=75时,T=20×75-640=860;当x>80时,T=960.所以T的可能取值为460,660,860,960.P(T=460)=0.015×10=0.15,P(T=660)=0.02×10=0.2,P(T=860)=0.03×10=0.3,P(T=960)=(0.015+0.02)×10=0.35. 故T 的分布列为E(T)=460×0.15+660×0.2+860×0.3+960×0.35=795.8.(2017湖北襄阳四中五模,18)为了引导居民合理用水,某市决定全面实施阶梯水价,阶梯水价原则上以住宅(一套住宅为一户)的月用水量为基准定价,具体划分标准如表:从该市随机抽取了10户家庭,统计了同一个月的用水量,得到如图所示的茎叶图. (1)现要在这10户家庭中任意选取3户,求取到第二阶梯水量的户数X 的分布列和均值;(2)用抽到的10户家庭作为样本估计全市的居民用水情况,从全市依次随机抽取10户,若抽到n 户月用水量为第二阶梯水量的可能性最大,求出n 的值.解析 (1)由茎叶图可知,抽取的10户家庭中用水量为一阶的有2户,二阶的有6户,三阶的有2户.取到第二阶梯水量的户数X 的可能取值为0,1,2,3.则P(X=k)=,可得P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=.故X 的分布列为:EX=0×+1×+2×+3×=.(2)设从全市依次随机抽取10户,抽到Y 户月用水量为第二阶梯水量,则Y~B.P(Y=k)=(k=0,1,2,…,10).设t==(k=1,2,…,10).若t>1,则k<6.6,P(Y=k-1)<P(Y=k).若t<1,则k>6.6,P(Y=k-1)>P(Y=k),∴k取6时P(Y=k)取到最大值.经过验证k=6时符合题意.∴n=6.C组2016—2018年模拟·方法题组方法1抽样方法1.(2017安徽亳州二中5月模拟)某学校有2500名学生,其中高一1000人,高二900人,高三600人,为了了解学生的身体健康状况,采用分层抽样的方法,从该校学生中抽取100人,若样本中高一和高三的人数分别为a,b,且直线ax+by+8=0与以A(1,-1)为圆心的圆交于B,C两点,且∠BAC=120°,则圆A的方程为()A.(x-1)2+(y+1)2=1B.(x-1)2+(y+1)2=2C.(x-1)2+(y+1)2=D.(x-1)2+(y+1)2=答案C2.(2017山东潍坊高考三模,5)一个总体中有600个个体,随机编号为001,002,…,600,利用系统抽样的方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为()A.056,080,104B.054,078,102C.054,079,104D.056,081,106答案D方法2频率分布直方图的应用3.(2017湖南长沙二模,18)某种产品的质量以其质量指标衡量,并依据质量指标值划分等级如表:从某企业生产的这种产品中抽取200件,检测后得到如图所示的频率分布直方图:(1)根据抽样调查的数据,能否认为该企业生产这种产品符合“一、二等品至少要占到全部产品的92%”的规定?(2)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率.解析(1)根据抽样调查数据知,一、二等品所占比例的估计值为0.200+0.300+0.260+0.090+0.025=0.875,由于该估计值小于0.92,故不能认为该企业生产的这种产品符合“一、二等品至少要占到全部产品的92%”的规定.(2)由频率分布直方图知,一、二、三等品的频率分别为0.375、0.5和0.125,故可抽取一等品3件,二等品4件,三等品1件,再从这8件产品中随机抽取4件,一、二、三等品都有的情形有2种,①一等品2件,二等品1件,三等品1件;②一等品1件,二等品2件,三等品1件,故所求的概率P==.方法3求样本的数字特征及用其估计总体的数字特征4.(2016贵州遵义航天高中模拟,3)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5答案B5.(2017河北衡水武邑中学二模,14)已知一组正数x1,x2,x3的方差s2=(++-12),则数据x1+1,x2+1,x3+1的平均数为.答案3。