江苏高考数学一轮复习《抽样方法与总体分布的估计》 教程学案

合集下载

高考数学一轮复习 第十一章 统计与概率 第1讲 抽样方法与总体分布的估计 理(2021年最新整理)

高考数学一轮复习 第十一章 统计与概率 第1讲 抽样方法与总体分布的估计 理(2021年最新整理)

2018版高考数学一轮复习第十一章统计与概率第1讲抽样方法与总体分布的估计理编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高考数学一轮复习第十一章统计与概率第1讲抽样方法与总体分布的估计理)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高考数学一轮复习第十一章统计与概率第1讲抽样方法与总体分布的估计理的全部内容。

第十一章统计与概率第1讲抽样方法与总体分布的估计一、选择题1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是().A.总体 B.个体是每一个零件C.总体的一个样本 D.样本容量解析200个零件的长度是总体的一个样本.答案C2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).A.错误! B。

错误! C.错误! D.错误!解析从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是错误!=错误!。

答案C3.样本中共有五个个体,其值分别为a,0,1,2,3。

若该样本的平均值为1,则样本方差为().A。

错误!B。

错误! C.错误!D.2解析由题可知样本的平均值为1,所以错误!=1,解得a=-1,所以样本的方差为错误![(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2。

答案D4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则().A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9。

江苏高考数学一轮复习《总体特征数的估计》 教程学案

江苏高考数学一轮复习《总体特征数的估计》 教程学案

第78课 总体特征数的估计1. 会根据实际问题的需求,合理地选取样本,掌握从样本数据中提取基本的数据特征(如平均数、方差、标准差)的方法.2. 理解统计中的常用术语:总体、个体、样本、平均数、方差、中位数、众数.3. 体会用样本估计总体的统计思想,解决简单的实际问题;会通过对数据的分析为合理的决策提供一些依据,体会统计思维与确定性思维的差异,形成对数据处理过程进行初步评价的意识.1. 阅读:必修5第65~78页.2. 解悟:①∑ni =1a i =a 1+a 2+…+a n ;②哪些量可以估计总体的特征?③标准差是样本数据到平均数的一种平均距离;④方差和标准差的公式.3. 践习:在教材空白处,完成第72~73页习题第4、5、6、7题.基础诊断1. 若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为 2 . 解析:由题意知15×(9+8+x +10+11)=10,解得x =12,所以该组样本数据的方差为s 2=15×[(9-10)2+(8-10)2+(12-10)2+(10-10)2+(11-10)2]=2.2. 若数据x 1,x 2,x 3,x 4,x 5,3的平均数是3,则数据x 1,x 2,x 3,x 4,x 5的平均数是 3 W.解析:由题意得x 1+x 2+x 3+x 4+x 5+3=3×6,则x 1+x 2+x 3+x 4+x 5=15,所以x 1,x 2,x 3,x 4,x 5的平均数为(x 1+x 2+x 3+x 4+x 5)÷5=15÷5=3.3. 已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为2 W.解析:因为数据x 1,x 2,x 3,x 4,x 5的方差为2,所以2x 1,2x 2,2x 3,2x 4,2x 5的方差为22×2=8,所以其标准差为2 2.4. 如图是甲、乙两位射击运动员的5次训练成绩(单位:环)的茎叶图,则成绩较为稳定(方差较小)的运动员是 甲 .解析:x甲=(87+89+90+91+93)÷5=90,s 2甲=15×[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4;x乙=(78+88+89+96+99)÷5=90,s 2乙=15×[(78-90)2+(88-90)2+(89-90)2+(96-90)2+(99-90)2]=53.2.因为s 2甲<s 2乙,所以成绩比较稳定的运动员是甲.范例导航考向❶ 算术平均数例1 如图是一次摄影大赛上七位评委给某参赛作品打出的分数的茎叶图,记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是 1 .解析:若x>4,则去掉一个最高分90+x 和一个最低分86后,平均分为15×(89+91+92+92+94)=91.6(分),不符合题意,故x ≤4,最高分是94.去掉一个最高分94和一个最低分86后,平均分是15×(89+92+90+x +91+92)=91,解得x =1.已知样本6,7,8,9,m 的平均数是8,则该数据的标准差是2 .解析:由题意得15×(6+7+8+9+m)=8,解得m =10,所以该数据的方差s 2=15×[(8-6)2+(8-7)2+(8-8)2+(8-9)2+(8-10)2]=2,所以s = 2. 考向❷ 方差例2 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5. (1) 分别计算两组数据的平均数; (2) 分别计算两组数据的方差;(3) 根据计算结果,估计一下两名战士的射击水平谁更好一些. 解析:(1) x 甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2) 由方差公式s 2=1n[(x 1-x)2+(x 2-x)2+…+(x n -x)2]可求得s 2甲=3,s 2乙=1.2. (3) 由x 甲=x 乙,说明甲、乙两战士的平均水平相当.因为s 2甲>s 2乙,说明甲战士射击水平波动大,所以乙战士比甲战士射击水平更稳定.甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:选手 第1轮 第2轮 第3轮 第4轮 第5轮 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8则甲、乙两位选手中成绩比较稳定的选手的方差是 0.02 . 解析:x甲=(9.8+9.9+10.1+10+10.2)÷5=10,s 2甲=15×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02;x 乙=(9.4+10.3+10.8+9.7+9.8)÷5=10,s 2乙=15×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,所以甲、乙两位选手中成绩比较稳定的选手的方差为0.02. 考向❸ 标准差例3 在某次测验中,有6位同学的平均成绩为75分.用x n 表示编号为n(n =1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:编号n12345成绩x n7076727072(1) 求第6位同学的成绩x 6,及这6位同学成绩的标准差s ;(2) 从前5位同学中,随机地选2位同学,求恰有1位同学的成绩在区间(68,75)上的概率.解析:(1) 因为这6位同学的平均成绩为75分, 所以16×(70+76+72+70+72+x 6)=75,解得x 6=90.这6位同学成绩的方差:s 2=16×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2]=49,所以标准差s =7.(2) 从前5位同学中,随机地选取2位同学的成绩有:(70,76),(70,72),(70,70),(70,72),(76,72),(76,70),(76,72),(72,70),(72,72),(70,72),共10种,恰有1位同学成绩在区间(68,75)中的有: (70,76),(76,72),(76,70),(76,72),共4种,所以所求的概率为410=0.4,即恰有1位同学的成绩在区间(68,75)上的概率为0.4.自测反馈1. 样本数据 8,6,6,5,10 的方差s 2= 3.2 .解析:x =(8+6+6+5+10)÷5=7,s 2=15×[(8-7)2+(6-7)2+(6-7)2+(5-7)2+(10-7)2]=3.2.2. 若数据2,x ,2,2的方差为0,则x = 2 .解析:设数据的平均数为x ,则14×[3(2-x)2+(x -x)2]=0,解得x =x =2,故x 的值为2.3. 若一组样本2 015,2 017,x ,2 018,2 016的平均数是2 017,则该组样本数据的方差是 2 .解析:由题意得15×(2 015+2 017+x +2 018+2 016)=2 017,解得x =2 019,所以样本数据的方差s 2=15×[(2 015-2 017)2+(2 017-2 017)2+(2 019-2 017)2+(2 018-2 017)2+(2 016-2 017)2]=2.4. 如图,茎叶图记录了甲、乙两组各3名同学在期末考试中的数学成绩,则方差较小的那组同学成绩的方差为143.解析:x 甲=13×(88+92+96)=92,s 2甲=13×[(92-88)2+(92-92)2+(92-96)2]=323;x 乙=13×(90+91+95)=92,s 22=13×[(92-90)2+(92-91)2+(92-95)2]=143,所以方差较小的那组同学成绩的方差为143.1. 要能够体会用样本估计总体的方法,体会统计思维与确定性思维的不同,理解统计学的实际意义.2. 掌握样本特征数的方法,主要是平均数、方差和标准差的公式.3. 你还有哪些体悟,写下来:。

2021版数学攻略大一轮复习新高考(新):§11.4 抽样方法与总体分布的估计

2021版数学攻略大一轮复习新高考(新):§11.4 抽样方法与总体分布的估计

§11.4抽样方法与总体分布的估计基础篇固本夯基【基础集训】考点一随机抽样1.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次有关,第一次可能性最大B.与第几次有关,第一次可能性最小C.与第几次无关,与抽取的第几个样本有关D.与第几次无关,每次可能性相等答案D2.某单位员工按年龄分为A,B,C三组,其人数之比为5∶4∶1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是1,则该单位员工总数为()45A.110B.100C.900D.800答案B3.《中国诗词大会》的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为()A.2B.4C.5D.6答案B4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案10考点二用样本估计总体5.甲、乙两组数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是()A.极差B.方差C.平均数D.中位数答案C6.为比较甲、乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月5天11时的平均气温比乙地该月5天11时的平均气温高1℃,则甲地该月5天11时的气温数据的标准差为()甲乙9826892m0311A.2B.√2C.10D.√10答案B7.某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间[90,110]内),将这些数据分成4组:[90,95),[95,100),[100,105),[105,110],得到如下两个频率分布直方图:已知这两种配方生产的产品利润y(单位:百元)与其质量指标值t 的关系式为y={-1,t <95,0,95≤t <100,1,100≤t <105,2,t ≥105.若以上面数据的频率作为概率,分别从用A 配方和B 配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为( )A.0.125B.0.195C.0.215D.0.235 答案 B8.某高二(1)班一次阶段性考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2B.24,4C.25,2D.25,4 答案 C9.对某商店一个月(30天)内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 3 4 5 6 25 0233 124489 55577889 0011479 178A.46,45,56B.46,45,53C.47,45,56D.45,47,53 答案 A10.某大型企业为鼓励员工多利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,通过抽样,得到100位员工每人手机月平均使用流量L(单位:M)的数据,其频率分布直方图如图:将频率视为概率,回答以下问题:(1)从该企业的员工中随机抽取3人,求这3人中至多有1人手机月平均使用流量不超过900M 的概率; (2)据了解,某网络运营商推出两款流量套餐,详情如下:套餐名称 月套餐费(单位:元) 月套餐流量(单位:M) A 20 700B301000流量套餐的规则是:每月1日收取套餐费.如果手机实际使用流量超出套餐流量,则需要购买流量叠加包,每一个叠加包(包含200M 的流量)需要10元,可以多次购买;如果当月流量有剩余,将会被清零.该企业准备为所有员工订购其中一款流量套餐,并支付所有费用.请分别计算两种套餐所需费用的数学期望,并判断该企业订购哪一款套餐更经济.解析(1)依题意,知(0.0008+a+0.0025+0.0035+0.0008+0.0002)×100=1,解得a=0.0022.从该企业的员工中随机抽取3人,可近似地看作独立重复试验,每人手机月平均使用流量不超过900M的概率为1-(0.0008+0.0002)×100=0.9,设事件A为“3人中至多有1人手机月平均使用流量不超过900M”,则P(A)=C31×0.9×0.12+0.13=0.028.(2)若该企业选择A套餐,设一位员工所需的费用为X元,则X可以为20,30,40,X的分布列为X203040P0.30.60.1E(X)=20×0.3+30×0.6+40×0.1=28.若该企业选择B套餐,设一位员工所需的费用为Y元,则Y可以为30,40,Y的分布列为Y3040P0.980.02E(Y)=30×0.98+40×0.02=30.2,∵30.2>28,∴该企业订购A套餐更经济.综合篇知能转换【综合集训】考法一频率分布直方图的应用1.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形,则该组的频数为.的面积等于其余(n-1)个小矩形面积和的13答案502.(2018福建六校联考,19)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合计100(1)求频率分布直方图中的a,b的值;(2)从课外阅读时间在[14,18]的学生中任选2人,求恰好有1人阅读时间在[14,16),另1人阅读时间在[16,18]的概率.解析 (1)课外阅读时间落在[6,8)的有22人,频率为0.22,所以a=0.222=0.11. 课外阅读时间落在[2,4)的有8人,频率为0.08, 所以b=0.082=0.04. (2)课外阅读时间落在[14,16)的有2人,记为m,n,课外阅读时间落在[16,18]的有2人,记为x,y, 则从课外阅读时间落在[14,18]的学生中任选2人的事件包含(m,n),(m,x),(m,y),(n,x),(n,y),(x,y),共6种, 其中恰好有1人阅读时间在[14,16),另1人阅读时间在[16,18]的事件有(m,x),(m,y),(n,x),(n,y),共4种, 所以所求概率P=46=23.3.(2019安徽六安第二中学联考,19)每年5月到7月是芒果的成熟季节.某大学校内也种植了很多食用芒果树.据该校后勤处负责人介绍,他们校内的芒果种植过程中没有使用过农药,也没有路边那种绿化芒的污染,可以放心食用.2018年该校的芒果也迎来了大丰收.6月25日,该校南北校区集中采摘芒果,并将采摘到的芒果免费派送给学校师生.现随机从一些芒果树上摘下100个芒果,其质量分布在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400)(单位:克)内,经统计得频率分布直方图如图所示.(1)现按分层抽样从质量在[250,300),[300,350)内的芒果中随机抽取9个,再从这9个中随机抽取3个,记随机变量X 表示质量在[300,350)内的芒果个数,求X 的分布列及数学期望;(2)以各组数据的中间数代表这组数据的平均值,将频率视为概率,假如你是经销商去收购芒果,该校当时还未摘下的芒果大约还有10000个,现提供如下两种收购方案: A:所有芒果以10元/千克收购;B:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购. 通过计算确定你会选择哪种方案.解析 (1)9个芒果中,质量在[250,300)和[300,350)内的分别有6个和3个. 则X 的可能取值为0,1,2,3. P(X=0)=C 63C 93=2084,P(X=1)=C 62C 31C 93=4584, P(X=2)=C 61C 32C 93=1884,P(X=3)=C 33C 93=184.(4分) 所以X 的分布列为X 0123P208445841884184X 的数学期望E(X)=0×2084+1×4584+2×1884+3×184=1.(6分) (2)方案A:经销商需支付学校的金额为(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10000×10×0.001=25750(元).(9分)方案B:质量低于250克的芒果,经销商需支付学校的金额为(0.002+0.002+0.003)×50×10000×2=7000(元),质量高于或等于250克的芒果,经销商需支付学校的金额为(0.008+0.004+0.001)×50×10000×3=19500(元), 总计支付7000+19500=26500元.由于25750<26500,故方案B 经销商支出金额更多,应选方案A.(12分) 思路分析 (1)确定X 的取值,求取相应值的概率,列分布列并求数学期望;(2)分别求经销商选择A,B 方案的支出金额,比较可知结果.4.(2018湖南重点名校大联考)2016年年底,某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取若干市民对该项目进行评分(满分100分),绘制如图所示的频率分布直方图,并将分数从低到高分为四个等级:满意度评分 低于60分 60分到79分 80分到89分 不低于90分 满意度等级 不满意 基本满意 满意 非常满意已知满意度等级为基本满意的有680人.(1)若市民的满意度评分相互独立,以满意度样本估计全市市民满意度.现从全市市民中随机抽取4人,求至少有2人非常满意的概率; (2)在等级为不满意的市民中,老年人占13,现从该等级市民中按年龄分层抽取15人了解不满意的原因,并从中选取3人担任整改督导员,记X 为老年督导员的人数,求X 的分布列及数学期望E(X);(3)相关部门对该项目进行验收,验收的硬性指标是:市民对该项目的满意指数不低于0.8,否则该项目需进行整改,根据你所学的统计知识,判断该项目能否通过验收,并说明理由.(注:满意指数=满意度评分的平均分100)解析 (1)由频率分布直方图可知10×(0.035+a+0.020+0.014+0.004+0.002)=1,所以a=0.025,所以市民非常满意的概率为0.025×10=14. 又市民的满意度评分相互独立,故所求事件的概率P=1-C 40(14)0(34)4-C 41(14)1(34)3=1-189256=67256. (2)按年龄分层抽样抽取15人了解不满意的原因, 则老年人有15×13=5(人),由题意知X 的可能取值为0,1,2,3, P(X=0)=C 103C 153=2491,P(X=1)=C 51C 102C 153=4591,P(X=2)=C 52C 101C 153=2091,P(X=3)=C 53C 153=291. 所以X 的分布列为X 0123P249145912091291所以E(X)=0×2491+1×4591+2×2091+3×291=1. (3)能通过验收.理由:由频率分布直方图,得市民满意度评分的平均分为(45×0.002+55×0.004+65×0.014+75×0.020+85×0.035+95×0.025)×10=80.7,因此市民对该项目的满意指数为80.7100=0.807,因为0.807>0.8,所以该项目能通过验收.考法二 样本的数字特征及其应用5.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( ) A.x =4,s 2<2 B.x =4,s 2>2 C.x >4,s 2<2 D.x >4,s 2>26.(2018河北石家庄教学质量检测(二),9)某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.①④B.②③C.②④D.①③答案A7.(2019上海浦东期中教学质量检测(二模),10)已知6个正整数,它们的平均数是5,中位数是4,唯一众数是3,则这6个数方差的最大值为.(精确到小数点后一位)答案12.38.(2018安徽淮北一模,19)为了解某知名品牌两个不同型号手机M9,M10的待机时间(单位:小时),淮北某手机卖场从仓库中随机抽取M9,M10两种型号的手机各6台,在相同的条件下进行测试,统计结果如图:(1)根据茎叶图计算M9,M10两种型号手机的平均待机时间;(2)根据茎叶图判断M9,M10两种型号被测试手机待机时间方差的大小,并说明理由;(3)从待机时间在75小时以上的6台被测试手机中随机抽取2台,求至少有一台手机是M9的概率.解析(1)根据茎叶图中的数据,计算M9型号手机的平均待机时间为x M9=16×(56+69+65+70+76+84)=70(小时),M10型号手机的平均待机时间为x M10=16×(79+72+70+80+81+80)=77(小时).(2)M9型号手机待机时间方差大于M10型号手机待机时间方差.理由:M9型号手机待机时间的数据分布比较分散,波动较大;M10型号手机待机时间的数据分布比较集中,波动较小.(3)记M9型号手机待机时间在75小时以上的被测手机为A1,A2,M10型号手机待机时间在75小时以上的被测手机为B1,B2,B3,B4,从6台被测手机中任取2台有C62=15种取法,其中不符合题意的取法有(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共6种,所以所求的概率P=15-615=35.【五年高考】1.(2019课标Ⅲ,3,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.82.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A3.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A4.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D5.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案186.(2019课标Ⅲ,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解析本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4683513646426245568864373346992865183217552913通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2.P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.思路分析(1)将A、B地区数据逐一填入茎叶图,然后通过茎叶图进行比较.(2)设出事件且指明事件间的关系,利用相应概率公式得结论.8.(2016四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.教师专用题组(2011课标,19,12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数82042228B配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数412423210(1)分别估计用A配方,B配方生产的产品的优质品率;(2)已知用B配方生产的一件产品的利润y(单位:元)与其质量指标值t的关系式为y={-2,t<94,2,94≤t<102,4,t≥102.从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)解析(1)由试验结果知,用A配方生产的产品中优质品的频率为22+8100=0.3,所以用A配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B配方生产的产品中优质品的频率为32+10100=0.42,所以用B配方生产的产品的优质品率的估计值为0.42.(2)用B配方生产的100件产品中,其质量指标值落入区间[90,94),[94,102),[102,110]的频率分别为0.04,0.54,0.42,因此P(X=-2)=0.04,P(X=2)=0.54,P(X=4)=0.42,即X的分布列为X-224P0.040.540.42X的数学期望EX=-2×0.04+2×0.54+4×0.42=2.68.失分警示思路分析列分布列时各利润值对应的概率由于粗心而出现对应或计算错误.评析本题考查频率分布表及随机变量的分布列和数学期望,属于容易题.【三年模拟】一、单项选择题(每题5分,共50分)1.(2019江西吉安一模,4)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为()附:第6行至第9行的随机数表如下:26357900337091601620388277574950321149197306491676778733997467322748619871644148708628888519162074770111163024042979799196835125A.3B.16C.38D.20答案D2.(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.36答案D3.(2018湖北部分重点中学模拟,3)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为()A.19B.110C.15D.18答案B4.(2018湖南衡阳二模,4)已知样本x1,x2,…,x n的平均数为x,样本y1,y2,…,y m的平均数为y(x≠y),若样本x1,x2,…,x n,y1,y2,…,y m的平均数z=ax+(1-a)y,其中0<a<12,则n,m(n,m∈N*)的大小关系为()A.n=mB.n≥mC.n<mD.n>m答案C5.(2020届河南安阳第一次调研,3)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()A.甲所得分数的极差为22B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数答案D6.(2020届广西南宁10月摸底,3)某校8位学生的本次月考成绩恰好都比上一次的月考成绩高出50分,则以该8位学生这两次的月考成绩各自组成样本,则这两个样本不变的数字特征是()A.方差B.中位数C.众数D.平均数答案A7.(2020届安徽阜阳颍上二中等三校入学考,3)演讲比赛共有9位评委分别给出某位选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A8.(2020届河北深州中学9月质量监测,6)为了从甲、乙两组学生中选一组参加“喜迎祖国七十华诞,共建全国文明城市”知识竞赛活动,班主任老师将这两组学生最近6次的测试成绩进行统计,得到如图所示的茎叶图.若甲、乙两组的平均成绩分别是x甲、x乙,则下列说法正确的是()A.x甲>x乙,乙组比甲组成绩稳定,应选乙组参加竞赛B.x甲>x乙,甲组比乙组成绩稳定,应选甲组参加竞赛C.x甲<x乙,甲组比乙组成绩稳定,应选甲组参加竞赛D.x 甲<x 乙,乙组比甲组成绩稳定,应选乙组参加竞赛 答案 D9.(2018湖北孝感二模,5)某校高三年级10个班参加合唱比赛得分的茎叶图如图所示,若这组数据的平均数是20,则1a +9b的最小值为( )1 2 3 5 9 7 23a58bA.1B.32C.2D.52答案 C10.(2019安徽合肥二模,5)下表是某电器销售公司2018年度各类电器营业收入占比和净利润占比统计表:空调类 冰箱类 小家电类 其他类 营业收入占比 90.10% 4.98% 3.82% 1.10% 净利润占比95.80%-0.48%3.82%0.86%则下列判断中不正确...的是( ) A.该公司2018年度冰箱类电器销售亏损B.该公司2018年度小家电类电器营业收入和净利润相同C.该公司2018年度净利润主要由空调类电器销售提供D.剔除冰箱类电器销售数据后,该公司2018年度空调类电器销售净利润占比将会降低 答案 B二、多项选择题(每题5分,共15分)11.(2020届山东夏季高考模拟,9)下图为某地区2006年—2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年—2018年( ) A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势 B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同 C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量 D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大 答案 AD12.(改编题)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,( ) A.这七人年龄的众数变为40 B.这七人年龄的平均数变为49 C.这七人年龄的中位数变为60 D.这七人年龄的标准差变为24 答案 ABC13.(改编题)某赛季甲、乙两名篮球运动员各6场比赛得分情况如下:场次 1 2 3 4 5 6 甲得分 31 16 24 34 18 9 乙得分 23 21 32 11 35 10则下列说法正确的是( )A.甲运动员得分的极差小于乙运动员得分的极差B.甲运动员得分的中位数小于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定 答案 BD三、填空题(共5分)14.(2018陕西榆林第二中学第七次模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽查了一个容量为n 的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n 的值为 .答案 100四、解答题(共25分)15.(2020届广西桂林十八中第一次月考,18)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1400万元的年度销售任务.已知这200名销售员去年完成的销售额都在区间[2,22](单位:百万元)内,现将其分成5组:第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22],并绘制出如图所示的频率分布直方图.(1)若用分层抽样的方法从这200名销售员中抽取容量为25的样本,求a 的值和样本中完成年度任务的销售员人数;(2)从(1)中样本内完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,设获得此奖励的2名销售员在第4组的人数为X,求X 的分布列和期望.解析 (1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03,∴样本中完成年度任务的销售员人数为6. (2)X 的可能取值为0,1,2,P(X=0)=C 30C 32C 62=15,P(X=1)=C 31C 31C 62=35,P(X=2)=C 32C 30C 62=15,∴X 的分布列如下:X 012P153515则E(X)=1.16.(2018湖北黄冈模拟,18)2017年5月14日至15日,“一带一路”国际合作高峰论坛在中国首都北京举行,会议期间,达成了多项国际合作协议.假设甲、乙两种品牌的同类产品出口某国家的市场销售量相等,该国质量检验部门为了解它们的使用寿命,现从这两种品牌的同类产品中分别随机抽取300个进行测试,结果统计如图所示. (1)估计甲品牌产品寿命小于200小时的概率;(2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是乙品牌的概率;(3)从这两种品牌产品中抽取寿命超过300小时的产品3个,设随机变量X 表示抽取的产品是甲品牌的产品个数,求X 的分布列与数学期望.。

高考数学一轮复习专题十一概率与统计4抽样方法与总体分布的估计综合篇课件新人教A版

高考数学一轮复习专题十一概率与统计4抽样方法与总体分布的估计综合篇课件新人教A版

数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动
性越大.
4.茎叶图
(1)茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是
从茎的旁边生长出来的数.
(2)茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小顺序排成一列. 5.百分位数 (1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为a, b.可以发现,区间(a,b)内的任意一个数,都能把样本数据分成符合要求的
抽样比=
样本容量 总体容量
=
各层所抽取的个体数 各层个体数
.
考点二 用样本估计总体 1.频率分布表与频率分布直方图 频率分布表与频率分布直方图的绘制步骤如下: (1)求极差,即求一组数据中最大值与最小值的差; (2)决定组距与组数; (3)将数据分组; (4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与 样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布 表; (5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标 (小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上
=
8 15
,
P(ξ=2)=
C22C04 C62
=
1 15
,
所以ξ的分布列为
ξ
0
1
2
P
6
8
1
15
15
15
所以随机变量ξ的数学期望E(ξ)=0× 6 +1× 8 +2× 1 = 2 .
15 15 15 3
考法二 样本的数字特征及其应用 例2 (2021届新教材地区第一次月考)某工厂A,B两条生产线生产同款产 品,若产品按照一、二、三等级分类,则每件可分别获利10元、8元、6元, 现从A,B生产线生产的产品中各随机抽取100件进行检测,结果统计如图:

2021版数学(理科)攻略大一轮复习:11.4 抽样方法与总体分布的估计

2021版数学(理科)攻略大一轮复习:11.4 抽样方法与总体分布的估计

11.4抽样方法与总体分布的估计探考情悟真题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2017江苏,3,5分分层抽样★★★2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表、会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2019课标Ⅱ,5,5分样本数字特征2019课标Ⅲ,17,12分频率分布直方图及样本的数字特征2018课标Ⅰ,3,5分统计图中的扇形图2018课标Ⅲ,18,12分茎叶图的应用独立性检验2018课标Ⅱ,18,12分折线图的应用变量间的相关关系2017课标Ⅰ,19,12分样本平均数和标准差的应用正态分布2017课标Ⅱ,18,12分利用频率分布直方图求中位数的估计值独立性检验分析解读对于随机抽样,主要考查三种抽样方法,尤其是分层抽样和系统抽样,一般以选择题或填空题的形式出现;对于用样本估计总体,主要考查利用频率分布直方图、茎叶图、样本的数字特征估计总体,若单独命题,一般以选择题或填空题的形式出现,分值约为5分,属容易题;也常出现在解答题中,分值约为12分,属中档题.考查学生的数据分析能力和逻辑推理能力.破考点练考向【考点集训】考点一随机抽样1.(2020届云南名校10月高考适应性月考,3)某学校为了解1000名新生的近视情况,将这些学生编号为000,001,002,…,999,从这些新生中用系统抽样的方法抽取100名学生进行检查,若036号学生被抽到,则下面4名学生中被抽到的是()A.008号学生B.200号学生C.616号学生D.815号学生答案C2.(2019河南新乡模拟,4)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:不喜欢喜欢男性青年观众3010女性青年观众3050现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男性青年观众中抽取了6人,则n=()A.12B.16C.24D.32答案C3.(2019江西吉安一模,4)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为()附:第6行至第9行的随机数表如下:26357900337091601620388277574950321149197306491676778733997467322748619871644148708628888519162074770111163024042979799196835125A.3B.16C.38D.20答案D考点二用样本估计总体1.(2020届四川双流中学10月月考,4)一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本[40,60)内的数据个数为()分组[10,20)[20,30)[30,40)频数345A.14B.15C.16D.17答案B2.(2018广东茂名五大联盟学校3月联考,2)甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是()A.极差B.方差C.平均数D.中位数答案C3.(2020届河南洛阳尖子生第一次联合考试,13)已知样本x1,x2,…,x2019的平均数和方差分别是1和4,若y i=ax i+b(i=1,2,…,2019)的平均数和方差也是1和4,则a b=.答案1炼技法提能力【方法集训】方法1抽样方法的应用1.(2019江西上饶二模,4)某学校为响应“平安出行号召”,拟从2019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2000名再按照系统抽样的方法抽取,则每名学生入选的概率()A.不全相等B.均不相等C.都相等,且为140D.都相等,且为502019答案D2.(2020届陕西百校联盟TOP209月联考,15)为了了解某公司800名党员“学习强国”的完成情况,公司党委书记将这800名党员编号为1,2,3,…,800,并用系统抽样的方法随机抽取50人做调查.若第3组中40号被抽到,则第9组中被抽到的号码是.答案136方法2频率分布直方图的应用1.(2019河北示范性高中4月模拟,10)某学校对100间学生公寓的卫生情况进行综合评比,依考核分数分为A,B,C,D四个等级,其中分数在[60,70)为D等级;分数在[70,80)为C等级;分数在[80,90)为B等级;分数在[90,100]为A等级,考核评估后,得其频率分布折线图如图所示,估计这100间学生公寓评估得分的平均数是()A.80.25B.80.45C.80.5D.80.65答案C2.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,,则该组的频数为.若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的13答案50方法3样本的数字特征及其应用1.(2019江西临川第一中学等九校3月联考,3)某兄弟俩都推销某一小家电,现抽取他们其中8天的销售量(单位:台),得到的茎叶图如图所示,已知弟弟的销售量的平均数为34,哥哥的销售量的中位数比弟弟的销售量的众数大2,则x+y的值为()A.5B.13C.15D.20答案B2.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s2<2B.x=4,s2>2C.x>4,s2<2D.x>4,s2>2答案A【五年高考】A组统一命题·课标卷题组1.(2019课标Ⅲ,3,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8答案C2.(2019课标Ⅱ,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是() A.中位数 B.平均数 C.方差 D.极差答案A3.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A4.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A5.(2019课标Ⅲ,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解析本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.方法总结由频率分布直方图估计样本的数字特征:(x i表示第i个小矩形底边中点的横坐标,S i表示第i个小矩形的面积)①平均数x=x1S1+x2S2+…+x i S i+…+x n S n;②方差s2=(x1-x)2S1+(x2-x)2S2+…+(x n-x)2S n;③中位数:从左到右(或从右到左)小矩形面积之和等于0.5时对应点的横坐标;④众数:最高小矩形底边中点的横坐标.B组自主命题·省(区、市)卷题组考点一随机抽样1.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案182.(2015湖南,13,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.答案4考点二用样本估计总体1.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D2.(2015安徽,6,5分)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.32答案C3.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.8999011答案90C组教师专用题组1.(2015湖北,2,5分)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石答案B2.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案B3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D4.(2015重庆,3,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19B.20C.21.5D.23答案B5.(2013课标Ⅰ,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C6.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.17.(2015江苏,2,5分)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.答案68.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4683513646426245568864733469392865832117 5 5 2 9 1 3通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”; C B2表示事件:“B 地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2) =P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.思路分析 (1)将A 、B 地区数据逐一填入茎叶图,然后通过茎叶图作比较.(2)设出事件且指明事件间的关系,利用相应概率公式得结论.【三年模拟】一、选择题(每小题5分,共30分)1.(2020届四川双流中学10月月考,3)某调研机构随机调查了2019年某地区n 名业主物业费的缴费情况,发现缴费金额(单位:万元)都在区间[0.5,1.1]内,其频率分布直方图如图所示,若第五组的频数为32,则样本容量n=( )A.200B.400C.800D.1600 答案 B2.(2020届陕西汉中第四次质量检测,5)如果一组数中的每个数都减去同一个非零常数,则这一组数的( ) A.平均数不变,方差不变 B .平均数改变,方差改变 C.平均数不变,方差改变 D.平均数改变,方差不变3.(2019湖北武汉4月调研,4)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A类人数是()A.30B.40C.42D.48答案A4.(2020届重庆巴蜀中学高考适应性月考一,4)空气质量指数AQI是反映空气质量状况的指数,AQI越小,表明空气质量越好,如下表:AQI0~5051~100101~150151~200201~300>300指数值空气优良轻度污染中度污染重度污染严重污染质量下图是某城市5月1日~5月20日AQI指数变化的趋势,则下列说法正确的是()A.这20天中AQI指数值的中位数略高于200B.这20天中的重度污染及以上的天数占110C.该城市5月前半个月的空气质量越来越好D.该城市5月上旬的空气质量比中旬的空气质量好答案D5.(2020届江西抚州临川一中第一次联合考试,7)某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36、36、37、37、40、43、43、44、44,若用样本估计总体,年龄在(x-s,x+s)内的人数占公司人数的百分比是()(其中x是平均数,s为标准差,结果精确到1%)A.14%B.25%C.56%D.67%答案C6.(2019广东江门第一次模拟,7)已知a1,a2,a3,a4,a5成等差数列,且公差是5,则这组数据的标准差为()A.50B.5√2C.100D.10二、解答题(共15分)7.(2020届四川石室中学高三开学考试,17)某高校在2016年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下.组号分组频数频率第1组[160,165)50.050第2组[165,170)n0.350第3组[170,175)30p第4组[175,180)200.200第5组[180,185)100.100合计100 1.000(1)求频率分布表中n,p的值,补全频率分布直方图,并估计该组数据的中位数(保留1位小数);(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?(3)在(2)的前提下,学校决定从6名学生中随机抽取2名学生接受甲考官的面试,求第4组至少有1名学生被甲考官面试的概率.解析本题考查样本数据的中位数、分层抽样及古典概型的概率计算,属基础题.(1)由频率分布表可知:5+n+30+20+10=100,0.050+0.350+p+0.200+0.100=1.000,∴n=35,p=0.300,补全频率分布直方图如图.≈171.7,中位数为170+0.10.06即中位数的估计值为171.7.(2)由题意可知笔试成绩高的第3、4、5组的人数之比为3∶2∶1,现用分层抽样的方法选6名学生,故第3、4、5组每组各抽取学生的人数为3、2、1.(3)由(2)可知第3、4、5组每组各抽取学生的人数为3、2、1,记第3组的3名学生为c1,c2,c3,第4组的2名学生为d1,d2,第5组的1名学生为e,且“第4组至少有1名学生被甲考官面试”为事件A.则所有的基本事件有(c 1,c 2),(c 1,c 3),(c 1,d 1),(c 1,d 2),(c 1,e),(c 2,c 3),(c 2,d 1),(c 2,d 2),(c 2,e),(c 3,d 1),(c 3,d 2),(c 3,e),(d 1,d 2),(d 1,e),(d 2,e),共15种. 事件A 包括:(c 1,d 1),(c 1,d 2),(c 2,d 1),(c 2,d 2),(c 3,d 1),(c 3,d 2),(d 1,d 2),(d 1,e),(d 2,e),共9种. ∴P(A)=915=35.故第4组至少有1名学生被甲考官面试的概率为35.快乐分享,知识无界! 感谢您的下载!由Ruize 收集整理!。

高考数学(苏教版文)一轮配套学案:用样本估计总体

高考数学(苏教版文)一轮配套学案:用样本估计总体

第2讲用样本估计总体知识梳理1.频率分布直方图与茎叶图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)频率分布直方图的作法步骤:①求全距,决定组数和组距,组距=全距组数;②分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;③统计频数,计算频率,列出频率分布表.画出频率分布直方图.(4)将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.(5)茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.茎是指中间一列数,叶就是从茎的旁边生长出来的数,在样本数据较少时,用茎叶图表示数据的效果较好.2.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:样本数据的算术平均数,即x=1n(x1+x2+…+x n).在频率分布直方图中,中位数左边和右边的直方图的面积相等.(2)样本方差、标准差标准差s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].其中x n是样本数据的第n项,n是样本容量,x是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.辨析感悟1.对频率分布直方图的认识(1)在频率分布直方图中,小矩形的高表示频率.(×)(2)频率分布直方图中各个长方形的面积之和为1.(√)2.对样本数字特征的认识(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)(4)一组数据的方差越大,说明这组数据的波动越大.(√)(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)(7)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×)(8)(2013·湖北卷改编)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4,则平均命中环数为7,命中环数的标准差为4.(×)(9)(2014·广州调研改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是15.(√) [感悟·提升]1.作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.两个防范一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频率,如(1);二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考点一频率分布直方图的应用【例1】某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:组别频数频率145.5~149.580.16149.5~153.560.12153.5~157.5140.28157.5~161.5100.20161.5~165.580.16165.5~169.5m n合计M N(1)求出表中字母m、n、(2)在给出的直角坐标系中画出频率分布直方图;(3)估计该校高一女生身高在149.5~165.5 cm范围内有多少人?审题路线由频率分布表可以计算出m,n,M,N的值⇒作频率分布直方图⇒利用频率分布直方图求值.解(1)由题意M=80.16=50,落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4,频率为n=0.08,总频率N=1.00.(2)频率分布直方图如下图:(3)该所学校高一女生身高在149.5~165.5 cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342(人).规律方法解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×频率组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.【训练1】(2013·辽宁卷改编)某班级组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100]人.若低于60分的人数是15人,则该班的学生人数是________.解析第一、第二小组的频率分别是0.1,0.2,所以低于60分的频率是0.3,设班级人数为m,则15m=0.3,m=50.答案50考点二茎叶图的应用【例2】(2013·新课标全国Ⅰ卷)为了比较两种治疗失眠症的药(分别称为A药,B 药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.41.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解(1)设A药观测数据的平均数为x A,B药观测数据的平均数为x B,则x A=120(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.x B=120(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则x A>x B,因此A药的疗效更好.(2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上;B药疗效的试验结果有710的叶集中在茎0,1上.由上述可看出A药的疗效更好.规律方法茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.【训练2】(2013·重庆卷)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为________.解析 由茎叶图知落在区间[22,30)内的数据有22,22,27,29,共4个,因为共有10个数据,所以数据落在区间[22,30)内的频率为410=0.4. 答案 0.4考点三 样本的数字特征【例3】 甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【训练3】 (2013·山东卷改编)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:89⎪⎪⎪7 74 0 1 0 x 9 1则7个剩余分数的方差为________.解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以S 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0)=367. 答案 3671.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 2.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.易错辨析6——统计图表识图不准致误【典例】从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为________.[解析]该班学生视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故能报A 专业的人数为0.4×50=20.[答案]20[易错警示]解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误.[防范措施] 求解频率分布直方图中的数据问题,最容易出现的问题就是把纵轴误以为是频率导致错误.在频率分布直方图中,纵轴表示频率组距,我们用各个小矩形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高对应的数据与小矩形的宽(样本数据的组距)的乘积.【自主体验】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],那么图中a的值等于________.解析由频率分布直方图可知,(0.04+0.03+0.02+2a)×10=1.所以a=0.005.答案0.005基础巩固题组(建议用时:40分钟)一、填空题1.(2014·潮州二模)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲7879549107 4乙9578768677则甲、乙成绩较稳定的是________.答案乙2.(2014·常州模拟)如图为某个容量为100的样本的频率分布直方图,分组为[96,98),[98,100),[100,102),[102,104),[104,106],则在区间[98,100)上的数据的频数为________.解析在区间[98,100)上矩形的面积为0.1×2=0.2,所以在区间[98,100)上的频率为100×0.2=20.答案203.(2014·临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为________.解析由茎叶图可知,甲班学生成绩的众数是85,所以x=5.乙班学生成绩的中位数是83,所以y=3,所以x+y=5+3=8.答案84.(2014·惠州模拟)甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如下表:甲乙丙丁平均成绩x86898985方差s2 2.1 3.5 2.1 5.6从这四人中选择一人参加国际奥林匹克数学竞赛,最佳人选是________.答案丙5.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是________.①甲的成绩的平均数小于乙的成绩的平均数;②甲的成绩的中位数等于乙的成绩的中位数;③甲的成绩的方差小于乙的成绩的方差;④甲的成绩的极差小于乙的成绩的极差解析由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8;乙射靶5次的成绩分别为:5,5,5,6,9;所以x甲=4+5+6+7+85=6;x 乙=5+5+5+6+95=6.所以x 甲=x 乙.故①不正确.甲的成绩的中位数为6,乙的成绩的中位数为5,故②不正确.s 2甲=15[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=15×10=2,s 2乙=15[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=15×12=125,因为2<125, 所以s 2甲<s 2乙.故③正确.甲的成绩的极差为:8-4=4, 乙的成绩的极差为:9-5=4, 故④不正确. 答案 ③6.在如图所示的茎叶图表示的数据中,众数和中位数分别是________.解析 观察茎叶图可知,这组数据的众数是31,中位数是26. 答案 31,267.(2013·湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250]内的户数为________.解析(1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.答案0.004 4708.(2014·泉州二模)从某项综合能力测试中抽取50人的成绩,统计如表,则这50人成绩的平均数等于________、方差为________.分数5432 1人数1051515 5解析平均数为:5×10+4×5+3×15+2×15+1×550=3;方差为:150[(5-3)2×10+(4-3)2×5+(3-3)2×15+(3-2)2×15+(3-1)2×5]=1.6.答案3 1.6二、解答题9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解(1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.10.(2014·大连模拟)从某校高三年级800名男生中随机抽取50名学生测量其身高,据测量,被测学生的身高全部在155 cm到195 cm之间.将测量结果按如下方式分成8组:第一组[155,160),第二组[160,165),…,第八组[190,195],下图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差.求下列频率分布表中所标字母的值,并补充完成频率分布直方图.频率分布表:分组频数频率频率/组距…………[180,185)x y z[185,190)m n p…………解+0.04+0.04+0.06)×5=0.82,第八组的频率是0.008×5=0.04,所以第六、七组的频率和是1-0.82-0.04=0.14,所以第八组的人数为50×0.04=2,第六、七组的总人数为50×0.14=7.由已知得x+m=7,m-x=2-m,解得x=4,m=3,所以y=0.08,n=0.06,z=0.016,p=0.012.补充完成频率分布直方图如图所示.能力提升题组(建议用时:25分钟)一、填空题1.(2012·陕西卷改编)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则x甲______x乙,m甲______m乙(比较大小).解析x甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716.∴x甲<x乙.又∵m甲=20,m乙=29,∴m甲<m乙.答案<<2.(2014·长春调研)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40)、[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为________.解析由频率分布直方图可知,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的频率成等差数列分布,所以年龄在[35,40)的网民出现的频率为0.2.答案0.23.(2013·江苏卷)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892解析对于甲,平均成绩为x甲=15(87+91+90+89+93)=90,所以方差为s2甲=15(32+12+02+12+32)=4;对于乙,平均成绩为x乙=15(89+90+91+88+92)=90,所以方差为s2乙=15(12+02+12+22+22)=2,由于2<4,所以乙的平均成绩较稳定.答案 2二、解答题4.(2014·西安模拟)某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为100+1102=105.)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.解(1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3.(2)估计平均分为x=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121. (3)由题意,[110,120)分数段的人数为60×0.15=9(人).[120,130)分数段的人数为60×0.3=18(人).∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,∴需在[110,120)分数段内抽取2人,并分别记为m,n;在[120,130)分数段内抽取4人,并分别记为a,b,c,d;设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A,则基本事件共有(m,n),(m,a),…,(m,d),(n,a),…,(n,d),(a,b),…,(c,d)共15种.则事件A包含的基本事件有(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d)共9种.∴P(A)=915=35.。

苏教版高考总复习数学精品课件 主题四 概率与统计 第十章 第一节 抽样方法、统计图表、用样本估计总体


题型二 统计图表
角度1 频率分布直方图
典例3 (多选题)为征求个人所得税法修改建议, 某机构调查了10 000名当地职工的月收入情况,并根据 所得数据画出了样本的频率分布直方图,如图. 下列说法正确的是( ACD )
(2)若上学路上所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中 估计有__7_2_名学生可以申请住宿.
A.163.0
C B.164.0
C.163.5
D.164.5
规律方法 计算百分位数时,一是注意是第多少百分位数;二是注意是否按从小到大的顺序排序; 三是注意是否有相同的数据.
题型四 总体特征数估计
角度1 总体集中趋势的估计
典例6 某校从参加高二年级学业 水平测试的学生中抽出80名学生, 其数学成绩(均为整数)的频率 分布直方图如图所示. (1)求这次测试数学成绩的众数;
②从100部手机中一次抽取5部进行检测;
③某班有45名同学,指定个子最高的5名同学参加学校组织的篮球比赛;
④一彩民买彩票选号,从装有36个大小、形状都相同的号签的盒子中无放回地依次抽
取6个号签.
A.1
B.2
C.3
D.4
[解析] ①总体个数无限,不是简单随机抽样;②不是逐个抽取,不是简单随机抽样;③ 指定了5名同学参赛,不满足每个个体被抽到的可能性相同,不是简单随机抽样;④满 足简单随机抽样的定义.故选A.
(2)求这次测试数学成绩的中位数; (3)求这次测试数学成绩的平均数.
B
角度2 总体离散程度的估计
典例7(1) 已知某6个数据的平均数为4,方差为8,现加入2和6两个新数据,此时8个数
据的方差为( B )
A.8
B.7
C.6

苏教版版高考数学一轮复习第九章统计与统计案例用样本估计总体教学案

1.常用统计图表(1)作频率分布直方图的步骤:1求极差(即一组数据中最大值与最小值的差).2决定组距与组数.3将数据分组.4列频率分布表.5画频率分布直方图.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示错误!,每个小矩形的面积表示样本数据落在该组内的频率.各小矩形的面积和为1.(3)频率分布折线图和总体密度曲线1频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.2总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把错误!=错误!称为x1,x2,…,x n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!;s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2].错误!1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为错误!,那么mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m错误!+a.(2)数据x1,x2,…,x n的方差为s2.1数据x1+a,x2+a,…,x n+a的方差也为s2;2数据ax1,ax2,…,ax n的方差为a2s2.一、思考辨析(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(4)已知样本数据x1,x2,…,x n的均值错误!=5,则样本数据2x1+1,2x2+1,…,2x n +1的均值为10.()[答案](1)√(2)×(3)√(4)×二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8 C.12D.16B[设频数为n,则错误!=0.25,∴n=32×错误!=8.]2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92A[∵这组数据为87,89,90,91,92,93,94,96,∴中位数是错误!=91.5,平均数错误!=错误!=91.5.]3.(2019·盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为.2错误![由s2=错误!(x i—错误!)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2错误!.]4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有人.25[0.5×0.5×100=25.]考点1样本的数字特征的计算与应用利用样本的数字特征解决决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差A[设9位评委评分按从小到大排列为x1<x2<x3<x4...<x8<x9,则原始中位数为x5,去掉最低分x1,最高分x9后剩余x2<x3<x4 (x8)中位数仍为x5,∴A正确.]2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差C[根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.错误!甲=错误!(4+5+6+7+8)=6,错误!乙=错误!(5×3+6+9)=6,甲的成绩的方差为错误!=2,乙的成绩的方差为错误!=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,故选C.]3.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x—y|的值为()A.1B.2C.3D.4D[由题意可知错误!∴错误!∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.∴(x—y)2=x2+y2—2xy=16,∴|x—y|=4,故选D.]4.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分[—0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)组企业数22453147(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:错误!≈8.602.[解](1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为错误!=0.21.产值负增长的企业频率为错误!=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)错误!=错误!(—0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2==错误![(—0.40)2×2+(—0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,s=错误!=0.02×错误!≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方差的简化计算公式:s2=错误![(x错误!+x错误!+…+x错误!)—n错误!2],或写成s 2=错误!(x错误!+x错误!+…+x错误!)—错误!2,即方差等于原数据平方的平均数减去平均数的平方.考点2频率分布直方图频率、频数、样本容量的计算方法(1)错误!×组距=频率.(2)错误!=频率,错误!=样本容量,样本容量×频率=频数.(1)(2019·益阳模拟)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.1求乙离子残留百分比直方图中a,b的值;2分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).(1)D[由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D错误.](2)[解] 1由已知得0.70=a+0.20+0.15,故a=0.35.b=1—0.05—0.15—0.70=0.10.2甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.频率分布直方图的纵坐标是错误!,而不是频率,切莫与条形图混淆.[教师备选例题](2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)[解](1)如图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为错误!1=错误!(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为错误!2=错误!(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48—0.35)×365=47.45(m3).1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64B.54C.48 D.27B[前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a=22+32=54.]2.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)(0.002+0.009 5+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.007 5.即直方图中x的值为0.007 5.(2)月平均用电量的众数是错误!=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.0125)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a,则0.45+0.0125×(a—220)=0.5,解得a=224,即中位数为224.(3)月平均用电量在[220,240)的用户有0.0125×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为错误!=错误!.∴月平均用电量在[220,240)的用户中应抽取25×错误!=5(户).。

高考数学一轮复习 第1讲 抽样方法与总体分布的估计 课


3、解答题
考点梳理
1.三种抽样方法的比较
类别 简单随 机抽样
系统 抽样
分层 抽样
共同点
抽样过 程中每 个个体 被抽取 的概率 相等, 均属于 不放回 抽样
各自特点
相互联系
从总体中逐个抽 取
将总体均分成几 在起始部
部分,按事先确 分抽样时
定的规则在各部 采用简单
分中抽取
随机抽样
各层抽样 将分总层体进分行抽成样几层,时单样采随或用机系简 抽 统
频率分布直方图与茎叶图 助学微博
样本的数字特征
考点自测

频率分布直方图的绘制及
应用
【例2】
【训练2】
考向三 用样本的数字特征估计
总体的数字特征
【例3】 【训练3】
快速掌握抽样方法的技巧
A级
1、选择题

2、填空题
3、解答题
B级
1、选择题

2、填空题
单击题号显示结果 1
答案显示
C
单击图标显示详解
A.14 B.16 C.15 D.17 4.(2013·西北工大附 中测试)如图是容量为 150 的样本的频率分布 直方图,则样本数据 落在[6,10)内的频数为 ( ). A.12 B.48
C.60 D.80 5.(2013·长沙模拟)如图是某 学校一名篮球运动员在五场 比赛中所得分数的茎叶图, 则该运动员在这五场比赛中得分的方差为 ________. (注:方差 s2=n1[(x1- x )2+(x2- x )2+…+(xn
出抽样过程.
体.
解 由于总体及样本中的个体数较多,且无明显差
[方法锦囊]
异,因此采用系统抽样的方法,步骤如下: 第一步:先从 802 辆轿车中剔除 2 辆轿车(剔除方法 可用随机数法);
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1
第77课 抽样方法与总体分布的估计
1. 初步感受抽样统计的重要性和必要性.
2. 会用简单随机抽样法、系统抽样法、分层抽样法从总体中抽取样本.
3. 会列样本频率分布表,会画频率分布直方图、折线图、茎叶图,体会它们的特点,会用
样本的频率分布估计总体分布的规律.

1. 阅读:必修3第43~64页.
2. 解悟:①抽样方法;②总体分布估计的方法;③频率分布直方图的纵坐标是什么?不用
频率分布直方图,结合第57页例3如何直接作频率折线图?比较几种表示频率分布的方法,
看看各有哪些优点和不足?④重解第57页例3,体会为什么纵坐标是频率比组距.
3. 践习:在教材空白处,完成第62~63页习题第2、3、7、8题.
基础诊断
1. 一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.125,则n
的值为 320 .

解析:由题意得40n=0.125,解得n=320,故n的值为320.
2. 某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有
师生中抽取一个容量为n的样本,已知从男学生中抽取的人数为100,则n= 200 .

解析:由题意得800200+800+600=100n,解得n=200.
3. 某工厂生产A,B,C三种不同型号的产品,产品数量之比为3∶4∶7,现用分层抽
样的方法抽取容量为n的样本,样本中A型号产品有15件,那么样本容量n= 70 .

解析:由题意得33+4+7=15n,解得n=70.
4. 交通部门对某路段公路上行驶的汽车速度实施监控,从速度在50~90km/h的汽车中
抽取150辆进行分析,得到数据的频率分布直方图(如图所示),则速度在70km/h以下的汽
车有 75 辆.

解析:由频率分布直方图可得汽车速度在 70km/h 以下的频率是(0.02+0.03)×10=0.5.
因为共抽取汽车150辆,所以速度在70km/h以下的汽车有150×0.5=75(辆).
范例导航

考向❶ 简单随机抽样

例1 (1) 总体是由编号为01,02,…,19,20的20个个体组成.利用下面的随机
数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列的数字开始由左到右依
2

次选取两个数字,则选出来的第5个个体的编号为 01 ;
解析:(1) 从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数
字开始向右读,第一个数为65,不符合条件,第二个数72,不符合条件,第三个数为08,
符合条件,所以符合条件的依次是08,02,14,07,01,故第五个数是01.
(2) 为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家
了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为 3,2 ;
解析:(2) 因为92÷30不是整数,所以先必须剔除部分个体数.因为92÷30=3……2,所
以剔除个体数为2,间隔为3.
(3) 某高级中学共有学生3 000名,各年级男、女生人数如下表:
高一年级 高二年级 高三年级
女生
523 x y
男生
487 490 z
已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.若现需对各年
级用分层抽样的方法在全校抽取300名学生,则应在高三年级抽取的学生人数为 99 .

解析:(3) 由题意得x3 000=0.17,解得x=510,则高三年级的总人数为3 000-(523+
510+487+490)=990.因为对各年级用分层抽样的方法在全校抽取300名学生,所以高三年
级抽取的人数为9903 000×300=99.

考向❷ 茎叶图
例2 某校高三某班全体男生的一次数学测试成绩的茎叶图和频率分布直方图都受到了不
同程度的损坏,可见部分如下,则频率分布直方图中[80,90)之间的矩形的高为 0.016 .

解析:由频率分布直方图可知,分数在[50,60)之间的频率为0.008×10=0.08,所以该
班全体男生的人数为20.08=25.由茎叶图知可见部分共有21人,所以[80,90)之间的男生人
数为25-21=4,所以分数在[80,90)之间的男生人数为25-21=4,所以分数在[80,90)
之间的频率为425=0.16,所以对应矩形的高为0.16÷10=0.016.

考向❸ 频率分布直方图
例3 从全校参加科技知识竞赛的学生的试卷中,抽取一个样本,考察竞赛的成绩分布.将样
本分成5组,绘成如图所示的频率分布直方图.图中从左到右各小组的小长方形的高的比是
1∶3∶6∶4∶2,最右边一组的频数是6.请结合直方图提供的信息,解答下列问题:
3

(1) 样本容量是多少?
(2) 列出频率分布表;
(3) 成绩落在哪个范围的人数最多?并求该小组的频数与频率;
(4) 估计这次竞赛中,成绩不低于60分的学生人数占总人数的百分率.

解析:(1) 样本容量为(1+3+6+4+2)×62=48.
(2)
分组 [50.5, 60.5) [60.5, 70.5) [70.5, 80.5) [80.5, 90.5) [90.5, 100.5] 合计
频数
3 9 18 12 6 48
频率
0.062 5 0.187 5 0.375 0.25 0.125 1.00
(3) 成绩落在[70.5,80.5)范围的人数最多,频数为18,频率为0.375.

(4) 48-348=93.75%.
自测反馈
1. 某地区有高中10所,初中30所,小学60所,现采用分层抽样的方法从这些学校
中抽取20所学校对学生进行体质健康检查,则应抽取初中 6 所.

解析:由题意得2010+30+60×30=6(所),故应抽取初中6所.
2. 若总体中含有1 650个个体,现要采用系统抽样,从中抽取一个容量为35的样本,
分段时应先从总体中剔除 5 个个体,重新编号后应平均分为 35 段.
解析:由题意得1 650÷35=47……5,所以应剔除5个个体,平均分成35段.

3. 某单位有840名职工,现采用系统抽样的方法抽取42人做问卷调查,将840人按照
1,2,…,840随机编号,则抽取的42人中,编号落入区间[61,120]的人数为 3 .

解析:根据系统抽样的特点知,组距应为84042=20,所以编号落入区间[61,120]的人数
为(120-61+1)÷20=3.
4. 为了了解一批灯泡(共5 000只)的使用寿命,从中随机抽取了100只进行测试,其
使用寿命(单位:h)如下表:
使用 寿命 [500, 700) [700, 900) [900, 1 100) [1 100, 1 300) [1 300,
1 500]
只数
5 23 44 25 3
根据该样本的频数分布,估计使用寿命不低于1 100h的灯泡只数是 1 400 .

解析:由题意得25+3100×5 000=1 400,故估计使用寿命不低于1 100h的灯泡只数为1
400.
4

1. 强化抽样过程要时刻保证等可能性,否则对总体的估计就会失去意义.
2. 系统抽样时,当Nn是整数时,k=Nn;当Nn不是整数时,从N中剔除一些个体,使得
其为整数为止.如例1.
3. 你还有哪些体悟,写下来:
5

相关文档
最新文档