[高考总复习资料]数学一轮总复习第10章概率与统计第三节随机抽样用样本估计总体AB卷文1
2025年高考数学一轮复习 第十章 -第一节 抽样方法、统计图表、用样本估计总体【课件】

+
=
+
=______________.我们可以用样本平均数估计总体平均数.
+
+
+
+
四、统计图表
常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等
(见微专题).
五、百分位数
一般地,一组数据的第百分位数是这样一个值 ,它使得这组
%
100 − %
1 000名患者的相关信息,得到如下表格:
潜伏期/天
[0,2]
(2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,14]
人数
85
205
310
250
130
15
5
已知该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期
是否超过6天为标准进行分层抽样,若从上述1 000名患者中抽取200人,得到如下联表:
点,能从统计图表中获取有价值的信息.
3.理解并掌握百分位数的定义,理解并掌握计算有个数据的样本的第百分位数的步骤及
四分位数.
4.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统
计含义;能用样本(标准差、方差、极差)估计总体的离散程度,理解离散程度参数的统
计含义.
01
第十章 统计与成对数据的统计分析
第一节 抽样方法、统计图表、用样本估计总
体
1
1 强基础 知识回归
2
2 研考点 题型突破
1.了解简单随机抽样的含义及其解决问题的过程,了解分层抽样的必要性,能解决分层抽样
中的计算问题.
2025届高中数学一轮复习课件《随机抽样、用样本估计总体》ppt

高考一轮总复习•数学
第21页
(3)(2024·江西吉安模拟)总体由编号为 00,01,02,…,48,49 的 50 个个体组成,利用下面 的随机数表选取 6 个个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从
数字 3. 数字 3. 左到右依次选取两个数字,则选出的第 3 个个体的编号为 ( )
高考一轮总复习•数学
第10页
2.总体方差和总体标准差 (1)一般式:如果总体中所有个体的变量值分别为 Y1,Y2,…,YN,总体平均数为 Y ,则
总体方差 S2=N1i=N1 (Yi- Y )2.
(2)加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi 出现的频数为 fi(i=1,2,…,k),则总体方差为 S2=N1i=k1fi(Yi- Y )2.
高考一轮总复习•数学
第12页
3.简单随机抽样样本平均数、方差的计算公式的推广 (1)若数据 x1,x2,…,xn 的平均数为 x ,则数据 mx1+a,mx2+a,mx3+a,…,mxn +a 的平均数是 m x +a; (2)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,axn+b 的方差为 a2s2. 4.分层随机抽样样本均值、方差的计算公式的推广 如果将总体分为 k 层,第 j 层抽取的样本量为 nj,样本均值为 x j,样本方差为 s2j ,j=
高考一轮总复习•数学
第24页
(3)按随机数法,从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 因为编号由 2 个数字组成.
00~49 及重复的不选,则编号依次为 33,16,20,38,49,32,…,则选出的第 3 个个体的编 号为 20.故选 D.
高考数学一轮复习第十章概率、随机变量及其分布课时规范练51随机抽样、用样本估计总体

课时规范练51随机抽样、用样本估计总体基础巩固组1.(2020天津耀华中学高一期末)已知一组数据为4,5,6,7,8,8,40%分位数是()A.8B.7C.6D.52.(多选)(2020江苏泗洪质检)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力3.(多选)(2020江苏启东高一期末)某人射箭9次,射中的环数依次为7,8,9,7,6,9,8,10,8,关于这组数据,下列说法正确的是()A.这组数据的众数是8B.这组数据的平均数是8C.这组数据的中位数是6D.这组数据的方差是434.将甲、乙两个篮球队10场比赛的得分数据整理成如图所示的茎叶图,由图可知()A.甲队得分的众数是3B.甲、乙两队得分在[30,39)内的频率相等C.甲、乙两队得分的极差相等D.乙队得分的中位数是38.55.(2020陕西榆林高三四模)港珠澳大桥位于中国广东省珠江口伶仃洋海域内,是中国境内一项连接香港、珠海和澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.2018年10月24日上午9时开通运营后香港到澳门之间4个小时的陆路车程极大缩短.为了解实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[35,50]内,按通行时间分为[35,38),[38,41),[41,44),[44,47),[47,50]五组,其中通行时间在[38,47)内的车辆有182台,频率分布直方图如图所示,则n=()A.280B.260C.250D.2006.(2020天津一中高三月考)某社区组织“学习强国”的知识竞赛,从参加竞赛的市民中抽出40人,将其成绩分成以下6组:第1组[40,50),第2组[50,60),第3组[60,70),第4组[70,80),第5组[80,90),第6组[90,100],得到如图所示的频率分布直方图.现采用分层随机抽样的方法,从第2,3,4组中抽取8人,则第2,3,4组抽取的人数依次为()A.1,3,4B.2,3,3C.2,2,4D.1,1,67.(2020山东泰安高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x ,174,175,若样本数据的90%分位数是173,则x 的值为.8.(2020北京密云高三质检)某校高一年级三个班共有学生120名,这三个班的男生、女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=.现用分层随机抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为.班级一班二班三班女生人数20x y 男生人数2020z 综合提升组9.(多选)(2020山东淄博高三质检)某学校为了调查学生一周内在生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60)内10.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141109钱B.乙应付3224109钱C.丙应付1656109钱D.三者中甲付的钱最多,丙付的钱最少11.(多选)(2020山东嘉祥一中高三月考)在某次高中学科知识竞赛中,对4000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分12.(2020江西九江高三模拟)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是()A.17.2,3.6B.54.8,3.6C.17.2,0.4D.54.8,0.413.(2020福建福州高二期中)为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高二年级学生的生物成绩进行赋分,具体方案如下:A等级,排名等级占比7%,分数区间是83—100;B等级,排名等级占比33%,分数区间是71—82;C等级,排名等级占比40%,分数区间是59—70;D等级,排名等级占比15%,分数区间是41—58;E等级,排名等级占比5%,分数区间是30—40.现从全年段的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:(1)求图中a的值;(2)以样本估计总体的办法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的C等级及以上(含C等级);(3)若采用分层抽样的方法,从原始成绩在[40,50)和[50,60)内的学生中共抽取5人,查看他们的答题情况来分析知识点上的缺漏,再从中选取2人进行调查分析,求这2人中至少一人原始成绩在[40,50)内的概率.创新应用组14.(多选)(2020重庆巴蜀中学高三月考)气象意义上从春季进入夏季的标志为:“连续5天每天日平均温度不低于22℃”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据都是正整数,单位:℃)满足以下条件:甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据有1个是32,平均数是26,方差是10.2,则下列说法正确的是()A.进入夏季的地区至少有2个B.丙地区肯定进入了夏季C.不能肯定乙地区进入夏季D.不能肯定甲地区进入夏季15.如图是某城市100户居民的月平均用电量(单位:度)的频率分布直方图.(1)求频率分布求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?参考答案课时规范练51随机抽样、用样本估计总体1.C因为有6位数,所以6×40%=2.4,所以40%分位数是第三个数6.2.ABD由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为23520×50+30×45=110,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是110,因此只有C不正确,故选ABD.3.ABD数据从小到大排列为6,7,7,8,8,8,9,9,10,所以众数为8,故A正确;中位数为8,故C错误;平均数为6+7+7+8+8+8+9+9+109=8,故B正确;方差为19×[(6-8)2+(7-8)2×2+(8-8)2×3+(9-8)2×2+(10-8)2]=43,故D正确.4.D甲队得分的众数是33和35,故A错误;甲、乙两队得分在[30,39)内的频率分别为25和310,所以甲、乙两队得分在[30,39)内的频率不相等,故B错误;甲队得分的极差为51-24=27,乙队得分的极差为52-22=30,所以甲、乙两队得分的极差不相等,故C错误;乙队得分的中位数是34+432=38.5,故D正确.故选D.5.D由题意可知,通行时间在[38,47)内的频率为1-(0.01+0.02)×3=0.91,所以182=0.91,所以n=200.6.C由图可知第2,3,4组的频率之比为0.15∶0.15∶0.3,所以频数之比为1∶1∶2,现采用分层随机抽样的方法,从第2,3,4组中抽取8人,所以第2,3,4组抽取的人数依次为2,2,4.7.17290%分位数是173,所以r1742=173,x=172.8.249由题意可得120=0.2,解得x=24.三班总人数为120-20-20-24-20=36,用分层随机抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9.9.BC样本中支出在[50,60)内的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;样本中支出不少于40元的人数为0.0360.03×60+60=132,故B正确;n=600.3=200,故n的值为200,故C正确;若该校有2000名学生,则可能有0.3×2000=600(人)支出在[50,60)内,故D错误.10.B依题意由分层随机抽样可知,100÷(560+350+180)=10109,则甲应付10109×560=5141109(钱);乙应付10109×350=3212109(钱);丙应付10109×180=1656109(钱).11.ABC由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;成绩在[40,60)内的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4000×0.25=1000,故B 正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,在[70,80)内的频率为0.3,所以考生竞赛成绩的中位数为70+10×0.050.3≈71.67(分),故D错误.12.C设一组数据为x i(i=1,2,3,…,n),平均数为,方差为12,所得一组新数据为y i(i=1,2,3,…,n),平均数为,方差为22,则y i=3x i-50(i=1,2,3,…,n),=1+2+…+=1.6,即31-50+32-50+…+3-50=1.6,所以3-50=1.6,所以=51.63=17.2.22=1[(y1-)2+(y2-)2+…+(y n-)2]=1[(3x1-50-1.6)2+(3x2-50-1.6)2+…+(3x n-50-1.6)2]=1×9[(x1-17.2)2+(x2-17.2)2+…+(x n-17.2)2]=1×9[(x1-)2+(x2-)2+…+(x n-)2]=3.6,所以912=3.6,所以12=0.4.故选C.13.解(1)由题意(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.030.(2)由已知等级达到C及以上所占排名等级占比为7%+33%+40%=80%,假设原始分不少于x分可以达到赋分后的C等级及以上,则有(0.005+0.025+0.030+0.015)×10+(60-x)×0.015=0.8,所以x≈57.估计原始分不少于57分才能达到赋分后的C等级及以上.(3)由题知评分在[40,50)和[50,60)内的频率分别为0.1和0.15,则抽取的5人中,评分在[40,50)内的有2人,评分在[50,60)内的有3人,记评分在[50,60)内的3位学生为a,b,c,评分在[40,50)内的2位学生为D,E,则从5人中任选2人的所有可能结果为:(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,其中,这2人中至少一人评分在[40,50)内的可能结果为(a,D),(a,E),(b,D),(b,E),(c,D),(c,E),(D,E),共7种.所以这2人中至少一人评分在[40,50)内的概率为710.14.ABC甲地:5个数据由小到大排,则22,22,24,a,b,其中24<a<b,满足进入夏季的标志;乙地:将5个数据由小到大排,则a,b,27,c,d,其中a≤b≤27≤c≤d,则27+c+d≥81,而a+b+27+c+d=120,故a+b≤39,其中必有一个小于22,故不满足进入夏季的标志;丙地:设5个数据为a,b,c,d,32,且a,b,c,d∈N*,由方差公式可知:(a-26)2+(b-26)2+(c-26)2+(d-26)2+(32-26)2=10.2×5=51,则(a-26)2+(b-26)2+(c-26)2+(d-26)2=15=9+4+1+1,不妨设|a-26|=3,|b-26|=2,|c-26|=|d-26|=1,则a,b,c,d均大于22,满足进入夏季标准.综上,ABC正确.15.解(1)由频率分布直方图得20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由频率分布直方图知众数为230,用电量在[160,220)的频率是20×(0.002+0.0095+0.011)=0.45,用电量在[220,240)的频率为0.0125×20=0.25,设中位数为m,则-22020=0.5-0.450.25,解得m=224,即中位数是224.(3)由频率分布直方图知月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户的频率依次为0.25,0.15,0.1,0.05,则月平均用电量在[220,240)的用户中应抽取户数为0.250.25+0.15+0.1+0.05×11=5,应抽取5户.。
高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
高三数学一轮复习:0103随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组: [5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图, 则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为( )
ห้องสมุดไป่ตู้32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42 84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04 32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45 若从表中第 6 行第 6 列开始向右依次读取 3 个数据,则得到的第 5 个样本数据为( ) A.578 B.324 C.535 D.522
随机抽样、用样本估计总体
1.随机抽样 (1)简单随机抽样:一般地,从个体数为 N 的总体中逐个不放回地取出 n 个个体作为样本(n<N), 如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样. (2)分层抽样:一般地,当总体由差异明显的几个部分组成时,常常将总体中的个体按不同的 特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样 方法叫分层抽样,所分成的各个部分称为“层”.
高考数学一轮复习 第10章 概率 第3节 模拟方法—概率的应用教学案 文(含解析)北师大版-北师大版

第三节 模拟方法—概率的应用[考纲传真] 1.了解随机数的意义,能运用随机模拟方法估计概率.2.了解几何概型的意义.1.模拟方法对于某些无法确切知道的概率问题,常借助模拟方法来估计某些随机事件发生的概率.用模拟方法可以在短时间内完成大量的重复试验.2.几何概型(1)向平面上有限区域(集合)G 内随机地投掷点M ,若点M 落在子区域G 1G 的概率与G 1的面积成正比,而与G 的形状、位置无关,即P (点M 落在G 1)=G 1的面积G 的面积,则称这种模型为几何概型.(2)几何概型中的G 也可以是空间中或直线上的有限区域,相应的概率是体积之比或长度之比.[常用结论] 几种常见的几何概型(1)与长度有关的几何概型,其基本事件只与一个连续的变量有关;(2)与面积有关的几何概型,其基本事件与两个连续的变量有关,若已知图形不明确,可将两个变量分别作为一个点的横坐标和纵坐标,这样基本事件就构成了平面上的一个区域,即可借助平面区域解决问题;(3)与体积有关的几何概型,可借助空间几何体的体积公式解答问题.[基础自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)随机模拟方法是以事件发生的频率估计概率. ( ) (2)与面积有关的几何概型的概率与几何图形的形状有关. ( ) (3)在一个正方形区域内任取一点的概率为0. ( ) (4)从区间[1,10]内任取一个数,取到1的概率是110.( )[答案] (1)√ (2)× (3)√ (4)×2.(教材改编)在线段[0,3]上任投一点,则此点坐标小于1的概率为( ) A .12B .134B [坐标小于1的区间为[0,1),长度为1,[0,3]的区间长度为3,故所求概率为13.]3.(教材改编)有四个游戏盘,将它们水平放稳后,在上面扔一颗玻璃小球,若小球落在阴影部分,则可中奖,小明要想增加中奖机会,应选择的游戏盘是( )A B C DA [∵P (A )=38,P (B )=28,P (C )=26,P (D )=13,∴P (A )>P (C )=P (D )>P (B ).]4.已知正方体ABCD A 1B 1C 1D 1的棱长为1,在正方体内随机取点M ,则使四棱锥M ABCD 的体积小于16的概率为________.12 [在正方体ABCD A 1B 1C 1D 1中,设M ABCD 的高为h ,则13×S 四边形ABCD×h =16.又S四边形ABCD=1,所以h =12.若体积小于16,则h <12.即点M 在正方体的下半部分,所以P =12.]5.如图所示,在边长为1的正方形中随机撒1 000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为________.0.18 [由题意知,S 阴S 正=1801 000=0.18,∵S 正=1,∴S 阴=0.18.]与长度(角度)有关的几何概型1.在长为12 cm 的线段AB 上任取一点C ,现作一矩形,邻边长分别等于线段AC ,CB 的长,则该矩形的面积大于20 cm 2的概率为 ( )63C .23D .45C [设|AC |=x ,则|BC |=12-x ,所以x (12-x )>20,解得2<x <10,故所求概率P =10-212=23.] 2.(2017·某某高考)记函数f (x )=6+x -x 2的定义域为D .在区间[-4,5]上随机取一个数x ,则x ∈D 的概率是________.59[由6+x -x 2≥0,解得-2≤x ≤3,∴D =[-2,3].如图,区间[-4,5]的长度为9,定义域D 的长度为5,∴P =59.]3.如图所示,在等腰直角三角形ABC 中,过直角顶点C 在∠ACB 内部任作一条射线CM ,与AB 交于点M ,则AM <AC 的概率为________.34[过点C 作交AB 于点N ,使AN =AC ,如图所示.显然当射线CM 处在∠A 内时,AM <AC .又∠A =45°,所以∠A =67.5°,故所求概率为P =67.5°90°=34.] [规律方法] 求解与长度、角度有关的几何概型的方法求与长度(角度)有关的几何概型的概率的方法是把题中所表示的几何模型转化为长度(角度),然后求解.要特别注意“长度型”与“角度型”的不同.解题的关键是构建事件的区域(长度或角度).与面积有关的几何概型►考法1 与平面图形面积有关的问题【例1】 (2017·全国卷Ⅰ)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A .14 B .π8C .12D .π4B [不妨设正方形ABCD 的边长为2,则正方形内切圆的半径为1,可得S 正方形=4. 由圆中的黑色部分和白色部分关于正方形的中心成中心对称,得S 黑=S 白=12S 圆=π2,所以由几何概型知所求概率P =S 黑S 正方形=π24=π8.故选B.]►考法2 与线性规划知识交汇命题的问题【例2】 在平面区域{(x ,y )|0≤x ≤1,1≤y ≤2}内随机投入一点P ,则点P 的坐标(x ,y )满足y ≤2x 的概率为( )A .14B .12C .23D .34A [依题意作出图像如图,则P (y ≤2x )=S 阴影S 正方形=12×12×112=14.][规律方法] 1.与平面几何、解析几何等知识交汇问题的解题思路利用平面几何、解析几何等相关知识,先确定基本事件对应区域的形状,再选择恰当的方法和公式,计算出其面积,进而代入公式求概率.2.与线性规划交汇问题的解题思路先根据约束条件作出可行域,再确定形状,求面积大小,进而代入公式求概率.(1)已知实数m ∈[0,1],n ∈[0,2],则关于x 的一元二次方程4x 2+4mx -n2+2n =0有实数根的概率是( )A .1-π4B .π4C .π-32D .π2-1(2)在满足不等式组⎩⎪⎨⎪⎧x -y +1≥0,x +y -3≤0,y ≥0的平面内随机取一点M (x 0,y 0),设事件A =“y 0-2x 0”,那么事件A 发生的概率是( )A .14 B .34 C .13D .23(1)A (2)B [(1)方程有实数根,即Δ=16m 2-16(-n 2+2n )≥0,m 2+n 2-2n ≥0,m 2+(n -1)2≥1,画出图形如图所示,长方形面积为2,半圆的面积为π2,故概率为2-π22=1-π4.(2)作出不等式组⎩⎪⎨⎪⎧x -y +1≥0,x +y -3≤0,y ≥0的平面区域即△ABC ,其面积为4,且事件A =“y 0<2x 0”表示的区域为△AOC ,其面积为3,所以事件A 发生的概率是34.]与体积有关的几何概型1.已知正三棱锥S ABC 的底面边长为4,高为3,在正三棱锥内任取一点P ,使得V P ABC<12V S ABC 的概率是( ) A .78 B .34 C .12D .14A [当P 在三棱锥的三条侧棱的中点所在的平面及下底面构成的正三棱台内时符合要求,由几何概型知,P =1-18=78.]2.一个多面体的直观图和三视图如图所示,点M 是AB 的中点,一只蝴蝶在几何体ADF BCE 内自由飞翔,则它飞入几何体F AMCD 内的概率为( )A .34B .23 C .13D .12D [由题图可知V F AMCD =13×S四边形AMCD×DF =14a 3,V ADF BCE =12a 3,所以它飞入几何体F AMCD内的概率为14a 312a 3=12.][规律方法] 求解与体积有关的几何概型的注意点对于与体积有关的几何概型问题,关键是计算问题的总体积(总空间)以及事件的体积(事件空间),对于某些较复杂的也可利用其对立事件去求.1.(2016·全国卷Ⅰ)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A .13B .12C .23D .34B [如图,7:50至8:30之间的时间长度为40分钟,而小明等车时间不超过10分钟是指小明在7:50至8:00之间或8:20至8:30之间到达发车站,此两种情况下的时间长度之和为20分钟,由几何概型概率公式知所求概率为P =2040=12.故选B.]2.(2016·全国卷Ⅱ)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( )A .710B .58C .38D .310B [如图,若该行人在时间段AB 的某一时刻来到该路口,则该行人至少等待15秒才出现绿灯.AB 长度为40-15=25,由几何概型的概率公式知,至少需要等待15秒才出现绿灯的概率为40-1540=58,故选B.]3.(2016·全国卷Ⅱ)从区间[0,1]随机抽取2n 个数x 1,x 2,…,x n ,y 1,y 2,…,y n ,构成n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( )A .4n mB .2n mC .4m nD .2m nC [因为x 1,x 2,…,x n ,y 1,y 2,…,y n 都在区间[0,1]内随机抽取,所以构成的n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n )都在正方形OABC 内(包括边界),如图所示.若两数的平方和小于1,则对应的数对在扇形OAC 内(不包括扇形圆弧上的点所对应的数对),故在扇形OAC内的数对有m个.用随机模拟的方法可得S扇形S正方形=mn,即π4=mn,所以π=4mn.]六概率与统计中的高考热点问题[命题解读] 1. 统计与概率是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量,该类问题以应用题为载体,注重考查学生的数学建模及阅读理解能力、分类讨论与化归转化能力.2.概率问题的核心是概率计算,其中事件的互斥、对立是概率计算的核心. 统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,统计与概率内容相互渗透,背景新颖.统计与统计案例以统计图表或文字叙述的实际问题为载体,通过对相关数据的分析、抽象概括,作出估计、判断. 常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生的数据处理能力与运算能力及应用意识.【例1】已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在[90,100]内的有6人.(1)求n的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析能否在犯错误的概率不超过0.10的前提下认为“本次测试的及格情况与性别有关”?附:P(χ2≥x0)0.100.050.0100.005 x0 2.706 3.841 6.6357.879χ2=n ad-bc2a+b c+d a+c b+d.[解](1)依题意得⎩⎪⎨⎪⎧10×0.035+0.025+c +2b +a =1,2b =a +c ,解得b =0.01.因为成绩在[90,100]内的有6人, 所以n =60.01×10=60.(2)由于2b =a +c ,而b =0.01,可得a +c =0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x 人,则男生有x -4人,于是x +x -4=48,解得x =26,故及格的人中,女生有26人,男生有22人.于是本次测试的及格情况与性别的2×2列联表如下:及格 不及格 总计 男 22 8 30 女 26 4 30 总计481260所以χ2=60×22×4-8×26230×30×48×12=1.667<2.706,故不能在犯错误的概率不超过0.10的前提下认为“本次测试的及格情况与性别有关”.[规律方法] 独立性检验的方法 (1)构造2×2列联表; (2)计算χ2;(3)查表确定有多大的把握判定两个变量有关联.易错提示:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的临界值与求得的χ2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p ,所以其有关联的可能性为1-p .近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:(1)请将如图的列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽9人,其中女生抽多少人?(2)为了研究患三高疾病是否与性别有关,请计算出统计量χ2,并说明是否可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.患三高疾病 不患三高疾病总计 男630女 总计36下面的临界值表供参考:P (χ2≥x 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 x 02.0722.7063.8415.0246.6357.87910.828(参考公式χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d )[解] (1)完善补充列联表如下:患三高疾病不患三高疾病总计 男 24 6 30 女 12 18 30 总计362460在患三高疾病人群中抽9人,则抽取比例为936=14,所以女性应该抽取12×14=3(人).(2)根据2×2列联表,则 χ2=60×24×18-6×12230×30×36×24=10>7.879.所以可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.常见概率模型的概率概率. 解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或对立事件的概率求解.【例2】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40) 天数216362574(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率.(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.[解] (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为2+16+3690=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y =6×450-4×450=900;若最高气温位于区间[20,25),则Y =6×300+2(450-300)-4×450=300; 若最高气温低于20,则Y =6×200+2(450-200)-4×450=-100, 所以,Y 的所有可能值为900,300,-100.Y 大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8,因此Y 大于零的概率的估计值为0.8.[规律方法] 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.某商场在元旦举行购物抽奖促销活动,规定顾客从装有编号为0,1,2,3,4的五个相同小球的抽奖箱中一次任意摸出两个小球,若取出的两个小球的编号之和等于7,则中一等奖,等于6或5,则中二等奖,等于4,则中三等奖,其余结果为不中奖.(1)求中二等奖的概率; (2)求不中奖的概率.[解] (1)记“中二等奖”为事件A .从五个小球中一次任意摸出两个小球,不同的结果有{0,1},{0,2},{0,3},{0,4},{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共10个基本事件.记两个小球的编号之和为x ,由题意可知,事件A 包括两个互斥事件:x =5,x =6. 事件x =5的取法有2种,即{1,4},{2,3},故P (x =5)=210=15;事件x =6的取法有1种,即{2,4},故P (x =6)=110.所以P (A )=P (x =5)+P (x =6)=15+110=310.(2)记“不中奖”为事件B ,则“中奖”为事件B ,由题意可知,事件B 包括三个互斥事件:中一等奖(x =7),中二等奖(事件A ),中三等奖(x =4).事件x =7的取法有1种,即{3,4},故P (x =7)=110;事件x =4的取法有{0,4},{1,3},共2种,故P (x =4)=210=15.由(1)可知,P (A )=310.所以P (B )=P (x =7)+P (x =4)+P (A )=110+15+310=35.所以不中奖的概率为P (B )=1-P (B )=1-35=25.统计与概率的综合应用统计和概率知识相结合命题统计概率解答题已经是一个新的命题趋向,概率和统计知识初步综合解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,在此基础上掌握好样本数字特征及各类概率的计算.【例3】 (本小题满分12分)(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表 日用 水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数13249265日用 水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6)频数151310165(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)[信息提取]看到作频率分布直方图,想到作频率分布直方图的作图规则; 看到求概率,想到利用频率分布直方图求概率的方法; 看到估计节水量,想到求使用节水龙头前后的用水量. [规X 解答] (1)如图所示.4分(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,6分因此该家庭使用节水龙头后,日用水量小于0.35 m 3的概率的估计值为0.48.7分 (3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.9分该家庭使用了节水龙头后50天日用水量的平均数为x -2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.11分估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).12分 [易错与防X] 作频率分布直方图时注意纵轴单位是“f iΔx i”,计算平均数时运算要准确,避免“会而不对”的失误.[通性通法] 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.长时间用手机上网严重影响着学生的身体健康,某校为了解A ,B 两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本绘制成茎叶图如图所示(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班级平均每周上网时间较长?(2)从A 班的样本数据中随机抽取一个不超过19的数据记为a ,从B 班的样本数据中随机抽取一个不超过21的数据记为b ,求a >b 的概率.[解] (1)A 班样本数据的平均值为15(9+11+14+20+31)=17,由此估计A 班学生每周平均上网时间为17小时;B 班样本数据的平均值为15(11+12+21+25+26)=19,由此估计B 班学生每周平均上网时间为19小时. 所以B 班学生上网时间较长.(2)A 班的样本数据中不超过19的数据a 有3个,分别为9,11,14,B 班的样本数据中不超过21的数据b 也有3个,分别为11,12,21.从A 班和B 班的样本数据中各随机抽取一个共有9种不同的情况,分别为(9,11),(9,12),(9,21),(11,11),(11,12),(11,21),(14,11),(14,12),(14,21),其中a >b 的情况有(14,11),(14,12),2种,故a >b 的概率P =29.[大题增分专训]1.某校高三期中考试后,数学教师对本次全部数学成绩按1∶20进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:分数 段(分) [50,70) [70,90) [90,110) [110,130) [130,150] 总计 频数b 频率 a0.25(1)求表中a ,b 的值及成绩在[90,110)X 围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);(2)若从茎叶图中成绩在[100,130)X 围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值小于或等于10的概率.[解] (1)由茎叶图知成绩在[50,70)X 围内的有2人,在[110,130)X 围内的有3人,∴a =0.1,b =3.∵成绩在[90,110)X 围内的频率为1-0.1-0.25-0.25=0.4, ∴成绩在[90,110)X 围内的样本数为20×0.4=8. 估计这次考试全校高三学生数学成绩的及格率为P =1-0.1-0.25=0.65.(2)所有可能的结果为(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,取出的两个样本中数字之差小于或等于10的结果为(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128),共10个,∴P (A )=1021.2.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期 12月1日12月2日12月3日12月4日12月5日温差x (℃)101113128程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻的2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求y 关于x 的线性回归方程y =bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘估计分别为b =∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a =y -b x .)[解] (1)设抽到不相邻两组数据为事件A ,因为从5组数据中选取2组数据共有10种情况,每种情况是等可能出现的,其中抽到相邻两组数据的情况共有4种,所以P (A )=1-410=35,故选取的2组数据恰好是不相邻的2天数据的概率为35. (2)由数据,求得x =13×(11+13+12)=12,y =13×(25+30+26)=27,∑3i =1x i y i =11×25+13×30+12×26=977,∑3i =1x 2i =112+132+122=434,所以b =∑3i =1x i y i -3x y∑3i =1x 2i -3x2=977-3×12×27434-3×122=52,a =27-52×12=-3. 所以回归直线方程为y =52x -3.(3)当x =10时,y =22,|22-23|<2,同理当x =8时,y =17,|17-16|<2. 所以该研究得到的线性回归方程是可靠的.。
北师版高考总复习一轮数学精品课件 第10章统计与成对数据的统计分析 第2节用样本估计总体
解析 对于A,因为一队每场比赛平均失球数是1.5,二队每场比赛平均失球
数是2.1,所以平均来说一队比二队防守技术好,故A正确;对于B,因为二队
每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4,所以二队经
常失球,故B错误;对于C,因为一队全年比赛失球个数的标准差为1.1,二队全
年比赛失球个数的标准差为0.4,所以一队有时表现很差,有时表现又非常
2+3
解析 由频率分布直方图可知众数为
=2.5,即x1=2.5,平均数
2
x2=0.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×
7.5=3.54,
显然25%分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,解得x3≈2.208,所以
位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故
C正确;
样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+
65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73
(分),故D错误.
[对点训练2]
(1)(2024·山东烟台模拟)某组样本数据的频率分布直方图如图所示,设该组
样本数据的众数、平均数、25%分位数分别为x1,x2,x3,则x1,x2,x3的大小
关系是(注:同一组中数据用该组区间中点值近似代替)( A )
A.x3<x1<x2
B.x2<x1<x3
高考数学一轮复习第十章算法统计与概率第53课用样本估计总体课件
图 53-6 140 [由频率分布直方图可知每周自习时间不少于 22.5 小时的频率为(0.16
+0.08+0.04)×2.5=0.7,则每周自习时间不少于 22.5 小时的人数为 0.7×200= 140.]
☞角度 2 用频率分布直方图估计总体
(2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合 理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年 100 位居 民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成 9 组,制成了如图 53-7 所示的频率分布直方图.
[变式训练 2] 已知甲、乙两组数据如茎叶图 53-5 所示,若两组数据的中位 数相同,平均数也相同,那么 m+n=________. 【导学号:62172294】
11 [∵两组数据的中位数相同, 图 53-5 ∴m=2+2 4=3. 又∵两组数据的平均数也相同, ∴27+333+39=20+n+324+34+38,∴n=8, 因此 m+n=11.]
3.如图 53-2 所示是一样本的频率分布直方图.若样本容量为 100,则样本 数据在[15,20]内的频数是________.
图 53-2 30 [因为[15,20]对应的小矩形的面积为 1-0.04×5-0.1×5=0.3,所以样 本落在[15,20]的频数为 0.3×100=30.]
4.(2016·江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是
________. 0.1 [5 个数的平均数 x =4.7+4.8+55.1+5.4+5.5=5.1,
所以它们的方差 s2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+
高考理科数学一轮复习课件随机抽样与用样本估计总体
THANK YOU
感谢聆听
理解并掌握用样本估计总体思想和方法
用样本频率估计总体概率
通过大量重复试验得到的样本频率可以近似 代替总体概率。
用样本均值估计总体均值
当样本量足够大时,样本均值可以近似代替 总体均值。
用样本方差估计总体方差
通过计算样本数据的方差来估计总体数据的 波动情况。
用样本分布估计总体分布
通过观察样本数据的分布情况来推断总体数 据的可能分布。
分层标准选择和层次划分
分层标准选择
在选择分层标准时,应该考虑与研究目的密切相关的因素,同时保证各层之间的 差异明显且易于划分。常见的分层标准包括地理位置、人口特征、经济水平等。
层次划分
在划分层次时,应该根据分层标准将总体划分为若干个互不重叠的层,并保证各 层内的个体具有相似的特征。同时,各层的样本量应该根据总体中该层的比例进 行分配。
02
简单随机抽样方法及应用
简单随机抽样定义及步骤
01
定义:简单随机抽样是一种最基本的随机抽样方法,它从 总体中逐个不放回地随机抽取样本,直到达到所需的样本 容量为止。
02
步骤
03
1. 确定总体和样本容量;
04
2. 对总体进行编号;
05
3. 利用随机数表或计算机程序生成随机数;
06
4. 根据生成的随机数从总体中抽取样本。
案例分析:系统抽样在高考数学中应用
案例二
某校高三数学模拟考试成绩分析
背景
某校高三年级进行了多次数学模拟考试,需要对考试成绩 进行分析以评估教学效果和考生备考情况。
实施过程
该校采用系统抽样的方法,从每次模拟考试中抽取了一定 数量的试卷作为样本,并对这些试卷的得分情况进行了统 计分析。
版高考数学一轮总复习概率统计中的抽样与估计计算
版高考数学一轮总复习概率统计中的抽样与估计计算高考数学一轮总复习概率统计中的抽样与估计计算概率统计是高考数学中的重要部分,其中抽样与估计计算是一个核心概念。
在这篇文章中,我们将详细探讨抽样与估计计算的方法和应用。
一、抽样方法在统计学中,抽样是指从总体中选取一部分个体进行测量或调查的方法。
常用的抽样方法包括随机抽样、分层抽样和系统抽样。
1. 随机抽样随机抽样是指从总体中按照一定的概率分布随机选取样本的方法。
它的特点是每个个体都有相同的概率被选入样本,从而保证样本的代表性和可靠性。
2. 分层抽样分层抽样是将总体按照某种特征分成若干层,然后从每一层中随机选取样本。
这种方法可以保证每一层都有代表性的样本,从而提高估计的准确性。
3. 系统抽样系统抽样是指按照一定的规则,从总体中选取样本。
例如,从总体中每隔一定的间隔选取一个个体作为样本,这样就能保证样本的随机性和均匀性。
二、估计计算方法抽样得到的样本是我们对总体的一个估计。
估计计算是根据样本数据,推断总体参数的方法。
常用的估计计算方法有点估计和区间估计。
1. 点估计点估计是根据样本数据,用一个确定的数值来估计总体参数。
常见的点估计方法有样本均值、样本方差和样本比例。
例如,根据样本均值估计总体均值。
2. 区间估计区间估计是指根据样本数据,给出一个范围,来估计总体参数落在该范围内的概率。
常见的区间估计方法有正态分布的置信区间和二项分布的置信区间。
例如,根据正态分布的置信区间估计总体均值。
三、应用举例下面通过一个具体的例子来说明抽样与估计计算的应用。
假设我们想要估计某个城市的失业率。
我们可以采用随机抽样的方法,在整个城市的居民中随机选取一部分进行调查。
得到的样本数据可以用来计算样本的失业率。
假设我们得到的样本数据中有1000个人,其中有200人失业。
那么,我们可以用样本的失业率来估计总体的失业率。
样本的失业率为200/1000=0.2,即20%。
通过区间估计,我们可以得到总体失业率落在一定范围内的概率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【大高考】2017版高考数学一轮总复习 第10章 概率与统计 第三节 随机抽样、用样本估计总体AB 卷 文 新人教A 版1.(2016·新课标全国Ⅰ,19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 解 (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19,(x ∈N ). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1(3 800×70+4 300×20+4 800×10)=4 000,100若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1(4 000×90+4 500×10)=4 050.100比较两个平均数可知,购买1台机器的同时应购买19个易损零件.2.(2015·新课标全国Ⅱ,18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)如图所示:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.3.(2014·新课标全国Ⅰ,18)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)在下表中作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定? 解 (1)(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104. (3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68. 由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.4.(2014·新课标全国Ⅱ,19)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16. (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.)5.(2013·新课标全国Ⅰ,18)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好?解 (1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -,由观测结果可得x -=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6由以上计算结果可得x ->y -,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2.3.上,而B 药疗效的试验结果有710的叶集中在茎0.1.上,由此可看出A 药的疗效更好.1.(2016·北京,8)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则( ) A.2号学生进入30秒跳绳决赛 B.5号学生进入30秒跳绳决赛 C.8号学生进入30秒跳绳决赛D.9号学生进入30秒跳绳决赛解析 由数据可知,进入立定跳远决赛的8人为:1~8号,所以进入30秒跳绳决赛的6人需要从1~8号产生,数据排序后可知第3,6,7号必须进跳绳决赛,另外3人需从63,a ,63,60,a -1四个得分中抽取,若63分的人未进决赛,则60分的人就会进入决赛,与事实矛盾,所以63分必进决赛.故选B. 答案 B2.(2015·四川,3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A.抽签法 B.系统抽样法 C.分层抽样法D.随机数法解析 结合几种抽样的定义知选C. 答案 C3.(2015·北京,4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )A.90B.100C.180D.300解析 由题意抽样比为3201 600=15,∴该样本的老年教师人数为900×15=180(人).答案 C4.(2014·广东,6)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本 ,则分段的间隔为( ) A.50 B.40 C.25D.20解析 由1 00040=25,可得分段的间隔为25.故选C.答案 C5.(2014·重庆,3)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( ) A.100 B.150 C.200D.250解析 样本抽取比例为703 500=150,该校总人数为1 500+3 500=5 000,则n 5 000=150,故n =100,选A. 答案 A6.(2014·湖南,3)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A.p 1=p 2<p 3B.p 2=p 3<p 1C.p 1=p 3<p 2D.p 1=p 2=p 3解析 根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样,每个个体被抽到的概率都是p =n N,故p 1=p 2=p 3,故选D. 答案 D7.(2013·湖南,3)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A.9 B.10 C.12D.13解析 抽样比为360=120,所以甲抽取6件,乙抽取4件,丙抽取3件,∴n =13,故选D.答案 D8.(2013·江西,5)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08B.07C.02D.01解析 所取的5个体依次为08,02,14,07,01,故选D. 答案 D9.(2015·福建,13)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 解析 由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取人数:45×500900=25.答案 2510.(2014·湖北,11)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析 分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为1 800件. 答案 1 80011.(2014·天津,9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析 由分层抽样的特点可得应该从一年级本科生中抽取44+5+5+6×300=60(名)学生. 答案 6012.(2014·山东,16)海关对同时从A ,B ,C 三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A ,B ,C 各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.解 (1)因为样本容量与总体中的个体数的比是650+150+100=150,所以样本中包含三个地区的个体数量分别是: 50×150=1,150×150=3,100×150=2.所以A ,B ,C 三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A ,B ,C 三个地区的样品分别为A ;B 1,B 2,B 3;C 1,C 2. 则抽取的这2件商品构成的所有基本事件为: {A ,B 1},{A ,B 2},{A ,B 3},{A ,C 1},{A ,C 2}, {B 1,B 2},{B 1,B 3},{B 1,C 1},{B 1,C 2},{B 2,B 3}, {B 2,C 1},{B 2,C 2},{B 3,C 1},{B 3,C 2},{C 1,C 2},共15个. 每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的. 记事件D :“抽取的这2件商品来自相同地区”, 则事件D 包含的基本事件有{B 1,B 2},{B 1,B 3},{B 2,B 3},{C 1,C 2},共4个. 所以P (D )=415,即这2件商品来自相同地区的概率为415.13.(2016·山东,3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56B.60C.120D.140解析由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为:(0.16+0.08+0.04)×2.5=0.7,∴人数是200×0.7=140人,故选D.答案 D14.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选C.答案 C15.(2015·湖南,2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A.3B.4C.5D.6解析由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.选B.答案 B16.(2014·山东,8)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6B.8C.12D.18解析由题意,第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为200.4=50,又第三组的频率为0.36,故第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.答案 C17.(2013·四川,7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[510),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析由分组可知C,D一定不对,由茎叶图可知[0,5)有1人,[5,10)有1人,∴第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案 A18.(2015·湖北,14)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解之得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3,6 000.答案(1)3 (2)6 00019.(2016·北京,17)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,3)的频率的和为:(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为:(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.20.(2016·四川,16)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.21.(2015·安徽,17)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.解(1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4.所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B1,B2,从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为p=110.22.(2015·广东,17)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解(1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1得:x=0.007 5,所以直方图中x的值是0.007 5.(2)月平均用电量的众数是220+2402=230.因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.(3)月平均用电量为[220,240]的用户有0.012 5×20×100=25户,月平均用电量为[240,260)的用户有0.007 5×20×100=15户,月平均用电量为[260,280)的用户有0.005×20×100=10户,月平均用电量为[280,300]的用户有0.002 5×20×100=5户,抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5户.23.(2015·重庆,4)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是( ) A.19 B.20 C.21.5D.23解析 由茎叶图,把数据由小到大排列,处于中间的数为20,20,所以这组数据的中位数为20. 答案 B24.(2015·山东,6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A.①③ B.①④ C.②③D.②④解析 甲地5天的气温为:26,28,29,31,31, 其平均数为x -甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x -乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2.∴x -甲<x -乙,s 甲>s 乙. 答案 B25.(2014·陕西,9)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x -和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x -,s 2+1002B.x -+100,s 2+1002C.x -,s 2D.x -+100,s 2解析 法一 对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D.法二 由题意知x 1+x 2+…+x n =nx -,s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],则所求均值y -=1n [(x 1+100)+(x 2+100)+…+(x n +100)]=1n(nx -+n ×100)=x -+100,而所求方差t 2=1n [(x 1+100-y -)2+(x 2+100-y -)2+…+(x n +100-y -)2]=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]=s 2,故选D. 答案 D26.(2015·江苏,2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析 这组数据的平均数为16(4+6+5+8+7+6)=6.答案 627.(2015·广东,12)已知样本数据x 1,x 2,…,x n 的均值x -=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析 由x 1,x 2,…,x n 的均值x -=5,得2x 1+1,2x 2+1,…,2x n +1的均值为2x -+1=2×5+1=11. 答案 1128.(2013·辽宁,16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 解析 设5个班级的人数分别为x 1,x 2,x 3,x 4,x 5,则x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)25=4,即5个整数平方和为20,最大的数比7大不能超过3,否则方差超过4,故最大值为10,最小值为4. 答案 1029.(2014·广东,17)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解 (1)由题可知,这20名工人年龄的众数是30,极差是40-19=21. (2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为x -=120(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为 s 2=120i =1 (x i -x -20)2=112+6×22+7×12+5×02+10220=25220=12.6.。