高考数学一轮复习总教案13.1抽样方法与用样本估计总体(人教版)
高三数学《师说》系列一轮复习 随机抽样与用样本估计总体课件 理 新人教B版

(3)方差的计算公式 1 2 ① s = [(x1-- x )2+ (x2-- x )2+…+(xn-- x )2 ]; n 1 2 2 2 -2 ② s = (x1+ x2 2+…+ xn- n x ); n 1 2 2 -2 ③ s2= (x2 1+ x2+…+ xn)- x . n
5. 总体中的数字特征 (1)众数与中位数 ①一组数据中的众数可能不止一个,众数是一组数据中出现次 数最多的数据,而不是该数据出现的次数,如果有两个数据出现的 次数相同,并且比其他数据出现的次数都多,那么这两个数据都是 这组数据的众数. ②一组数据的中位数是唯一的,求中位数时,必须先将这组数 按从小到大 (或从大到小 )的顺序排列, 如果数据的个数为奇数, 那么 最中间的一个数据是这组数据的中位数,如果数据的个数为偶数, 那么最中间两个数据的平均数是这组数据的中位数.
(2)平均数的意义 ①平均数反映了一组数据的集中趋势, 它是一组数据的“重心”, 是度量一组数据波动大小的基准. ②用样本平均数可估计总体平均数. ③用平均数可以比较两组数据的情况,如成绩、产量等. ④如果知道在某一范围内的数的频率, 可用组中值近似求平均值.
(3)众数、中位数与平均数的异同 ①众数、中位数及平均数都是描述一组数据集中趋势的量,平 均数是最重要的量. ②平均数的大小与一组数据里每个数据均有关系,任何一个数 据的变动都会相应引起平均数的变动. ③众数大小只与这组数据中的部分数据有关,当一组数据中有 不少数据多次重复出现时,其众数往往更能反映问题. ④中位数与数据的排列位置有关,某些数据的变动对中位数没 有影响. 中位数可能出现在所给数据中, 也可能不在所给数据中. 当 一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. ⑤实际问题中求得的平均数、众数和中位数应带上单位.
2025年高考数学一轮复习 第十章 -第一节 抽样方法、统计图表、用样本估计总体【课件】

+
=
+
=______________.我们可以用样本平均数估计总体平均数.
+
+
+
+
四、统计图表
常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等
(见微专题).
五、百分位数
一般地,一组数据的第百分位数是这样一个值 ,它使得这组
%
100 − %
1 000名患者的相关信息,得到如下表格:
潜伏期/天
[0,2]
(2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,14]
人数
85
205
310
250
130
15
5
已知该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期
是否超过6天为标准进行分层抽样,若从上述1 000名患者中抽取200人,得到如下联表:
点,能从统计图表中获取有价值的信息.
3.理解并掌握百分位数的定义,理解并掌握计算有个数据的样本的第百分位数的步骤及
四分位数.
4.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统
计含义;能用样本(标准差、方差、极差)估计总体的离散程度,理解离散程度参数的统
计含义.
01
第十章 统计与成对数据的统计分析
第一节 抽样方法、统计图表、用样本估计总
体
1
1 强基础 知识回归
2
2 研考点 题型突破
1.了解简单随机抽样的含义及其解决问题的过程,了解分层抽样的必要性,能解决分层抽样
中的计算问题.
人教版高中数学高考一轮复习--用样本估计总体(课件)

样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
2025届高中数学一轮复习课件《随机抽样、用样本估计总体》ppt

高考一轮总复习•数学
第21页
(3)(2024·江西吉安模拟)总体由编号为 00,01,02,…,48,49 的 50 个个体组成,利用下面 的随机数表选取 6 个个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从
数字 3. 数字 3. 左到右依次选取两个数字,则选出的第 3 个个体的编号为 ( )
高考一轮总复习•数学
第10页
2.总体方差和总体标准差 (1)一般式:如果总体中所有个体的变量值分别为 Y1,Y2,…,YN,总体平均数为 Y ,则
总体方差 S2=N1i=N1 (Yi- Y )2.
(2)加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi 出现的频数为 fi(i=1,2,…,k),则总体方差为 S2=N1i=k1fi(Yi- Y )2.
高考一轮总复习•数学
第12页
3.简单随机抽样样本平均数、方差的计算公式的推广 (1)若数据 x1,x2,…,xn 的平均数为 x ,则数据 mx1+a,mx2+a,mx3+a,…,mxn +a 的平均数是 m x +a; (2)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,axn+b 的方差为 a2s2. 4.分层随机抽样样本均值、方差的计算公式的推广 如果将总体分为 k 层,第 j 层抽取的样本量为 nj,样本均值为 x j,样本方差为 s2j ,j=
高考一轮总复习•数学
第24页
(3)按随机数法,从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 因为编号由 2 个数字组成.
00~49 及重复的不选,则编号依次为 33,16,20,38,49,32,…,则选出的第 3 个个体的编 号为 20.故选 D.
高考数学总复习(一轮)(人教A)教学课件第九章 统计、成对数据的统计分析第2节 用样本估计总体

6
10
9
8
7
则该校学生开展志愿者活动时长的第40百分位数是
8.5
.
解析:(2)40×40%=16,故第40百分位数是第16个数和第17个数的平
均数, 即
+
=8.5.
考点二
总体集中趋势的估计
[例3] (多选题)某学校共有2 000名男生,为了了解这部分学生的身
体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制
=0.01.
(2)根据频率分布直方图,估计样本数据的15%和85%分位数.
解 :(2)由 图 可 知 ,[20,40)内 的 比 例 为 10%,[40,60)内 的 比 例 为
20%,[60,80)内的比例为40%,[80,100]内的比例为30%.
因此,15%分位数一定位于[40,60),85%分位数一定位于[80,100],
直方图如图所示:
得分 [20,40) [40,60) [60,80) [80,100]
人数
6
a
24
18
(1)求a,b的值;
解:(1)由频率分布直方图可知,
得分在[20,40)的频率为0.005×20=0.1,
故抽取的学生答卷数为6÷0.1=60,由6+a+24+18=60,得a=12.
所以 b=
[针对训练] (2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率
的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产
品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡
胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
2011届高三新人教版文科数学总复习精品课件:抽样方法、用样本估计总体

1 n
7.利用频率分布直方图估计样本的数字特征 (1)中位数:在频率分布直方图中,中位数左边和右边的 直方图的面积 应该相等 ,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的 横坐标之和 点的 横坐标 . (4)作频率分布直方图的步骤 ①求极差(即一组数据中 最大值 与 最小值 的差). ②决定 组距 与 组数 . ③将数据 分组 . .
1.抽样 从调查对象中按照一定的方法抽取一部分,进行调查或观测, 获取数据,并以此对调查对象的某项指标作出推断,这就是 抽样调 查 .调查对象的全体称为 总体 ,被抽取的一部分称为 样本 . 2.简单随机抽样 (1)定义:设一个总体含有N个个体,从中 逐个不放回地 抽取 n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到 的机会 都相等 ,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法: 抽签法 和 随机数表法 .
(1)先将总体的N个个体 编号 . 分段间隔k (2)确定 分段间隔k 时,取k= N .
n
,对编号进行 分段
,当 n 是整数
N
(3)在第1段用 简单随机抽样 确定第一个个体编号l(l≤k). (4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个 (l+ 个体编号 (l+k) (l+ ,再加k得到第3个个体编号 (l+2k) ,依次进
行下去,直到获取整个样本.
三种抽样方法有什么共同点和联系? 三种抽样方法有什么共同点和联系? 提示:(1)抽样过程中每个个体被抽取的机会均等. 提示 (2)系统抽样中在分段后确定第一个个体时采用简单随机抽样, 分层抽样中各层抽样时采用简单随机抽样或系统抽样.
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
山东高考数学一轮总复习教学案设计参考-用样本估计总体含答案解析
第2讲用样本估计总体[考纲解读] 1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,并体会它们各自的特点.(重点)2.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并作出合理的解释.3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.(难点)4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题.[考向预测]从近三年高考情况来看,本讲是高考中的一个热点.预测2021年将会考查用样本估计总体,主要体现在利用频率分布直方图或茎叶图估计总体,利用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频率分布直方图与茎叶图也可能出现于解答题中,与概率等知识综合命题.1.作频率分布直方图的步骤2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的□01中点,就得到频率分布折线图.(2)总体密度曲线:随着□02样本容量的增加,作图时所分的组数增加,□03组距减小,相应的频率折线图就会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图(1)茎叶图的概念:统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.(2)茎叶图的优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况.4.样本的数字特征 (1)众数、中位数、平均数 数字特征样本数据频率分布直方图优点与缺点众数出现次数□01最多的数据取最高的小长方形底边□02中点的横坐标 通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数将数据按大小依次排列,处在最□03中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积□04相等的分界线与x 轴交点的横坐标是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之□05和 平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.1.概念辨析(1)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(2)从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.()(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()答案(1)×(2)√(3)√(4)×2.小题热身(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.(2)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92答案 A解析由茎叶图可知,这组数据的中位数是12×(91+92)=91.5,平均数是18×(87+89+90+91+92+93+94+96)=91.5.(3)港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100 km/h ,现对大桥某路段上1000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90 km/h 的频率分别为( )A.300 0.25 B .300 0.35 C.60 0.25 D .60 0.35答案 B解析 由频率分布直方图,得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1000=300,行驶速度超过90 km/h 的频率为(0.05+0.02)×5=0.35.故选B.(4)(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 这组数据的平均数为8,故方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.题型一 样本数字特征的计算及应用1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数 B .平均数 C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.2.(2019·长沙二模)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2;其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( )A.3x -+2,3s 2+2 B .3x -,3s 2 C.3x -+2,9s 2 D .3x -+2,9s 2+2答案 C解析 根据题意,数据x 1,x 2,…x 100的平均数为x -,方差为s 2;则x -=1100(x 1+x 2+x 3+…+x 100),s 2=1100[(x 1-x -)2+(x 2-x -)2+…+(x 100-x -)2],若3x 1+2,3x 2+2,3x 3+2,…,3x 100+2的平均数为x -′,则x -′=1100[(3x 1+2)+(3x 2+2)+…+(3x 100+2)]=3x -+2,方差s ′2=1100[(3x 1+2-3x --2)2+(3x 2+2-3x --2)2+…+(3x 100+2-3x --2)2]=9s 2.3.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.答案 9解析 根据题意知,该组数据的众数是2, 则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10, 则2+x2=3,解得x =4,所以这组数据的平均数为x -=16×(1+2+2+4+5+10)=4, 方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n)-n x -2]或写成s 2=1n (x 21+x 22+…+x 2n )-x -2,即方差等于原数据平方的平均数减去平均数的平方.(3)平均数、方差的公式推广①若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .见举例说明2.②数据x 1,x 2,…,x n 的方差为s 2.a.数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;b.数据ax 1,ax 2,…,ax n 的方差为a 2s 2.见举例说明2.1.(2019·六安模拟)某样本中共有5个个体,其中4个值分别为0,1,2,3,第5个值丢失,但该样本的平均值为1,则样本方差为( )A.2B.65 C. 2 D.305答案 A解析 设第5个值为x ,则由题意,得15×(0+1+2+3+x )=1,解得x =-1,所以样本方差s 2=15×[(0-1)2+(1-1)2+(2-1)2+(3-1)2+(-1-1)2]=2.2.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.题型二 扇形图、折线图1.(2020·株洲市高三摸底)某市2019年12个月的PM2.5的平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是( )A.第一季度 B .第二季度 C.第三季度 D .第四季度答案 B解析 根据图中数据,知第一季度的数据是72.15,43.96,93.13;第二季度的数据是66.5,55.25,58.67;第三季度的数据是59.16,38.67,51.6;第四季度的数据是82.09,104.6,168.05;观察得出第二季度的数据波动性最小,所以第二季度的PM2.5的平均浓度指数方差最小.故选B.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(2019·东北三省四市教研联合体模拟)“科技引领,布局未来”,科技研发是企业发展的驱动力量.2007年至2018年,某企业连续12年累计研发投入达4100亿元.我们将研发投入与经营收入的比值记为研发投入占营收比.这12年间的研发投入(单位:十亿元)用如图中的条形图表示,研发投入占营收比用如图中的折线图表示.根据折线图和条形图,下列结论错误的是()A.2012年至2013年研发投入占营收比增量相比2017年至2018年增量大B.2013年至2014年研发投入数量相比2015年至2016年增量小C.该企业连续12年研发投入逐年增加D.该企业连续12年研发投入占营收比逐年增加答案 D解析由题图可知,该企业在2008年至2009年、2013年至2014年和2016年至2017年研发投入占营收比是下降的,所以D错误.故选D.题型三茎叶图及其应用1.(2019·郑州三模)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12.若要使该总体的标准差最小,则4x+2y的值是()0223 41x y 9920 1C.16 D.18答案 A解析因为总体的中位数为12,所以10+x+10+y2=12,即x+y=4,所以总体的平均数为110×(2+2+3+4+10+x+10+y+19+19+20+21)=11.4.要使总体的标准差最小,只要(10+x-11.4)2+(10+y-11.4)2最小.因为(10+x-11.4)2+(10+y-11.4)2≥2×10+x-11.4+10+y-11.422=0.72,当且仅当x=y=2时等号成立,所以4x+2y=12.故选A.2.某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430 ,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407 ,410,412,415,416,422,430.(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解(1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.1.茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列,写在左(右)侧;有两组数据时,写在中间;第三步:将各个数据的叶依次写在其茎的右(左)侧.茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.2.茎叶图的应用茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.1.甲、乙两位射击运动员的5次比赛成绩(单位:环)如茎叶图所示,若两位运动员平均成绩相同,则成绩较稳定(方差较小)的那位运动员成绩的方差为( )A.2 B .4 C .6 D .8答案 A解析 根据茎叶图中的数据知,甲、乙二人的平均成绩相同,即15×(87+89+90+91+93)=15×(88+89+90+91+90+x ),解得x =2,所以平均数为x -=90;根据茎叶图中的数据知甲的成绩波动性小,较为稳定(方差较小),所以甲成绩的方差为s 2=15×[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2.故选A.2.如图茎叶图记录了甲、乙两组各6名学生在一次数学测试中的成绩(单位:分).已知甲组数据的众数为124,乙组数据的平均数为甲组数据的中位数,则x ,y 的值分别为( )答案 A解析 由已知,甲组数据的众数是124,则x =4,即甲组数据的中位数为124.所以16×(116+116+125+120+y +128+134)=124,解得y =5.故选A.题型四频率分布直方图角度1求频率或频数1.党的十九大报告指出:“脱贫攻坚战取得决定性进展,六千多万贫困人口稳定脱贫,贫困发生率从百分之十点二下降到百分之四以下.”2019年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3000户家庭的2019年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为()A.900户B.600户C.300户D.150户答案 A解析由频率分布直方图得:年收入不超过6万的家庭所占频率为:(0.005+0.010)×20=0.3,∴年收入不超过6万的家庭大约为0.3×3000=900.角度2求数字特征2.某市在对两千多名出租车司机的年龄进行的调查中,从两千多名出租车司机中随机抽选100名司机,已知这100名司机的年龄都在20岁至50岁之间,且根据调查结果得出的年龄情况频率分布直方图如图所示(部分图表污损).利用这个残缺的频率分布直方图,可估计该市出租车司机年龄的中位数大约是()A.31.4岁B.32.4岁C.33.4岁D.36.4岁答案 A解析由频率分布直方图可知[20,25)的频率为0.1,[25,30)的频率为0.3,[30,35)的频率为0.35,因为0.1+0.3<0.5<0.1+0.3+0.35,所以中位数x0∈[30,35),由0.1+0.3+(x0-30)×0.07=0.5,得x0≈31.4.故选A.3.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.1.频率分布直方图的性质(1)小长方形的面积=组距×频率组距=频率.见举例说明1.(2)各小长方形的面积之和等于1.2.频率分布直方图中的众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即是众数;(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位数;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.见举例说明3.1.(2019·湘潭三模)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成如下6组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并绘制频率分布直方图如图所示,若已知不低于140分的人数为110,则n的值是()A.800 B.900C.1200 D.1000答案 D解析由频率分布直方图的性质,得10×(0.031+0.020+0.016×2+m+0.006)=1,解得m=0.011,∵不低于140分的频率为0.011×10=0.11,∴n=1100.11=1000.2.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)频率分布直方图如图.(2)质量指标值的样本平均数为x-=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.组基础关1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14 B.15C.16 D.17答案 B解析由频数分布表可知,样本中数据在[20,40)上的频率为4+530=0.3,又因为样本数据在[20,60)上的频率为0.8,所以样本在[40,60)内的频率为0.8-0.3=0.5,数据个数为30×0.5=15.2.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:甲乙丙丁平均成绩x-86898985 方差s2 2.1 3.5 2.1 5.6A.甲B.乙C.丙D.丁答案 C解析丙平均成绩高,方差s2小(稳定),故最佳人选是丙.3.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6C.0.7 D.0.8答案 C解析解法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.解法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.故选C.4.(2019·钦州模拟)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第三组B.第四组C.第五组D.第六组答案 B解析由图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第四组,所以B正确.5.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B答案 B解析 由图可知A 组的6个数为2.5,10,5,7.5,2.5,10,B 组的6个数为15,10,12.5,10,12.5,10,所以x -A =2.5+10+5+7.5+2.5+106=6.25,x -B =15+10+12.5+10+12.5+106≈11.67.显然x -A <x -B .又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B.6.(2019·合肥一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是( )注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.90后从事运营岗位的人数比80前从事互联网行业的人数多D.互联网行业中90后从事技术岗位的人数比80后从事技术岗位的人数多解析 对于A ,由饼状图可知互联网行业从业人员中90后占了56%,故A 正确.对于B ,由条形图可知互联网行业中从事技术岗位的人数占总人数的比例为39.6%,故B 正确.对于C ,由两图数据可计算出整个互联网行业从事运营岗位的90后占56%×17%=9.52%,大于互联网行业中的80前总人数,故C 正确.对于D ,因为80后从事技术岗位的人数所占比例不清楚,所以互联网行业中从事技术岗位的90后人数不一定比80后的人数多,故D 错误.故选D.7.(2020·重庆名校联盟调研)在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的25,且样本容量为210,则该组的频数为( )A.28 B .40 C .56 D .60答案 D解析 设该小矩形的面积为x,9个小矩形的总面积为1,则其他8个小矩形的面积和为52x ,所以x +52x =1,所以x =27,所以该组的频数为27×210=60.8.(2020·贵阳模拟)某地的中小学办学条件在政府的教育督导下,迅速得到改善.教育督导一年后,分别随机抽查了初中(用A 表示)与小学(用B 表示)各10所学校,得到相关指标的综合评价得分(百分制)的茎叶图如图所示,则从茎叶图可得出正确的信息为(80分及以上为优秀)( )①初中得分与小学得分的优秀率相同 ②初中得分与小学得分的中位数相同 ③初中得分的方差比小学得分的方差大 ④初中得分与小学得分的平均值相同A.①② B .①③ C .②④D .③④解析从茎叶图可知抽查的初中得分的优秀率为310×100%=30%,小学得分的优秀率为310×100%=30%,故①正确;初中得分的中位数为75.5,小学得分的中位数为72.5,故②不正确;从茎叶图可知初中得分比小学得分分散,所以初中得分的方差比小学得分的方差大,故③正确;初中得分的平均值为75.7,小学得分的平均值为75,故④不正确.所以正确的信息为①③,故选B.9.已知一组数据x1,x2,…,x n的方差为2,若数据ax1+b,ax2+b,…,ax n +b(a>0)的方差为8,则a的值为________.答案 2解析根据方差的性质,知a2×2=8,解得a=2.10.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为________.答案 3解析由频率分布直方图,知5×(0.01+0.02+a+0.04+0.04+0.06)=1,解得a=0.03,即使用时间在[15,20),[20,25),[25,30]三组内的学生人数之比为4∶3∶1,则从每周使用时间在[15,20),[20,25),[25,30]三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中应选取的人数为38×8=3.组能力关1.某校高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2 B .24,4 C .25,2 D .25,4答案 C解析 由频率分布直方图可知,组距为10,所以[50,60)的频率为0.008×10=0.08,由茎叶图可知[50,60)的人数为2,设参加本次考试的总人数为N ,则N =20.08=25,根据频率分布直方图可知[90,100]内的人数与[50,60)的人数一样,都是2.故选C.2.(2019·葫芦岛一模)一个样本容量为10的样本数据,它们组成一个公差为2的等差数列{a n },若a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A.12,13 B .13,13 C .13,12 D .12,14答案 B解析 依题意a 23=a 1a 7,∴(a 1+4)2=a 1(a 1+6×2),解得a 1=4,所以此样本的平均数为S 1010=13,中位数为a 5+a 62=13.3.(2019·马鞍山模拟)某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图1的频率分布直方图,其中体重最轻的14头仔猪的体重的茎叶图如图2,为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中a +b 的值为( )A.0.144B .0.152C .0.76D .0.076答案 B解析 由题意得2(c +d )×5=2×12100=0.24,∴a +b =1-0.245=0.152. 4.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.解 (1)根据题意可知:x -甲=15×(7+8+10+12+10+m )=10,x -乙=15×(9+n +10+11+12)=10,所以m =3,n =8.(2)s 2甲=15×[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15×[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,因为x -甲=x -乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组更稳定一些.组 素养关(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组 企业数 [-0.20,0) 2 [0,0.20) 24 [0.20,0.40) 53 [0.40,0.60) 14 [0.60,0.80)7(1)。
高考数学一轮总复习课件:随机抽样、用样本估计总体
6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
2025高考数学一轮复习课件 随机抽样、用样本估计总体
夯实双基
1.判断下面结论是否正确(打“√”或“×”). (1)不放回简单随机抽样是从总体中逐个不放回地抽取样本.
答案 √
(2)分层随机抽样是将每层各抽取相同的个体数构成样本,分层随机抽样 为保证各个个体等可能入样,必须进行每层等可能抽样.
答案 ×
(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. 答案 ×
总体集中趋势与离散程度的估计
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中
间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:
-x
x1+x2+…+xn
=________n_______________,反映了一组数据的平均水
霸”A.√抽样表明,该校有一半学生为“阅读
B.该校只有 50 名学生不喜欢阅读 C.该校只有 50 名学生喜欢阅读 D.抽样表明,该校有 50 名学生为“阅读霸”
解析 根据频率分布直方图可列下表:
阅读时
[0,
间(分钟)
10)
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60]
A√.3
1 C.4
B.4 1
D.3
【解析】 由题意知 x1+x2+…+xm=m-x , y1+y2+…+yn=n-y , -z =(x1+x2+…+xm)m++(n y1+y2+…+yn) =m-xm+ +nn-y =mm+-xn+mn+-y n=14-x +43-y ,所以m+m n=14,m+n n=34,可得
3m=n,所以mn =13.
状元笔记
(1)简单随机抽样、分层随机抽样中,总体中每个个体入样的可能性是 相同的.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十三章统计案例高考导航
13.1 抽样方法与用样本估计总体
典例精析
题型一 抽样方法
【例1】某校有教师200人,男学生1 200人,女学生1 000人,用分层抽样的方法从所有师生中抽取一个容量为n 的样本,已知女学生抽取的人数为80人,则n 的值为 .
【解析】根据分层抽样的意义,
n
200+1 200+1 000=801 000
,解得n =192.
【点拨】现实中正确的分层抽样一般有三个步骤:首先,辨明突出的统计特征和分类.其次,确定每个分层在总体上的比例.利用这个比例,可计算出样本中每组(层)应抽取的人数.最后,必须从每层中抽取独立简单随机样本.
【变式训练1】从某厂生产的802辆轿车中随机抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
【解析】第一步,将802辆轿车用随机方式编号.
第二步,从总体中剔除2辆(剔除方法可用随机数表法),将剩余的800辆轿车重新编号(分别为001,002,003,…,800),并分成80段.
第三步,在第一段001,002,…,010这十个编号中用简单随机抽样抽出一个(如005)作为起始号码.
第四步,将编号为005,015,025,…,795的个体抽出,组成样本.
题型二频率分布直方图
【例2】(2012湖南模拟)如图是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.
(1)求直方图中x的值;
(2)若将频率视为概率,从这个城市随机抽取3位居民(看作有放回的抽样),求月均用水量在3至4吨的居民数X的分布列和数学期望.
【解析】(1)依题意及频率分布直方图知0.02+0.1+x+0.37+0.39=1,解得x=0.12.
(2)由题意知X~B(3,0.1),因此
P(X=0)=C03×0.93=0.729,
P(X=1)=C13×0.1×0.92=0.243,
P(X=2)=C23×0.12×0.9=0.027,
P(X=3)=C33×0.13=0.001,
故随机变量X的分布列为
X 0 1 2 3
P 0.729 0.243 0.027 0. 001
X的数学期望为
(或E(X)=1×0.243+2×0.027+3×0.001=0.3)
【点拨】从频率分布直方图读取数据时,要特别重视组距,纵坐标是频率除以组距,故长方形的面积之和为1.
【变式训练2】如图是容量为100的样本的频率分布直方图,试根据数据填空:
(1)样本数据落在[10,14)内的频数为;
(2)样本数据落在[6,10)内的频率为;
(3)总体落在[2,6)内的频率为 .
【解析】(1)样本落在[10,14)内的频数为0.09×4×100=36. (2)样本落在[6,10)内的频率为0.08×4=0.32.
(3)样本落在[2,6)内的频率为0.02×4=0.08,所以总体落在[2,6)内的频率约为0.08. 题型三 平均数、方差的计算
【例3】甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问谁10次射靶的情况较稳定?
【解析】本题要计算两样本的方差,当样本平均数不是整数,且样本数据不大时,可用简化公式计算方差.
甲x =1
10(4+7+…+8)=7.1,
乙x =
1
10
(7+8+…+9)=7.1, s 2甲=
1
10(42+72+…+82-10×7.12
)=3.09, s 2乙=
110
(72+82+…+92-10×7.12
)=1.29, 因为s 2
甲>s 2
乙,所以乙10次射靶比甲10次射靶情况稳定.
【点拨】平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据的离散程度就越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
【变式训练3】(2013北京市东城区模拟)在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如右图.
(1)计算此样本的平均成绩及方差;
(2)现从此样本中随机抽出2名学生的成绩,设抽出分数为90分以上的人数为X ,求随机变量X 的分布列和均值.
【解析】(1)样本的平均成绩x =80; 方差为s 2
=
110
[(92-80)2+(98-80) 2+(98-80)2+(85-80)2+(85-80)2
+(74-80)2
+(74-80)2+(74-80)2
+(60-80)2
+(60-80)2
]=175.
(2)由题意,随机变量X =0,1,2.
P (X =0)=C 2
7C 210=715,P (X =1)=C 13C 1
7C 210=715,P (X =2)=1
15.
随机变量X 的分布列为
E (X )=0×715
+1×715
+2×15=5
.
总结提高
1.统计的基本思想是用样本估计总体.这就要求样本具有很好的代表性,而样本良好客观的代表性,则完全依赖抽样方法.
2.三种抽样方法中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,它们的共同点都是等概率抽样.适用范围不同,要根据总体的具体情况选用不同的方法.
3.对于总体分布,总是用样本的频率分布对它进行估计.
4.用样本估计总体,一般分成以下几个步骤:
先求样本数据中的最大值和最小值(称为极值),再确定合适的组数和组距,确定分点(每个分点只属于一组,故一般采用半开半闭区间),然后列出频率分布表(准确,查数据容易),画频率分布直方图.。