2023年高考数学(文科)一轮复习讲义——用样本估计总体
新高考2023版高考数学一轮总复习第9章第2讲用样本估计总体课件

A.A地:中位数为2,极差为5 B.B地:总体平均数为2,众数为2 C.C地:总体平均数为1,总体方差大于0 D.D地:总体平均数为2,总体方差为3
( AD )
[解析] 对 A,因为 A 地中位数为 2,极差为 5,故最大值不会大于 2 +5=7.故 A 符合;对 B,若 B 地过去 10 日分别为 0,0,0,2,2,2,2, 2,2,8,则满足总体平均数为 2,众数为 2,但不满足每天新增疑似病例 不超过 7 人,故 B 不符合;对 C,若 C 地过去 10 日分别为 0,0,0,0,0, 0,0,0,1,9,则满足总体平均数为 1,总体方差大于 0,但不满足每天 新增疑似病例不超过 7 人,故 C 不符合;对 D,利用反证法,若至少有一 天疑似病例超过 7 人,则方差大于110×(8-2)2=3.6>3,与题设矛盾,故连 续 10 天,每天新增疑似病例不超过 7 人,故 D 符合,故选 AD.
第九章
统计 成对数据的统计分析
第二讲 用样本估计总体
知识梳理·双基自测 考点突破·互动探究 名师讲坛·素养提升
知识梳理·双基自测
知识点一 总体取值规律的估计 频率分布表与频率分布直方图 频率分布表和频率分布直方图,是从各个小组数据在样本容量中所 占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据 的频率分布情况. 绘制频率分布直方图的步骤为: ① ___求__极__差___ ; ② __决__定__组__距__与__组__数____ ; ③ ___将__数__据__分__组___ ; ④ ___列__频__率__分__布__表___;⑤__画__频__率__分__布__直__方__图____.
=1ni=n1 (xi--x )2=1ni=n1xi--x 2.
2025届高中数学一轮复习课件《随机抽样、用样本估计总体》ppt

高考一轮总复习•数学
第21页
(3)(2024·江西吉安模拟)总体由编号为 00,01,02,…,48,49 的 50 个个体组成,利用下面 的随机数表选取 6 个个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从
数字 3. 数字 3. 左到右依次选取两个数字,则选出的第 3 个个体的编号为 ( )
高考一轮总复习•数学
第10页
2.总体方差和总体标准差 (1)一般式:如果总体中所有个体的变量值分别为 Y1,Y2,…,YN,总体平均数为 Y ,则
总体方差 S2=N1i=N1 (Yi- Y )2.
(2)加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi 出现的频数为 fi(i=1,2,…,k),则总体方差为 S2=N1i=k1fi(Yi- Y )2.
高考一轮总复习•数学
第12页
3.简单随机抽样样本平均数、方差的计算公式的推广 (1)若数据 x1,x2,…,xn 的平均数为 x ,则数据 mx1+a,mx2+a,mx3+a,…,mxn +a 的平均数是 m x +a; (2)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,axn+b 的方差为 a2s2. 4.分层随机抽样样本均值、方差的计算公式的推广 如果将总体分为 k 层,第 j 层抽取的样本量为 nj,样本均值为 x j,样本方差为 s2j ,j=
高考一轮总复习•数学
第24页
(3)按随机数法,从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 因为编号由 2 个数字组成.
00~49 及重复的不选,则编号依次为 33,16,20,38,49,32,…,则选出的第 3 个个体的编 号为 20.故选 D.
2025届高考数学一轮总复习第10章统计与成对数据的统计分析第2节用样本估计总体新人教A版

B.170
C.171
解析 根据题意,10×60%=6,所以第 60
以 x=171.
D.172
169+
169+
百分位数为 2 ,由已知 2 =170,所
考点二 用样本的数字特征估计总体的数字特征(多考向探究预测)
考向1总体集中趋势的估计(中位数、众数、平均数)
例2(1)(2024·山东济南模拟)某射击运动员连续射击5次,命中的环数(环数
3.一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
4.对一组数据来说,平均数和中位数总是非常接近.( × )
题组二回源教材
5.(人教A版必修第二册9.2.2节例2改编)某机构调查了解10种食品的卡路里
含量,结果如下:107,135,138,140,146,175,179,182,191,195.则这组数据的第
1 m
2
∑
x
i,s1
m i=1
=
则①w =
m+
;
m+
②s
1 m
2
∑
(x
i-) ,
m i=1
1
=
{m[s12 +(
m+
2
=
1
2
∑
y
i,s2
i=1
=
1
2
∑
(y
i-) .
i=1
− w)2]+n[s22 +( − w)2]}.
常用结论
1.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
均值和样本方差的计算.
目录索引
1 强基础 固本增分
高考数学第一轮知识点总复习 第二节 用样本估计总体

平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
高考文数一轮复习课件:第章第讲用样本估计总体

高考文数一轮复习课件:第章第讲用样本估计总体1. 引言在高考文数复习中,掌握用样本估计总体是十分重要的内容之一。
本节课将带领大家深入学习第章第讲中的用样本估计总体的概念、原理和应用。
2. 用样本估计总体的概念2.1 总体的概念在统计学中,总体是指研究对象的全体,它是我们要研究的群体或集合。
例如,如果我们要研究学校全体学生的成绩情况,那么学校全体学生就是总体。
2.2 样本的概念样本是从总体中选取出来的一部分个体,它代表了总体的一部分特征。
通过对样本的分析,我们可以对总体进行推断和估计。
2.3 用样本估计总体的概念用样本估计总体是通过分析样本的数据,利用样本的特征来推断总体的特征。
我们通过样本中的数据,对总体的某个参数进行估计,如总体的平均值、方差等。
3. 用样本估计总体的原理3.1 无偏估计和偏差在进行样本估计时,我们希望获得的估计值能够尽可能地接近总体参数的真值。
一个估计量被称为无偏估计,当它的期望值等于被估计参数的真值。
偏差是指估计值与真值之间的差异。
3.2 用样本估计总体均值的方法3.2.1 样本均值的估计样本均值是用来估计总体均值的一种常见方法。
样本均值是样本中各个观测值的总和除以观测值的个数。
根据中心极限定理,当样本容量足够大时,样本均值的分布会接近正态分布。
3.2.2 样本均值的抽样分布样本均值的抽样分布是指在给定样本容量的情况下,样本均值可能取到的所有可能值的分布。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
3.2.3 统计量与总体参数之间的关系样本均值是一种统计量,它是用来估计总体均值的。
统计量是从样本数据中计算得到的数值,它可以代表总体参数的某种特征。
3.3 用样本估计总体方差的方法3.3.1 样本方差的估计样本方差是用来估计总体方差的一种方法。
样本方差是样本观测值与样本均值之间差异的平方的平均值。
3.3.2 样本方差的抽样分布样本方差的抽样分布是指在给定样本容量的情况下,样本方差可能取到的所有可能值的分布。
《用样本估计总体》 讲义

《用样本估计总体》讲义在我们的日常生活和各种科学研究中,常常需要从部分数据(样本)来推断整体的情况(总体)。
这就好像我们通过观察一小部分苹果的质量,来推测整批苹果的质量好坏;或者根据部分学生的考试成绩,来估计整个班级的学习水平。
这种用样本估计总体的方法,是统计学中非常重要的一种手段。
一、为什么要用样本估计总体首先,我们来思考一下,为什么不能直接研究总体呢?这往往是因为总体的数量太大、获取全部数据的成本太高或者根本就不可能获取到全部数据。
比如说,要调查全国所有成年人的身高,这几乎是不可能完成的任务。
但如果我们抽取一部分具有代表性的成年人作为样本,通过对这些样本的测量和分析,就能够对全国成年人的身高情况做出一个相对准确的估计。
用样本估计总体还有一个重要的原因,那就是能够节省时间和资源。
想象一下,如果要对一个大型工厂生产的所有零件进行质量检测,那需要耗费大量的人力、物力和时间。
而通过抽取一定数量的零件作为样本进行检测,就能在较短的时间内,以较小的成本对整批零件的质量有一个大致的了解。
二、样本与总体的关系样本是从总体中抽取出来的一部分个体或观测值。
总体则是我们所关心的研究对象的全体。
样本应该具有代表性,也就是说,样本的特征应该能够反映总体的特征。
举个例子,如果要研究一个城市居民的收入水平,不能只抽取高收入人群作为样本,也不能只抽取低收入人群,而应该按照一定的比例,从不同收入层次的人群中抽取样本,这样得到的样本才能较好地代表总体的收入情况。
样本的大小也会影响估计的准确性。
一般来说,样本越大,估计的准确性就越高。
但样本大小也不是越大越好,因为过大的样本会增加调查的成本和难度。
所以,在实际应用中,需要根据具体情况,选择合适的样本大小。
三、抽样方法为了获得具有代表性的样本,我们需要采用合适的抽样方法。
常见的抽样方法有简单随机抽样、分层抽样和系统抽样。
简单随机抽样是最基本的抽样方法,就是从总体中随机地抽取个体,每个个体被抽取的概率相等。
用样本估计总体课件-2025届高三数学一轮复习

统计与成对数据的统计分析之
用样本估计总体
1.总体百分位数的估计
(1)百分位数
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少
有%的数据小于或等于这个值,且至少有 − %的数据大于或等于
这个值.
(2)百分位数的意义
反映该组数中小于或等于该百分位数的分布特点.
胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
, = , , ⋯ , .试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记 = − = , , ⋯ , ,记 , ,⋯ , 的样本平均数为,样本
考点二 总体集中趋势的估计
例2 (多选)(2024·山东济南模拟)某学校发起了“畅读经典,欢度新年”活
动,根据统计数据可知,该校共有1 200名学生,所有学生每天读书时间
均在 到 之间,他们的日阅读时间的频率分布直方图如图
所示.则下列结论正确的是(
)
A.该校学生日阅读时间的众数约为70
⋅ [ +
+
+
+
,样本的方差为
+
− ].
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;
2023届高考数学一轮复习计划 第二节 用样本的数字特征估计总体(共38张PPT)

2.(2022·本溪模拟)某学校有高中学生 500 人.其中男生 320 人,女生 180 人.为 了获得全体高中生身高的信息,按照分层随机抽样原则抽取样本,男生样本量 为 32,女生样本量为 18,通过计算得男生身高样本均值为 173.5 cm,方差为 17,女生身高样本均值为 163.83 cm,方差为 30.03,则所有数据的样本均值 为________cm,方差为________. 解析:由题意得 ω =3520×173.5+1580×163.83≈170.02(cm),s2=510×{[32×17 +32×(173.5-170.02)2]+[18×30.03+18×(163.83-170.02)2]}≈43.24. 答案:170.02 43.24
解:(1)当 0≤x≤200 时,y=0.5x; 当 200<x≤400 时,y=0.5×200+0.8×(x-200)=0.8x-60; 当 x>400 时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
0.5x,0≤x≤200, 所以 y 关于 x 的函数解析式为 y=0.8x-60,200<x≤400,
σ,t,依题意得,新样本数据 y1,y2,…,yn 的平均数、中位数、标准差、极差分
别为 x +c,m+c,σ,t,因为 c≠0,所以 C、D 正确,故选 C、D.
答案:CD
3.(多选)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害
越 大 , 指 数 范 围 为 [0,50] , [51,100] , [101,200] , [201,300] , [301,500] , 对 应
第二节 用样本的数字特征估计总体
(1)结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数), 理解集中趋势参数的统计含义;(2)结合实例,能用样本估计总体的离散程度参数 (标准差、方差、极差),理解离散程度参数的统计含义;(3)结合实例,能用样本 估计总体的取值规律;(4)结合实例,能用样本估计百分位数,理解百分位数的统 计含义.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3节用样本估计总体考试要求 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是mx -+a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.思考辨析(在括号内打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中.()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()答案(1)√(2)×(3)√(4)×解析(2)错误.方差越大,这组数据越离散.(4)错误.在茎叶图中,相同的数据叶要重复记录,故(4)错误.2.(2021·天津卷)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案 D解析由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.3.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92答案 A解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x -=87+89+90+91+92+93+94+968 =91.5.4.(易错题)已知一组数据的频率分布直方图如图,则众数是________,平均数是________.答案 65 67解析 因为最高小长方形中点的横坐标为65,所以众数为65;平均数x -=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.5.(2021·新高考全国Ⅱ卷改编)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的所有正确编号有________.①样本x 1,x 2,…,x n 的标准差;②样本x 1,x 2,…,x n 的中位数;③样本x 1,x 2,…,x n 的极差;④样本x 1,x 2,…,x n 的平均数.答案 ①③解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故①③正确.6.(易错题)若数据x 1,x 2,x 3,…,x n 的平均数x -=5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为________.答案 16,18解析 ∵x 1,x 2,x 3,…,x n 的平均数为5,∴3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数是3×5+1=16,∵x 1,x 2,x 3,…,x n 的方差为2,∴3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18.考点一 频率分布直方图例1 某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评[50,60)[60,70)[70,80)[80,90)[90,100] 分分组频数281410 6(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户和满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.感悟提升 1.频率分布直方图的性质.(1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)小长方形的高=频率组矩.2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.训练1 (2021·江西省重点中学联考)江西省重点中学协作体于2021年进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是()A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5C.这100名参赛者得分的中位数为65D.可求得a=0.005解析对于A,得分在[40,60)之间的有100×[1-(0.030+0.020+0.010)×10]=40(人),故A正确;对于B,从这100名参赛者中随机选取1人,其得分在[60,80)的概率为(0.030+0.020)×10=0.5,故B正确;对于D,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故D正确;对于C,得分在[40,60)的频率为(0.005+0.035)×10=0.4,得分在[60,70)的频率为0.030×10=0.3,∴这100名参赛者得分的中位数为60+0.5-0.40.3×10≈63.3,故C错误.考点二统计图表及应用角度1扇形图例2 (2022·郑州模拟)某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测试共5题道,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是()A.该次课外知识测试及格率为90%B.该次课外知识测试得满分的同学有30名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有3 000名学生,则课外知识测试成绩能得优秀的同学大约有1 440名解析由题图可知及格率为1-8%=92%,故A错误.该次课外知识测试得满分同学占的百分比为1-8%-32%-48%=12%,则得满分的同学有12%×200=24(名),故B错误.中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确.3 000×(48%+12%)=1 800(名),故D错误.角度2折线图例3 (2021·昆明诊断)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图是2019年9月到2020年2月这半年来某个关键词的搜索指数变化的统计图.根据该统计图判断,下列结论正确的是()A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2019年10月的方差小于11月的方差D.从该关键词的搜索指数来看,2019年12月的平均值大于2020年1月的平均值答案 D解析由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,排除A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,排除B;由统计图可知,2019年10月该关键词的搜索指数波动较大,11月的波动较小,所以2019年10月的方差大于11月的方差,排除C;由统计图可知,2019年12月该关键词的搜索指数大多高于10 000,该月平均值大于10 000,2020年1月该关键词的搜索指数大多低于10 000,该月平均值小于10 000,选D.角度3茎叶图例4 (2022·西安模拟)中国数学奥林匹克由中国数学会主办,是全国中学生级别最高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹克做准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,则该集训队考试成绩的众数与中位数分别为()A.85,75B.85,76C.74,76D.75,77答案 B解析由茎叶图知,出现的数据最多的是85,故众数为85;由于数据总数为14个,故中位数为排序后第七个和第八个数据的平均数,即75+77=76,故选B.2感悟提升 1.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.3.茎叶图的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.训练2 (1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想了解同学们对假期学习方式的满意程度,收集如图1所示的数据;教务处通过分层抽样的方法抽取4%的同学进行满意度调查,得到的数据如图2.下列说法错误的是()A.样本容量为240B.若m=50,则本次自主学习学生的满意度不低于四成C.总体中对方式二满意的学生约为300人D.样本中对方式一满意的学生为24人(2)(2022·南昌测试)爱美之心,人皆有之,健身减肥已成为很多肥胖者业余选择的项目.为了了解运动健身减肥的效果,某健身房调查了40名肥胖者,健身之前他们的体重(单位:kg)情况如柱状图1所示,经过四个月的健身后,他们的体重情况如柱状图2所示,对比健身前后,关于这40名肥胖者,下面结论不正确的是()A.他们健身后,体重在区间[90,100)内的人数增加了4B.他们健身后,体重在区间[100,110)内的人数没有改变C.因为健身前后体重在区间[100,110)内的人数所占的比例没有发生变化,所以健身对体重没有任何影响D.他们健身后,原来体重在区间[110,120)内的肥胖者的体重都有减少答案(1)B(2)C解析(1)选项A,样本容量为6 000×4%=240,该选项正确;选项B,根据题意得自主学习的满意率为600+300+1 2506 000≈0.358<0.4,该选项错误;选项C,样本可以估计总体,但会有一定的误差,总体中对方式二满意人数约为1 500×20%=300,该选项正确;选项D,样本中对方式一满意人数为2 000×4%×30%=24,该选项正确.(2)健身前体重在区间[90,100),[100,110),[110,120)内的人数分别为40×30%,40×50%,40×20%,即12,20,8,健身后体重在区间[80,90),[90,100),[100,110)内的人数分别为40×10%,40×40%,40×50%,即4,16,20.所以健身后,体重在区间[90,100)内的人数增加了16-12=4,故A选项正确;健身后,体重在区间[100,110)内的人数与健身前一样,同为20,故B选项正确;虽然健身前后体重在区间[100,110)内的人数所占的比例没有发生变化,但是健身后没有体重在区间[110,120)内的人,所以健身对体重有影响,故C 选项错误; 健身前,体重在区间[110,120)内的有8人,健身后没有体重在区间[110,120)内的人,故D 选项正确.故选C. 考点三 样本的数字特征例5 (1)(2021·太原模拟)已知一组数据1,2,a ,b ,5,8的平均数和中位数均为4,其中a ,b ∈N *,在去掉其中的一个最大数后,该组数据的( ) A.平均数不变 B.中位数不变 C.众数不变D.标准差不变(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________. 答案 (1)C (2)甲解析 (1)由平均数为4知,a +b =8;由中位数为4,得a =b =4或a =3,b =5.去掉最大数8后,根据平均数与标准差的意义,知平均数和标准差均变小,中位数可能是4,也可能是3,当a =b =4时,众数与原来一致,都为4;当a =3,b =5时,众数也与原来一致,都为5,故选C.(2)由题意可得x -甲=x -乙=9,又∵s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲, ∴甲更稳定,故最佳人选应是甲.感悟提升 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.训练3 (1)(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.10(2)(2022·成都诊断)构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好).下列说法正确的是()A.高三(2)班五项评价得分的极差为1.5B.除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分C.高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高D.各项评价得分中,这两班的体育得分相差最大答案(1)C(2)C解析(1)10x1,10x2,…,10x n的方差为102×0.01=1.故选C.(2)高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,所以极差为9.5-8.5=1,A错误;对于B,两班的德育分相等,B错误;对于D,两班的劳育得分相差最大,D错误.故选C.1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16答案 B解析设频数为n,则n32=0.25,∴n=32×0.25=8.2.(2021·洛阳模拟)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,10答案 A解析由图①得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,抽取的高中生人数为2 000×2%=40(人),则近视人数为40×0.5=20(人),故选A.3.从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如下:身高[100,110](110,120](120,130](130,140](140,150] 频数535302010由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)()A.119.3B.119.7C.123.3D.126.7答案 C解析由题意知身高在[100,110],(110,120],(120,130]的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×0.310=0.1,解得x≈123.3.故选C.4.(2021·贵阳诊断)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()A.甲所得分数的极差为22B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数答案 D解析甲所得分数的极差为33-11=22,A正确;乙所得分数的中位数为18,B正确;甲所得分数的众数为22,乙所得分数的众数为22,C正确,故选D.5.某运动健康App可以记录跑步(里程数)或行走情况(步数),用户通过该App可查看自己某时间段的运动情况.某人根据2022年1月至2022年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论不正确的是()A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳答案 A解析由折线图可知,月跑步里程并不是逐月增加,A错误;月跑步里程最大值出现在10月,B正确;月跑步里程的中位数为5月份对应的里程数,C正确;相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳,D正确.6.(2022·银川质检)甲、乙、丙、丁四位同学组成的数学学习小组进行了一次小组竞赛,共测试了5道题,每位同学各题得分情况如下表所示:题目第1题第2题第3题第4题第5题学生甲101010200乙101051510丙1010151510丁010102020下列说法正确的是()A.甲的平均得分比丙的平均得分高B.乙的得分极差比丁的得分极差大C.对于这4位同学,因为第4题的平均得分比第2题的平均得分高,所以第4题相关知识一定比第2题相关知识掌握的好D.对于这4位同学,第3题得分的方差比第5题得分的方差小答案 D解析选项A中,甲的平均得分为10+10+10+20+05=10,丙的平均得分为10+10+15+15+105=12,故甲的平均得分比丙的平均得分低,故错误;选项B中,乙的得分极差为15-5=10,丁的得分极差为20-0=20,故乙的得分极差比丁的得分极差小,故错误;选项C中,不清楚两题的具体分值是否相同,所以不能通过平均分判断这4位同学第4题相关知识一定比第2题相关知识掌握的好,故错误;选项D中,第3题得分的平均分为10+5+15+104=10,故方差为(10-10)2+(5-10)2+(15-10)2+(10-10)24=12.5,第5题得分的平均分为0+10+10+204=10,故方差为(0-10)2+(10-10)2+(10-10)2+(20-10)24=50,所以对于这4位同学,第3题得分的方差比第5题得分的方差小.7.我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案0.98解析经停该站高铁列车所有车次的平均正点率的估计值为x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.8.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是____________.答案 50解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3. ∴该班学生人数n =150.3=50.9.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________. 答案 16解析 依题意,x 1,x 2,x 3,…,x 10的方差s 2=64.则数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.10.(2022·哈尔滨调研节选改编)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100]分成5组,制成如图所示的频率分布直方图.(1)求图中x 的值;(2)估计这组数据的众数、平均数和中位数. 解 (1)由频率分布直方图得(0.005+x +0.035+0.030+0.010)×10=1,解得x =0.020. (2)因为最高小长方形中点的横坐标为75, 所以估计这组数据的众数为75. 估计这组数据的平均数为x -=55×0.005×10+65×0.020×10+75×0.035×10+85×0.030×10+95×0.010×10=77.满意度评分值在[50,70)内的频率为(0.005+0.020)×10=0.25,满意度评分值在[70,80)内的频率为0.035×10=0.35, ∴中位数为70+0.5-0.250.35×10=5407.11.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高). 解 (1)由表格中的数据易得:x -=-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.310+10.0=10.0, y -=0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.510+10.0=10.3, s 21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s 22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y --x -=10.3-10.0=0.3,而2s 21+s 2210=25(s 21+s 22)=0.030 4,显然有y --x ->2s 21+s 2210成立, 所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.12.(2021·绵阳诊断)对全班45名同学的数学成绩进行统计,得到平均数为80,方差为25,现发现数据收集时有两个错误,其中一个95分记录成了75分,另一个60分记录成了80分.纠正数据后重新计算,得到平均数为x -,方差为s 2,则( ) A.x -=80,s 2<25B.x -=80,s 2=25 C.x -=80,s 2>25D.x -<80,s 2<25 答案 C 解析 由95+60=75+80知,这组数据的总和不变,所以在对错误的数据进行更正后,重新求得样本的平均数不变,即x -=80,(95-80)2+(60-80)2>(75-80)2+(80-80)2,所以数据的波动变大了,即s2>25.13.已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的13,则该组的频数为________.答案50解析设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为13p,p+13p=1,p=34,则中间一个小矩形的面积等于13p=14,200×14=50,即该组的频数为50.14.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数62638228 (1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%的规定?解(1)样本数据的频率分布直方图如图所示:(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104. 所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68. 由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。