新教材高中数学第六章统计4用样本估计总体数字特征4-1样本的数字特征4-2分层随机抽样的均值与方差
用样本估计总体-【新教材】人教B版高中数学必修

关键能力·攻重难
题型 一
题型探究
用样本的特征数估计总体的特征数
典例剖析
• 角度1 简单随机抽样的数字特征
•
典例甲1 、乙两机床同时加工直径为100 cm的零件,为检验质量,各
从中抽取6件测量,数据为
• 甲:99 100 98 100 100 103
4 597966 5 189 60
[解析] 将样本中的每一个数都减去 50,可得 -5,-1,-3,-1,-4,-4,1,8,9,10, 这组数的平均数为-5-1-3-1-41-0 4+1+8+9+10=1, 方差为62+22+42+22+52+ 1052+02+72+82+92=30.4, 因此可估计这个学校学生体重的平均数为 51,方差为 30.4.
本容量偏少等.
知识点 二 用样本的数字特征来估计总体的数字特征
• (1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的 ____________即可.
• (数2)字样特本征是用分层抽样得到的,由每一层的数字特征估计总体的数字特 征.以分两层抽样的情况为例.
假设第一层有 m 个数,分别为 x1,x2,…,xm,平均数为-x , 条件 方差为 s2;第二层有 n 个数,分别为 y1,y2,…,yn,平均数
题型 二
用样本的分布估计总体的分布
典例剖析
• 用水,典计例划3 调我整国居是民世生界活上用严水重收缺费水方的案国,家拟,确某定市一政个府合为理了的鼓月励用居水民量节标约 准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分 按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居 民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图所示的频率分布直方图.
新教材高中数学第六章统计2抽样的基本方法第2课时分层随机抽样课件北师大版必修第一册

10
①确定抽取个数.因为30
9
抽取 =3(个);
3
=
1
21
,所以甲厂生产的应抽取
=7(个),乙厂生产的应
3
3
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个,这些篮球便
组成了我们要抽取的样本.
(3)总体个数较大,样本容量较小,宜用简单随机抽样中的随机数法.
(1)从10台电冰箱中抽取3台进行质量检查;
(2)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为
了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
解(1)抽签法,总体中个体数较小,宜用抽签法.(2)分层随机抽样,由于学校各
类人员对这一问题的看法可能差异较大,用分层随机抽样.
D.从生产流水线上,抽取样本检查产品质量
(2)分层随机抽样将相似的个体归入一类(层),然后每类抽取若干个个体构
成样本,所以分层随机抽样为保证每个个体等可能抽样,必须(
)
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比例等可能抽样
D.所有层抽取的个体数量相同
答案 (1)B
(2)C
解析 (1)A中总体的每个个体无明显差异且个数较少,适合用简单随机抽
若样本中的青年职工为14人,则样本容量为(
A.14
B.30 C.50 D.70
答案 B
解析 设样本容量为
解得 N=30.
14
N,由题意得
700
=
,
1 500
)
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14
10.1随机抽样与用样本估计总体-2021届高三数学(新高考)一轮复习课件(共43张PPT)

微点 4 频率分布直方图 [例 4] [多填题]从某小区抽取 100 户居民进行月用电量调查,发 现其用电量都在 50 至 350 度之间,频率分布直方图如图.
(1)直方图中 x 的值为__0_.0_0_4__0_; (2) 在 这 些 用 户 中 , 月 用 电 量 落 在 区 间 [100,250) 内 的 户 数 为 ___7_0____.
类题通法 折线图可以显示随时间(根据常用比例放置)而变化的数据,因此 非常适用于显示在相等时间间隔下数据的变化趋势.
微点 3 茎叶图 [例 3] [2020·山东泰安教学质量检测]某中学数学竞赛培训班共 有 10 人,分为甲、乙两个小组,在一次阶段测试中两个小组成绩的茎 叶图如图所示,已知甲组 5 名同学成绩的平均数为 81,乙组 5 名同学 成绩的中位数为 73,则 x-y 的值为( )
答案:B 解析:第 1 个个体编号为 41,第 2 个个体编号为 48,第 3 个个体 编号为 28,第 4 个个体编号为 19.
3.[2020·山东青岛二中模拟]某机构对青年观众是否喜欢跨年晚会 进行了调查,人数如表所示:
不喜欢 喜欢 男性青年观众 30 10 女性青年观众 30 50 现要在所有参与调查的人中用分层抽样的方法抽取 n 人做进一步 的调研,若在“不喜欢的男性青年观众”中抽取了 6 人,则 n=( ) A.12 B.16 C.24 D.32
2 748 6 198 7 164 4 148 7 086 2 888 8 519 1 620 7 477 0 111 1 630 2 404 2 979 7 991 9 683 5 125 3 211 4 919 7 306 4 916 7 677 8 733 9 974 6 732 2 635 7 900 3 370 9 160 1 620 3 882 7 757 4 950 A.3 B.19 C.38 D.20
新教材高中数学第六章统计2抽样的基本方法 分层随机抽样课件北师大版必修第一册

[知识解读] 1.分层随机抽样的实施步骤 第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属 于且仅属于一个子总体; 第二步,在每个子总体中独立地进行简单随机抽样; 第三步,把所有子总体中抽取的样本合在一起作为总样本.
2.分层随机抽样适用于总体中个体之间差异较大的情形 3.在比例分配的分层抽样中需注意两点
( C)
A.50
B.60
C.70
D.80
[解析] 由分层随机抽样定义知3+n4+7=135,
∴n=70,故选 C.
关键能力•攻重难
题型一
题型探究 对分层随机抽样概念的理解
例 1 (1)某政府机关在编人员共100人,其中副处级以上干部10人,
一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意
【对点练习】❶ 下列问题中,最适合用分层随机抽样抽取样本的是 ( B)
A.从10名同学中抽取3人参加座谈会 B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭 280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一 个容量为100的样本 C.从1 000名工人中,抽取100人调查上班途中所用时间 D.从生产流水线上,抽取样本检查产品质量
B.p1>p2 D.p1,p2没有关系
( C)
[解析] 不管是简单随机抽样还是分层随机抽样,它们都是等概率抽
样,每个个体被抽中的概率均为Nn .
4.某工厂生产A,B,C三种不同型号的产品,产品的数量之比依次为
3∶4∶7.现在按分层随机抽样的Hale Waihona Puke 法抽取一个容量为n的样本,样本中A号
产品有15件,那么样本量n为
必备知识•探新知 关键能力•攻重难 课堂检测•固双基
备战2025年高考 文科数学考点一遍过:用样本估计总体

用样本估计总体用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.一、数字特征1.众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和2.极差、方差和标准差极差:即一组数据中最大值与最小值的差.方差:2222121[()()()]n s x x x x x x n=-+-++- .标准差:s =.注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.3.性质(1)若12,,,n x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++ 的平均数为mx a +.(2)数据12,,,n x x x 与数据1122n n x x a x x a x x a '='='=+++ ,,,的方差相等,即数据经过平移后方差不变.(3)若12,,,n x x x 的方差为s 2,那么12,,n ax b ax b ax b +++ ,的方差为22a s .二、茎叶图1.定义茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.2.表示方法(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.三、统计表1.频率分布直方图(1)画频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).(2)频率分布直方图的性质①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.②频率分布直方图与众数、中位数与平均数的关系A.最高的小长方形底边中点的横坐标即是众数;B.中位数左边和右边的小长方形的面积和是相等的;C.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.各种统计表的优点与不足优点不足频率分布表表示数据较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据考向一数字特征的应用明确数字特征的意义:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.典例1为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x ,则m ,n ,x 的大小关系为________.(用“<”连接)【答案】n <m <x【解析】由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.故n <m <x .1.若样本121,1,,1n x x x +++ 的平均数为10,其方差为2,则对于样本1222,22,,22n x x x +++ 的下列结论正确的是A .平均数为20,方差为8B .平均数为20,方差为10C .平均数为21,方差为8D .平均数为21,方差为102.已知一组数据3,5,7,x ,10的平均数为6,则这组数据的方差为A.335B.6C.285D.5考向二茎叶图的应用茎叶图中的三个关注点:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.茎叶图的优、缺点:由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.典例2为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为A.100B.160C.200D.280【答案】B【解析】由茎叶图,可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.3.第十一届全国少数民族传统体育运动会将于2019年9月8日至16日在郑州举行.如下图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法正确的是A.甲的平均数大于乙的平均数B.甲的中位数大于乙的中位数C.甲的方差大于乙的方差D.甲的极差小于乙的极差4.如图,茎叶图表示甲、乙两人在5次测验中的数学分数,其中有一个被污损,若乙的中位数恰好等于甲的平均数,则 的值为_________.考向三频率分布直方图的应用频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.典例3某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为A.600B.30C.60D.300【答案】A【解析】因为a,b,c成等差数列,所以2b=a+c,由频率分布直方图可得a+b+c=150-(0.002+0.006)=0.012,所以b=0.004.故消费金额超过150元的频率为(b+0.002)×50=0.3.故该商店这一个月来消费金额超过150元的顾客数量约为2000×0.3=600.故选A.90,100, 5.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数依次分成六组:[) [)[)[)[)[]100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是A .①②B .①③C .②③D .②④典例4为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:成绩[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]频数231415124(1)作出被抽查学生成绩的频率分布直方图;(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A 1和[90,100]组中学生B 1同时被选中的概率.【解析】(1)由题意可知,各组频率分别为0.04,0.06,0.28,0.30,0.24,0.08,所以图中各组的纵坐标分别为:0.004,0.006,0.028,0.030,0.024,0.008,则被抽查学生成绩的频率分布直方图如图所示:(2)记[40,50)组中的学生为A1,A2,[90,100]组中的学生为B1,B2,B3,B4,A1和B1同时被选中记为事件M.由题意可得,全部的基本事件为:A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,事件M包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共3个,所以学生A1和B1同时被选中的概率为P(M)=312=14.6.伴随着科技的迅速发展,国民对“5G”一词越来越熟悉,“5G”全称是第五代移动电话行动通信标准,也称第五代移动通信技术.2017年12月10日,工信部正式对外公布,已向中国电倌、中国移动、中国联通发放了5G系统中低频率使用许可.2019年2月18日上海虹桥火车站正式启动5G网络建设.为了了解某市市民对“5G”的关注情况,通过问卷调查等方式研究市民对该市300万人口进行统计分析,数据分析结果显示:约60%的市民“掌握一定5G知识(即问卷调查分数在80分以上)”,将这部分市民称为“5G爱好者”.某机构在“5G爱好者”中随机抽取了年龄在15-45岁之间的100人按照年龄分布(如图所示),其分组区间为:[15,20),[20,25),[25,30),[30,35),[35,40),[40,45].(1)求频率分布直方图中的a的值;(2)估计全市居民中35岁以上的“5G爱好者”的人数;(3)若该市政府制定政策:按照年龄从小到大,选拔45%的“5G爱好者”进行5G的专业知识深度培养,按照上述政策及频率分布直方图,估计该市“5G爱好者”的年龄上限.1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有A.0个B.1个C.2个D.3个2.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是A.A县B.B县C.A县、B县两个地区相等D.无法确定3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82)、[82,84),[84,86)、[86,88)、[88,90)、[90,92)、[92,94)、[94,96],则样本的中位数在A.第3组B.第4组C.第5组D.第6组4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为61,则模糊不清的数字为A.1B.2C.3D.45.某人为了检测自己的解题速度,记录了5次解题所花的时间(单位:分)分别为,,55,60,50x y,已知这组数据的平均数为55,方差为525,则||x y=A.1分B.2分C.3分D.4分6.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的-=茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则x yA.3B.3-C.4D.4-7.在某次高中数学竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为,,,则,,的大小关系为A.<<B.<<C.<<D.<<8.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A.100,10B.100,20C.200,10D.200,209.某地区为了解小学生的身高发育情况,从某小学随机抽取100名同学,将他们的身高(单位:厘米)数a b ,由图中可知,身高落在[110,130)范围内的学生人数是据绘制成频率分布直方图(如图).若:7A.35B.24C.46D.6510.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格率(60分及以上为及格)、平均分分别为A.75%,71B.80%,85C.85%,90D.70%,6511.某赛季甲、乙两名篮球运动员每场比赛的得分如茎叶图所示,则下列结论错误的是A.乙运动员得分的中位数是36B .甲运动员发挥的稳定性比乙运动员发挥的稳定性差C .甲运动员的平均分为27分D .乙运动员的得分有613集中在茎3上12.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:总体均值为2,总体方差为3D .丁地:中位数为2,众数为313.一个样本a ,3,5,7的平均数是b ,且a ,b 分别是数列{}()2*2n n -∈N 的第2项和第4项,则这个样本的方差是A .3B .4C .5D .614.某网店在2019年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的35,则消费金额超过4千元的人数为A .12B .15C .16D .1815.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则A .270,75x s =<B .270,75x s =>C .270,75x s ><D .270,75x s ><16.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是A .4B .5C .8D .1017.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分18.某次知识竞赛中,五个参赛小队的初始积分都是50,在答题过程中,各小队每答对一题可使本队积分增加5,每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是4,7,6,2,5,则这五个小队积分的方差为.19.某市为了增加2020届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用2019年暑假组织部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出100名学生,统计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这100名学生中参加夏令营的天数在[6,10)的人数为.20.某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为________.21.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久的历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为_____________药物单位.22.为组织好第十一届全国少数民族传统体育运动会,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为______________;(2)这800名志愿者中年龄在[25,35)内的人数为______________.23.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从报名的所有人中按男女比例采用分层抽样的方式抽取了100名,统计了他们的笔试成绩(满分100分),统计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.分数区间频数频率[50,60)80.08[60,70)b[70,80)420.42[80,90)a0.26[90,100]8合计1001.00(1)求a与b的值,并作出频率分布直方图;(2)(i)根据表中数据,估计这100名人员笔试成绩的中位数(精确到小数点后1位);(ii)分析知,这100名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为概率,在总共2000名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.分数段[50,60)[60,70)[70,80)[80,90)[90,100]男女比例1∶13∶13∶47∶63∶524.随着科技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区100名高中生某一周使用手机的时间(单位:小时),所取样本数据分组区间为[0,2)、[2,4)、[4,6)、[6,8)、[8,10)、[10,12),由此得到如图所示的频率分布直方图.(1)求的值并估计该地区高中生一周使用手机时间的平均值;(2)从使用手机时间在[6,8)、[8,10)、[10,12)、[12,14]的四组学生中,用分层抽样方法抽取13人,则每层各应抽取多少人25.某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图因事故都受到不同程度的损坏,但可见部分如下,据此解答如下问题:(1)求分数在[50,60)的频率及全班人数;(2)求分数在[80,90)的频数,并计算频率分布直方图中[80,90)间的矩形的高;(3)若规定:90分(包含90分)以上为优秀,现从分数在80分(包含80分)以上的试卷中任取两份分析学生失分情况,求在抽取的试卷中至少有一份优秀的概率.26.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦·时),将数据按[0,1),[1,2),[2,3),[3,4),[4,5),[5,6),[6,7),[7,8),[8,9)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的值;(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦·时的人数及每户居民月均用电量的中位数;(3)政府计划对月均用电量在4百千瓦·时以下的用户进行奖励,月均用电量在[0,1)内的用户奖励20元/月,月均用电量在[1,2)内的用户奖励10元/月,月均用电量在[2,4)内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.27.某数学兴趣小组有男、女生各5名,以下茎叶图记录了该小组同学在一次数学测试中的成绩(单位:分).已知男生数据的中位数为125,女生数据的平均数为126.8.(1)求,x y的值;(2)现从成绩高于125分的同学中随机抽取两名同学,求抽取的两名同学恰好为一男一女的概率.28.已知经销某种商品的电商在任何一个销售季度内,每售出1吨该商品可获利润0.5万元,未售出的商品,每1吨亏损0.3万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了130吨该商品.现以x (单位:吨,100150x ≤≤)表示下一个销售季度的市场需求量,T (单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.(1)根据频率分布直方图,估计一个销售季度内市场需求量x 的平均数与中位数的大小;(2)根据频率分布直方图估计利润T 不少于57万元的概率.1.(2017新课标全国Ⅰ文科)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.(2017山东文科)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5B.5,5C.3,7D.5,73.(2017新课标全国Ⅲ文科)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳4.(2016新课标全国Ⅲ文科)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15o C,B点表示四月的平均最低气温约为5o C.下面叙述不正确的是A.各月的平均最低气温都在0o C以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20o C的月份有5个5.(2016山东文科)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25), [25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56B.60C.120D.1406.(2019年高考江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.7.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为▲.8.(2019年高考全国Ⅱ卷文数)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)748.602≈.9.(2019年高考全国Ⅲ卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).10.(2018新课标全国Ⅰ文科)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:。
2021学年新教材高中数学第六章统计6.4.1样本的数字特征课时分层作业含解析北师大版必修第一册

课时分层作业(三十八) 样本的数字特征(建议用时:40分钟)一、选择题1.下列选项中,能反映一组数据的离散程度的是()A.平均数B.中位数C.方差D.众数C[由方差的定义,知方差反映了一组数据的离散程度.]2.某商家统计了去年P,Q两种产品的月销售额(单位:万元),绘制了月销售额的雷达图,图中A点表示P产品2月份销售额约为20万元,B点表示Q产品9月份销售额约为25万元.根据图中信息,下面统计结论错误..的是()A.P产品的销售额极差较大B.P产品销售额的中位数较大C.Q产品的销售额平均值较大D.Q产品的销售额波动较小B[据图可以看出,P产品的销售额的波动较大,Q产品的销售额的波动较小,并且Q 产品的销售额只有两个月的销售额比25万元稍小,其余都在25万元至30万元之间,所以P 产品的销售额的极差较大,中位数较小,Q产品的销售的平均值较大,销售的波动较小,故选B.]3.对一组样本数据x i(i=1,2,…,n),如将它们改为x i-m(i=1,2,…,n),其中m≠0,则下面结论正确的是()A.平均数与方差都不变B.平均数与方差都变了C.平均数不变,方差变了D.平均数变了,方差不变D [若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b (a ≠0)的平均数为a x +b ,方差为a 2s 2,标准差为a 2s 2,故选D.]4.以下为甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 甲:9 12 x 24 27 乙:9 15 y 18 24已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .12, 15 B .15, 15 C .15, 18D .18, 18C [因为甲组数据的中位数为15,所以x =15,又乙组数据的平均数为16.8,所以9+15+y +18+245=16.8,y =18,选C.]5.王明同学随机抽查某市10个小区所得到的绿化率情况如下表所示:A .方差是13%B .众数是25%C .中位数是25%D .平均数是26.2%A [根据表格数据,众数为25%,选项B 正确; 中位数为25%,选项C 正确;平均数为20×2+25×4+30×3+3210=26.2,选项D 正确;方差为110[2(20-26.2)2+4(25-26.2)2+3(30-26.2)2+(32-26.2)2]=15.96;选项A 错误.故选A.] 二、填空题6.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:丙 [因为丙的平均数最大,方差最小,故应选丙.]7.从观测所得到的数据中取出m 个a ,n 个b ,p 个c 组成一个样本,那么这个样本的平均数是________.ma +nb +pcm +n +p [样本中个体数为m +n +p ,数据总和为ma +nb +pc ,故平均数为ma +nb +pcm +n +p.]8.五个数1,2,3,4,a 的平均数是3,则a =________,这五个数的标准差是________. 52 [由1+2+3+4+a5=3,得a =5;由s 2=15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2得,标准差s = 2.]三、解答题9.为调查甲、乙两校高三年级学生某次联考数学成绩情况,现用简单随机抽样从这两个学校高三年级学生中各抽取30名,以他们的数学成绩(百分制)作为样本,样本数据如下:甲:47 52 53 53 55 60 60 61 63 63 63 64 65 65 70 70 71 71 72 72 76 76 78 82 84 84 85 87 90 92 乙:45 53 53 58 60 60 60 61 61 62 62 63 63 65 70 70 72 72 72 73 73 76 76 79 81 81 85 85 88 90(1)若甲校高三年级每位学生被抽到的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.[解] (1)设甲校高三年级总人数为n ,则30n =0.05,解得:n =600,又样本中甲校高三年级这次联考数学成绩的不及格人数为5, ∴估计甲校高三年级这次联考数学成绩的及格率为:1-530=56.(2)用样本估计总体,甲、乙两校高三年级学生这次联考数学平均成绩分别为x -1,x -2,由题中数据可知:30x 1=47+52+53+···+87+90+92=2084; 30x 2=45+53+53+···+85+88+90=2069;∴x1-x2=2084-206930=1530=0.5,∴估计x1-x2的值为0.5.10.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5.5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.11.若样本1+x1,1+x2,1+x3,…,1+x n的平均数是10,方差为2,则对于样本2+x1,2+x2,…,2+x n,下列结论正确的是()A.平均数是10,方差为2B.平均数是11,方差为3C.平均数是11,方差为2D.平均数是10,方差为3C[若x1,x2,…,x n的平均数为x,方差为s,那么x1+a,x2+a,…,x n+a的平均数为x+a,方差为s.]12.为了普及环保知识,增强保护环境意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m 0<x <m eC .m e <m 0<xD .m 0<m e <xD [由题图知30名学生的得分情况依次为2个人得3分,3个人得4分、10个人得5分、6个人得6分、3个人得7分,2个人得8分、2个人得9分、2个人得10分,中位数为第15,16个数的平均数,即m e =5+62=5.5,5出现次数最多,故m 0=5,x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.于是m 0<m e <x .]13.已知样本9,10,11,x ,y 的平均数是10,方差是4,则xy =________. 91 [由题意得⎩⎪⎨⎪⎧9+10+11+x +y =5×10,15[(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2]=4,即⎩⎪⎨⎪⎧x +y =20,(x -10)2+(y -10)2=18.解得⎩⎪⎨⎪⎧x =7,y =13或⎩⎪⎨⎪⎧x =13,y =7,所以xy =91.]14.由正整数组成的一组数据x 1,x 2,x 3,x 4(x 1≤x 2≤x 3≤x 4),其平均数和中位数都是2,且标准差等于1,则这组数据为________(从小到大排列).1,1,3,3 [不妨设x 1≤x 2≤x 3≤x 4且x 1,x 2,x 3,x 4为正整数. 由条件知⎩⎪⎨⎪⎧x 1+x 2+x 3+x44=2,x 2+x 32=2,即⎩⎪⎨⎪⎧x 1+x 2+x 3+x 4=8,x 2+x 3=4,又x 1,x 2,x 3,x 4为正整数,∴x 1=x 2=x 3=x 4=2或x 1=1,x 2=x 3=2,x 4=3或x 1=x 2=1,x 3=x 4=3. ∵s =14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2]=1, ∴x 1=x 2=1,x 3=x 4=3.由此可得4个数分别为1,1,3,3.]15.高一(3)班有男同学27名、女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.(1)求这次测验的全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的同学至少有多少人? (3)男同学的平均分与中位数相差较大说明了什么?[解] (1)这次测验全班平均分x =148(82×27+80×21)≈81.13(分).(2)因为男同学的中位数是75, 所以至少有14人得分不超过75分. 又因为女同学的中位数是80分, 所以至少有11人得分不超过80分. 所以全班至少有25人得分低于80分.(3)男同学的平均分与中位数的差别较大,说明男同学的得分两极分化现象严重,得分高的和得分低的相差较大.。
用样本估计总体-【新教材精析】高一数学上学期同步教学精品课件

导入课题 新知探究 典例剖析 课堂小结
教材P161例题
例1 下表是某两名篮球运动员在中国男子篮球职业联赛(CBA)某个赛季
的得分情况统计.
解: 由表得,两名运动员的参赛场次相同,甲、乙的二分球命中总
个数(频数)分别为213和160,甲比乙多,但甲、乙的二分球命
中率(频率)分别为51%、52%,甲比乙低;因此可认为乙的二
进行分组,并计算出每组数据在整个数据中占的百分比——频率,结果
如下表(频率分布表)所示,根据频率分布表,制作出频率分布直方图
如图所示:
导入课题 新知探究 典例剖析 课堂小结
二、频率分布直方图
频率分布直方图的好处:
①能更清楚直观地显示各组频率分布情况及各组频率之间的差别;
②当考虑数据落在若干个组内的频率之和时,可以用相应矩形面积之和
请你估计在1665年—1666年,英国男性头盖骨宽度的分布情况.
此例是一个完整的统计活动:
①收集数据(题目已经通过抽样调查的方式将数据收集好).
②整理数据:
1,将数据按顺序排序,计算极差=最大值-最小值=158-121=37mm;
2,确定组距与组数,
当数据在120个以内时,一般按照数据的多少分成5~12组,
横轴上的每个小区间对应一个组的组距,作为小矩形的底边;
纵轴表示频率与组距的比值,并用它作小矩形的高,
频率
小矩形的面积=组距×
=频率,此时,所有小矩形的面积之和等于1,
组距
我们把这样的图称为频率分布直方图.
例如:为了解本市居民的生活成本,同学甲利用假期对所在的社区进行
“家庭教”和“家庭每月日常消费额”的调查,他把调查得到的消费额按大小
④对总体进行估计
《用样本估计总体》 讲义

《用样本估计总体》讲义在我们的日常生活和各种研究领域中,经常会遇到需要从部分数据来推断整体情况的问题。
这时候,“用样本估计总体”的方法就派上了用场。
那什么是用样本估计总体呢?简单来说,就是通过对从总体中抽取的一部分样本进行观察、测量和分析,来推测总体的特征和规律。
为什么我们要用样本去估计总体呢?这主要是因为在很多情况下,要对整个总体进行研究是不现实或者成本太高的。
比如说,要了解一个城市所有居民的收入情况,如果对每个人都进行调查,那需要耗费大量的时间、人力和物力。
而通过抽取一部分具有代表性的居民作为样本,对他们的收入进行调查和分析,就可以相对准确地估计出整个城市居民的收入水平。
那么,如何抽取一个有代表性的样本呢?这可是个关键问题。
抽样的方法有很多种,常见的有简单随机抽样、分层抽样和系统抽样。
简单随机抽样是最基本的抽样方法。
就好像从一个装满球的箱子里,不看地随便摸出几个球。
在实际操作中,可以通过抽签、随机数表等方式来实现。
这种抽样方法的优点是每个个体被抽到的机会均等,能够较好地保证样本的随机性和代表性。
分层抽样则是先将总体按照某些特征分成不同的层次,然后从每个层次中分别进行简单随机抽样。
比如说要调查一个学校学生的视力情况,可以先按照年级分层,然后从每个年级中随机抽取一定数量的学生。
这样做可以使样本更具针对性,能够更好地反映不同层次的情况。
系统抽样是将总体中的个体按照一定的顺序编号,然后按照固定的间隔抽取样本。
比如从 1000 个学生中抽取 50 个样本,可以先将学生编号 1 到 1000,然后每隔 20 个抽取一个。
在抽取了合适的样本之后,我们就可以通过对样本数据的分析来估计总体的特征了。
比如说,我们可以计算样本的均值、中位数、众数等来估计总体的集中趋势;通过计算样本的方差、标准差等来估计总体的离散程度。
样本均值是样本数据的算术平均值,它反映了样本数据的平均水平。
假设我们抽取了一个样本,数据分别为 x1,x2,,xn,那么样本均值就为(x1 + x2 ++ xn) / n 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§4 用样本估计总体的数字特征4.1 样本的数字特征 4.2 分层随机抽样的均值与方差 4.3 百分位数A级必备知识基础练1.(2022湖北黄冈期末)晓霞在学校的“经典诗词朗诵”大赛中,5位评委给她的分数分别是:93,93,95,96,92,则晓霞得分的中位数与平均数分别是()A.93;93B.93;93.8C.93.5;93.5D.94;93.82.某射手在一次训练中五次射击的成绩分别为9.4,9.4,9.4,9.6,9.7,则该射手成绩的方差是()A.0.127B.0.016C.0.08D.0.2163.某商场一天中售出某品牌运动鞋13双,其中各种尺码鞋的销量如下表所示,则这13双鞋的尺码组成的一组数据中,众数和中位数分别为()A.25 cm,25 cmB.24.5 cm,25 cmC.26 cm,25 cmD.25 cm,24.5 cm4.一组数据中的每一个数据都减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是()A.81.2,4.4B.78.8,4.4C.81.2,84.4D.78.8,75.65.(多选题)某校举行篮球比赛,两队长小明和小张在总共6场比赛中得分情况如下表:场次 1 2 3 4 5 6则下列说法正确的是()A.小明得分的极差小于小张得分的极差B.小明得分的中位数小于小张得分的中位数C.小明得分的平均数大于小张得分的平均数D.小明的成绩比小张的稳定6.数据18,26,27,28,30,32,34,40的75%分位数为.7.若一组数据x1,x2,…,x n的方差为9,则数据3x1,3x2,…,3x n的方差为,标准差为.8.某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.(1)求出表格中a,b,c,d的值;(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些?B级关键能力提升练9.期中考试后,班长算出了全班40人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N,那么MN=()A.4041B.1 C.4140D.210.某人5次上班途中所花的时间(单位:分)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为()A.1B.2C.3D.411.(多选题)气象意义上从春季进入夏季的标志为:“连续5天每天日平均温度不低于22 ℃”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据都是正整数,单位:℃)满足以下条件:甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据中有1个是32,平均数是26,方差是10.2.则下列说法正确的是()A.进入夏季的地区至少有2个B.丙地区肯定进入了夏季C.乙地区肯定进入了夏季D.不能肯定甲地区进入夏季12.高三(1)班4名体育生的测试成绩分别为82,81,79,78,高三(2)班6名体育生的测试成绩分别为70,76,77,74,78,75,则这10名体育生的平均分与方差分别为、.13.某城市在进行创建文明城市的活动中,为了解居民对“创文”的满意程度,组织居民给活动打分(分数为整数且满分为100分).从中随机抽取一个容量为120的样本,发现所有数据均在区间[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图如图所示,但不小心污损了部分图形.观察图形,回答下列问题:(1)算出第三组[60,70)的频数,并补全频率分布直方图;(2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表)14.某校在统计一班级50名学生的数学考试成绩时,将两名学生的成绩统计错了,一个将115分统计为95分,1个将65分统计为85分,若根据统计的数据得出平均分为90分,标准差为5分,则该50名学生实际成绩的平均分及标准差分别为多少?C级学科素养创新练15.(2022云南丽江期末)一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:千克)结果如下:56,52,55,52,57,59,54,53,55,51,56,56,58,56,52,58,56,55,51,58.(1)请计算该水果店过去20天苹果日销售量的中位数、平均数、极差和标准差.(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能70%地满足顾客需求(在100天中,大约有70天可以满足顾客的需求),请问每天应该进多少千克苹果?4.1 样本的数字特征 4.2 分层随机抽样的均值与方差 4.3 百分位数1.B2.B ∵x =15×(9.4+9.4+9.4+9.6+9.7)=9.5,∴s 2=15×[(9.4-9.5)2+(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.7-9.5)2]=0.016.3.A 易知众数为25cm .因为共有13个数据,所以中位数应为第7个数据,而尺码为23.5cm 到24.5cm 的共有5个数据,且尺码为25cm 的有5个数据,因此第7个数据一定是25cm,即中位数为25cm .4.A 原数据的平均数应为1.2+80=81.2,原数据的方差与新数据的方差相同,即为4.4.5.BD 小明得分的极差为33-8=25,小张得分的极差为34-9=25,故A 错误;小明得分的中位数为17+232=20,小张得分的中位数为20+222=21,故B 正确;小明得分的平均数为30+15+23+33+17+86=21,小张得分的平均数为22+20+31+10+34+96=21,故C 错误;小明和小张平均分相等,但小明分数相对集中,更稳定,故D 正确.6.33 该组数据一共有8个,8×75%=6,故该数据的75%分位数第6,7个数的平均数,即32+342=33.7.81 9 数据3x 1,3x 2,…,3x n 的方差为32×9=81,标准差为√81=9. 8.解(1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86; 高二年级的成绩为85,97,85,87,85,88,77,87,78,88.由此可知高一年级成绩的众数是a=80,平均数b=85+110×(-5+2+4-5+3+14-5-8+6+1)=85.7;高二年级成绩的众数是c=85,极差是d=20.(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.9.B 平均数是用所有数据的和除以数据的总个数而得到的.设40位同学的成绩为x i (i=1,2,…,40),则M=x 1+x 2+…+x 4040,N=x 1+x 2+…+x 40+M41=M ,故MN =1.10.D 依题意,得15(x+y+10+11+9)=10,即x+y=20.①又15[(x-10)2+(y-10)2+0+(11-10)2+(9-10)2]=2,所以(x-10)2+(y-10)2=8. ②由①②解得{x =12,y =8或{x =8,y =12,所以|x-y|=4.11.AB甲地:5个数据由小到大排,则22,22,24,a,b,其中24<a<b,满足进入夏季的标志;乙地:将5个数据由小到大排,则a,b,27,c,d,其中a≤b≤27≤c≤d,则27+c+d≥81,而a+b+27+c+d=5×24=120,故a+b≤39,其中至少有一个小于22,故不满足一定进入夏季的标志;丙地:设5个数据为a,b,c,d,32,且a,b,c,d∈Z,由方差公式可知:(a-26)2+(b-26)2+(c-26)2+(d-26)2+(32-26)2=10.2×5=51,则(a-26)2+(b-26)2+(c-26)2+(d-26)2=15=9+4+1+1,不妨设|a-26|=3,|b-26|=2,|c-26|=|d-26|=1,则a,b,c,d均大于22,满足进入夏季标准.综上,故选AB.12.7738572由题意知x1=82+81+79+784=80,x2=16×(70+76+77+74+78+75)=75,∴这10名体育生的平均成绩为x=410×80+610×75=77.∵s12=14[(82-80)2+(81-80)2+(79-80)2+(78-80)2]=52,s22=16[(70-75)2+(76-75)2+(77-75)2+(74-75)2+(78-75)2+(75-75)2]=203,∴这10名体育生的方差为s2=1452+(80-77)2+16×203+(75-77)2=38572.13.解(1)因为各组的频率之和等于1,所以分数在[60,70)内的频率1-10×(0.005+0.015+0.030+0.025+0.010)=0.15,所以第三组[60,70)的频数为120×0.15=18.完整的频率分布直方图如图.(2)因为众数的估计值是频率分布直方图中最高矩形的中点,从图中可看出众数的估计值为75.由题得左边第一个矩形的面积为0.05,第二个矩形的面积为0.15,第三个矩形的面积为0.15,第四个矩形的面积为0.3,所以中位数在第四个矩形里面,设中位数为x,则0.05+0.15+0.15+(x-70)×0.03=0.5,所以x=75.所以中位数为75.又根据频率分布直方图,样本的平均数的估计值为45×(10×0.005)+55×(10×0.015)+65×(10×0.015)+75×(10×0.03)+85×(10×0.025)+95×(10×0.01)=73.5. 所以样本的众数为75分,中位数为75分,平均数为73.5分.14.解设没统计错的数据为x 1,x 2,…,x 48,统计错的两个成绩为x 49=95,x 50=85,实际成绩为x 1,x 2,…,x 48,t 49=115,t 50=65,则150(x 1+x 2+…+x 48+95+85)=90,所以150(x 1+x 2+…+x 48)=90-185,所以x =150(x 1+x 2+…+x 48+t 49+t 50)=150(x 1+x 2+…+x 48)+150×(115+65)=90-185+185=90.由s 12=150[(x 1-90)2+…+(x 48-90)2+(95-90)2+(85-90)2],s 22=150[(x 1-90)2+…+(x 48-90)2+(115-90)2+(65-90)2],得s 22−s 12=150×(252+252-52-52)=150×1200=24,所以s 22=s 12+24=52+24=49,所以s 2=7,即该50名学生实际成绩的平均分为90分,标准差为7分. 15.解(1)把这组数据从小到大排列为:51,51,52,52,52,53,54,55,55,55,56,56,56,56,56,57,58,58,58,59. 所以中位数是12×(55+56)=55.5,平均数是120×(51+51+52+52+52+53+54+55+55+55+56+56+56+56+56+57+58+58+58+59)=55,极差是59-51=8,方差为120×[(51-55)2+(51-55)2+(52-55)2+(52-55)2+(52-55)2+(53-55)2+(54-55)2+(55-55)2+(55-55)2+(55-55)2+(56-55)2+(56-55)2+(56-55)2+(56-55)2+(56-55)2+(57-55)2+(58-55)2+(58-55)2+(58-55)2+(59-55)2]=5.8, 标准差为√5.8=√1455. (2)因为20×70%=14,所以样本数据的70%百分位数是第14,15项数据的平均值, 即12×(56+56)=56,据此估计每天应进56千克苹果.。