高考文数直方图中位数 众数 平均数的计算
求众数、中位数、平均数

2.2.2 用样本的数字特征估计总体的数字特征第一课时 求众数、中位数、平均数【学习目标】1、会求样本的众数、中位数、平均数、; 3、会用样本的数字特征对总体进行估计; 4、会用相关知识解决简单实际问题。
【重难点】重点:求众数、中位数、平均数 难点:知识的简单应用【学习过程】 复习一、众数、中位数、平均数的概念 1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.3、 平均数: 一般地,如果n 个数12,,,n x x x ,那么()121n x x x x n=+++叫做这n 个数的平均数。
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛. 练习1、求下列各组数据的众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数为:(2)、1 ,2,3,3,3,5,5,8,8,9,9 众数为:练习2、求下列各组数据的中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数为:(2)、1 ,2,3,3,3,4,8,8,8,9,9 中位数为: 【新课讲解】知识点一、众数、中位数、平均数与频率分布直方图的关系1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
2、平均数等于频率分布图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
人员 经理 管理人员 高级技工 工人 学徒 合计 周工资 2200 250 220 200 100 人数 1 6 5 10 1 23 合计22001500110020001006900指出这个问题中周工资的众数、中位数、平均数。
练习1:(新课程导学P27例2)某小区广场上有甲、乙两组市民正在进行晨练,两组市民的年龄如下(单位:岁):甲组:13,13,14,15,15,15,15,16,17,17;乙组:54,3,4,4,5,5,6,6,6,57。
数据统计中的均值中位数与众数计算

数据统计中的均值中位数与众数计算数据统计中的均值、中位数与众数计算数据统计是一种重要的方法,通过分析数据可以得到一些有用的信息和结论。
在数据统计中,常常会用到均值、中位数和众数这三个指标,它们是计算数据集中趋势的常见方法。
本文将介绍均值、中位数和众数的计算方法,以及它们在数据分析中的应用。
一、均值的计算方法均值,也称为平均值,是用于表示数据集中的典型值的指标。
要计算数据集的均值,需要将所有数据的值加起来,然后再除以数据的个数。
数学公式如下:均值 = (数据1 + 数据2 + … + 数据n)/ n例如,对于数据集{3, 4, 6, 8, 10},我们可以计算出均值为(3 + 4 + 6 + 8 + 10)/ 5 = 6.2。
均值的计算可以帮助我们了解数据集中的总体趋势,并且对于部分数据的异常值也比较敏感。
因此,在进行均值计算时,需要注意数据的分布情况,并对异常值进行适当的处理。
二、中位数的计算方法中位数是将一组数据按照大小顺序排列后,位于中间位置的数值。
当数据集中的个数为奇数时,中位数为排序后的中间值;当数据集中的个数为偶数时,中位数为排序后中间两个数的平均值。
例如,对于数据集{2, 3, 4, 6, 9},中位数为4。
如果数据集为{1, 2, 3, 4, 5, 6},中位数为(3 + 4)/ 2 = 3.5。
中位数的计算方法相对简单,能够消除数据中的极端值的影响,更能反映出数据的典型情况。
它适用于不太规律的数据集,例如存在离散值或者异常值的情况。
三、众数的计算方法众数是数据集中出现频率最高的数值。
当数据集存在多个众数时,可以称之为多峰分布,如果数据集中没有出现重复值,则不存在众数。
例如,对于数据集{2, 2, 3, 4, 5, 5, 5, 6},众数为5。
如果数据集为{1, 2, 3, 4, 5, 6},则不存在众数。
众数的计算方法主要是通过对数据的频率进行统计,找到出现次数最多的数值。
众数的计算适用于描述数据集中的典型情况,特别是在分类数据或者离散数据的分析中。
_众数,中位数,平均数与频率分布直方图

谢谢观看! 2020
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
三 三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.如上例中众数是 2.25t,它告诉我们,月均用水量为2.25t的 居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少.
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(Байду номын сангаас高的矩形的中点)
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中
位数、平均数 (2)这个问题中,工资的平均数能客观
地反映该厂的工资水平吗?为什么?
分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列 出的数据可见,只有经理在平均数以 上,其余的人都在平均数以下,故用 平均数不能客观真实地反映该工厂的 工资水平。
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。 给出.下图显示了居民月均用水量的平 均数: x=2.02
频率分布直方图如下:
频率 组距
平均数
0.50
0.40
0.30
用直方图算平均数,中位数、众数、标准差

思考
如何从频率分布直方图中估计众数、 中位数、平均数呢? 众数:最高矩形的中点的横坐标 2.25
中位数:左右两边直方 2.02 图的面积相等. 平均数:频率分布直方 图中每个小矩形的面 积乘以小矩形底边中 点的横坐标之和. 2.02
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
17
例1:画出下列四组样本数据的直方图,说 明它们的异同点.
(1)
(2)
(3)
(4)
例2:甲乙两人同时生产内径为25.40mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm ) 甲
X甲≈25.401 s甲≈0.037
乙
X乙≈25.406 S乙≈0.068
平均数向我们提供了样本数据的重要信 息,但是,有时它也会影响我们,使我们对 总体作出片面判断。平均数反映数据的集中 趋势,但是,只有平均数还难以概况样本数 据的实际状态。当样本的平均数相等或相差 无几时,就要用样本数据的离散程度来估计 总体的数字特征。这时,我们引进了一个概 念:标准差!
12
标准差
众数在一组数据中出现次数最多的数据叫做这一组数据的众数中位数将一组数据按大小依次排列把处在最中间位置的一个数据或两个数据的平均数叫做这组数据的中位数如何从频率分布直方图中估计众数中位数平均数呢
1
问题
在一次射击比赛中,甲、乙两名运动员各射击
10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥
a.用样本平均数估计总体平均数。
b.用样本标准差估计总体标准差。样本容量越大, 估计就越精确。 2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。
利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解

高考数学微专题突破利用频率分布直方图求中位数、平均数、总数一、单选题1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[]80,150内现将这100名学生的成绩按照[)8090,,[)90100,,[)100110,,[)110120,,[)120130,,[)130140,,[]140150,分组后,得到的频率分布直方图如图所示,则下列说法正确的是()A .频率分布直方图中a 的值为0.040B .样本数据低于130分的频率为0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[)90100,的频数一定与总体分布在[)100110,的频数相等2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为()A .40B .50C .80D .1003.某地工商局对辖区内100家饭店进行卫生检查并评分,分为甲、乙、丙、丁四个等级,其中分数在[)60,70,[)70,80,[)80,90,[]90,100内的等级分别为:丁、丙、乙、甲,对饭店评分后,得到频率分布折线图,如图所示,估计这些饭店得分的平均数是()A .80.5B .80.6C .80.7D .80.84.下面是甲、乙两位同学高三上学期的5次联考数学成绩,现在只知其从第1次到第5次分数所在区间段分布的条形图(从左至右依次为第1至第5次),则从图中可以读出一定正确的信息是()A .甲同学的成绩的平均数大于乙同学的成绩的平均数B .甲同学的成绩的方差大于乙同学的成绩的方差C .甲同学的成绩的极差小于乙同学的成绩的极差D.甲同学的成绩的中位数小于乙同学的成绩的中位数5.下面是追踪调查200个某种电子元件寿命(单位:h)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:⨯+⨯+⨯+⨯+⨯1500.12500.153500.454500.155500.15④寿命超过400h的频率为0.3A.①B.②C.③D.④6.为了解某电子产品的使用寿命,从中随机抽取了100件产品进行测试,得到图示统计图.依据统计图,估计这100件产品使用寿命的中位数为()A.218.25B.232.5C.231.25D.241.25 7.为了让学生了解社会,拓宽视野,丰富知识,提高社会实践能力和综合素质,哈三中团委组织学生参加了抽测一批棉花的纤维长度(单位:cm)的社会实践活动.利用所学习的数学知识,同学们作出了样本的频率分布直方图.现在,由于原始数据不全,只能通过直方图来估计这一批棉花的纤维长度的平均值(同一组数据用这组数据所在区间的中点的值代替).则估计的平均值为()A.21.75B.22.25C.23.75D.20.75 8.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人9.某地气象局把当地某月(共30天)每一天的最低气温作了统计,并绘制了如下图所示的统计图.记这组数据的众数为M,中位数为N,平均数为P,则()A .M N P <<B .N M P <<C .P M N <=D .P N M<<10.在某次高中学科竞赛中,4000名考生的参赛成绩按[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[)90,100分成六组,其频率分布直方图如图所示,则下列说法中错误的是().A .成绩在[)70,80内的考生人数最多B .不及格(60分以下)的考生人数约为1000人C .考生竞赛成绩平均分的估计值为70.5分D .考生竞赛成绩中位数的估计值为75分11.在2019年某省普通高中学业水平考试(合格考)中,对全省所有考生的物成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[)40,50,[)50,60,[)60,70,[)80,90,[]90,100,90分以上为优秀,则下列说法中不正确的是()A .从全体考生中随机抽取1000人,则其中得优秀考试约有100人B .若要全省的合格考通过率达到96%,则合格分数线约为44分C .若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为70D .该省考生物理成绩的中位数为75分第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题12.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.则估计高一参赛学生的成绩的众数、中位数分别为____________.13.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g )绘制的频率分布直方图,样本数据分为8组,分别为[)80,82,[)82,84,[)84,86,[)86,88,[)88,90,[)90,92,[)92,94,[]94,96,则样本的中位数在第______组14.某中学举行了一场音乐知识竞赛,将参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图.根据频率分布直方图,同一组数据用该区间的中点值代替,估计这次竞赛的平均成绩为______分.三、双空题15.根据高二某班50名同学的数学成绩,绘制频率分布直方图如图所示,虽不小心将其中一个数据污染了,但依然可以推断这个被污染的数据为_________,该班同学的成绩众数为_________.16.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则这400名学生视力的众数为________,中位数为________.四、解答题17.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的61.0010-⨯的鱼被人食用后,就会对人体产生危害.某海鲜市场进口了一批这种鱼,质监部门对这种鱼进行抽样检测,在30条鱼的样本中发现的汞含量(乘以百万分之一)如下:0.070.340.950.98 1.020.98 1.37 1.400.39 1.021.44 1.580.54 1.080.710.70 1.20 1.24 1.62 1.681.85 1.300.810.820.84 1.39 1.262.200.91 1.31(1)完成下面频率分布表,并画出频率分布直方图;频率分布表:分组频数频率[)0,0.50[) 0.50,1.001 3[) 1.00,1.50[) 1.50,2.002 15[)2.00,2.5011 30合计301频率分布直方图:(2)根据频率分布直方图估算样本数据的平均值(保留小数点后两位,同一组中的数据用该组区间中点值代表),并根据频率分布直方图描述这批鱼身体中汞含量的分布规律.18.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取5人,再从这5人中抽取2人做进一步调查,求抽到的2人中恰有1人为运动达人的概率.19.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取10人,再从这10人中抽取3人做进一步调查,设抽到的人中运动达人的人数为X ,求随机变量X 的分布列及期望.20.某贫困地区经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如图频率分布直方图:(1)根据频率分布直方图,估计这50位农民的平均年收入x (单位:千元,同一组数据用该组数据区间的中点值表示);(2)为推进精准扶贫,某企业开设电商平台,让越来越多的农村偏远地区的农户通过经营网络商城脱贫致富.甲计划在A 店,乙计划在B 店同时参加一个订单“秒杀”抢购活动,其中每个订单由()*2,n n n N ≥∈个商品W 构成,假定甲、乙两人在A 、B 两店订单“秒杀”成功的概率分别为p 、q ,记甲、乙两人抢购成功的订单总数量、商品W 总数量分别为X 、Y .①求X 的分布列及数学期望()E X ;②若27sin4n p n n ππ=-,sin4n q nπ=,求当Y 的数学期望()E Y 取最大值时正整数n 的值.21.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工,下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据估计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业,调查显示年收入在35千元(含35千元)以上的人中有60%的人愿意返乡投资创业,年收入在35千元以下的人中有40%的人愿意返乡投资创业,请从样本数据中完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“是否愿意返乡投资创业和年收入有关”.35千元(含35千元)以上35千元以下愿意返乡投资创业不愿意返乡投资创业附:()()()()()22n ad bc X a b c d a c b d -=++++,()20P X k ≥0.100.050.0250.0100k 2.7063.8415.0246.63522.某市为大力推进生态文明建设,把生态文明建设融入市政建设,打造了大型植物园旅游景区.为了了解游客对景区的满意度,市旅游部门随机对景区的100名游客进行问卷调查(满分100分),这100名游客的评分分别落在区间[)50,60,[)60,70,[)70,80,[)80,90,[]90,100内,且游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示.(1)求这100名游客评分的平均值(同一区间的数据用该区间数据的中点值为代表);(2)视频率为概率,规定评分不低于80分为满意,低于80分为不满意,记游客不满意的概率为p .(ⅰ)若从游客中随机抽取m 人,记这m 人对景区都不满意的概率为m a ,求数列{}m a 的前4项和;(ⅱ)为了提高游客的满意度,市旅游部门对景区设施进行了改进,游客人数明显增多,对游客进行了继续旅游的意愿调查,若不再去旅游记1分,继续去旅游记2分,每位游客有继续旅游意愿的概率均为p ,且这次调查得分恰为n 分的概率为n B ,求4B .23.2016年春节期间全国流行在微信群里发、抢红包,现假设某人将688元发成手气红包50个,产生的手气红包频数分布表如下:金额分组[)1,5[)5,9[)9,13[)13,17[)17,21[)21,25频数39171182(1)求产生的手气红包的金额不小于9元的频率;(2)估计手气红包金额的平均数(同一组中的数据用该组区间的中点值作代表);(3)在这50个红包组成的样本中,将频率视为概率.①若红包金额在区间[]21,25内为最佳运气手,求抢得红包的某人恰好是最佳运气手的概率;②随机抽取手气红包金额在[)[]1,521,25⋃内的两名幸运者,设其手气金额分别为m ,n ,求事件“16m n ->”的概率.24.绿色已成为当今世界主题,绿色动力已成为时代的驱动力,绿色能源是未来新能源行业的主导.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值x (同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X 近似地服从正态分布()2,N μσ,经计算第(1)问中样本标准差s 的近似值为50.用样本平均数x作为μ的近似值,用样本标准差s 作为σ的估计值;(ⅰ)现从该汽车公司最新研发的新能源汽车中任取一辆汽车,求它的单次最大续航里程恰好在200千米到350千米之间的概率;(ⅱ)从该汽车公司最新研发的新能源汽车中随机抽取10辆,设这10辆汽车中单次最大续航里程恰好在200千米到350千米之间的数量为Y ,求()E Y ;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、…、第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k 到1k +),若掷出反面,遥控车向前移动两格(从k 到2k +),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n 格的概率为(1,2,,50)n P n = ,其中01P =,试说明{}1n n P P --是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量ξ服从正态分布()2,N μσ,则()0.6827P μσξμσ-<+≈ ,(22)0.9545P μσξμσ-<+≈ ,(33)0.9973P μσξμσ-<+≈ .25.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)假设该镇外出务工人员年收入服从正态分布()2,N μσ,其分布密度函数为22()2()x f x μσ--=,其中μ为样本平均值.若()f x 的最大值为10π,求σ的值;(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在[],2μσμσ++和[]2,3μσμσ++的人群愿意返乡创业的人数比例分别为15%和20%.从样本人群收入在[],3μσμσ++的人中随机抽取3人进行调查,设X 为愿意返乡创业的人数,求随机变量X 的分布列和数学期望.参考答案1.C 【分析】对于A :由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a 的值,进而作出判断;对于B :先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C :先计算[)80,120的频率和[)120130,的频率,再求出总体的中位数,进而作出判断;对于D :根据样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等作出判断即可.【详解】由频率分布直方图得:()0.0050.0100.0100.0150.0250.005101a ++++++⨯=,解得0.030a =,故A 错误;样本数据低于130分的频率为:()10.0250.005100.7-⨯+=,故B 错误;[)80,120的频率为:()0.0050.0100.0100.015100.4+++⨯=,[)120130,的频率为:0.030100.3⨯=,∴总体的中位数(保留1位小数)估计为:0.50.412010123.30.3-+⨯≈分,故C 正确;样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等,故D 错误.故选:C .【点睛】本题考查频率分布直方图的应用,考查逻辑思维能力和计算能力,属于基础题.2.B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解.由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =.故选:B .【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A 【分析】根据频率分布折线图计算该组数据的平均数为650.15750.4850.2950.25⨯+⨯+⨯+⨯.【详解】由折线图可知,该组数据的平均数为650.15750.4850.2950.2580.5⨯+⨯+⨯+⨯=.故选:A.【点睛】此题考查根据频率分布折线图求平均数,关键在于熟练掌握平均数的求解公式.4.D 【分析】根据频数分布表中的数据,对选项中的命题进行分析,判断正误,即可得到本题答案.【详解】甲同学的成绩的平均数1051201201301401235x ++++<=,乙同学的成绩的平均数1051151251351451255y ++++>=,所以A 错误;甲同学的成绩从第1次到第5次变化波动比乙同学的成绩的变化波动更小一些,所以甲同学的成绩的方差小于乙同学的成绩的方差,所以B 错误;甲同学的成绩的极差介于()30,40之间,乙同学的成绩的极差介于()35,45之间,所以甲同学的成绩的极差不一定小于乙同学的成绩的极差,所以C 错误;甲同学的成绩的中位数介于()115,120之间,乙同学的成绩的中位数介于()125,130之间,所以D 正确.故选:D本题主要考查频数直方图的相关问题,其中涉及中位数、平均数、方差、极差的求解. 5.B【详解】若①正确,则300400-对应的频率为0.45,则400500-对应的频率为0.15,则②错误;电子元件的平均寿命为1500.12500.153500.454500.155500.15⨯+⨯+⨯+⨯+⨯,则③正确;寿命超过400h的频率为0.150.150.3+=,则④正确,故不符合题意;若②正确,则300400-对应的频率为0.4,则①错误;电子元件的平均寿命为1500.12500.153500.44500.25500.15⨯+⨯+⨯+⨯+⨯,则③错误;寿命超过400h的频率为0.20.150.35+=,则④错误,故符合题意.故选:B.6.C【分析】设中位数为x,根据中位数左边的频数为50列等式可求得x的值.【详解】设中位数为x,前2组的频数之和为25,前3组的频数之和为65,由题意可得20025405050x-+⨯=,解得231.25x=.故选:C.7.A【分析】利用频率分布直方图计算平均数的方法求解即可.【详解】所给数据频率之和为(0.010.070.080.020.02)51++++⨯=则估计的平均值为5(12.50.0117.50.0722.50.0827.50.0232.50.02) 4.35521.75⨯+⨯+⨯+⨯+⨯=⨯=故选:A8.D 【分析】根据样本估计总体的知识依次判断各个选项即可得到结果.【详解】对于A ,设中位数为x ,则()()0.020.065250.080.5x +⨯+-⨯=,解得:26.25x =,即该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次,A 正确;对于B ,根据频率分布直方图知众数为:253027.52+=次,B 正确;对于C ,该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有16000.045320⨯⨯=人,C 正确;对于D ,该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有16000.025160⨯⨯=人,D 错误.故选:D.9.A 【分析】由统计图分别求出该月温度的中位数,众数,平均数,由此能求出结果.【详解】解:由统计图得:该月温度的中位数为565.52N +==,众数为5M =,平均数为1(233410566372829210) 5.9730P =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯≈.∴M N P <<.故选:A .10.D 【分析】A .根据频率分布直方图中哪一组数据的频率除以组距的值最大进行分析;B .先分析60分以下对应的频率,再利用总体数量乘以所求频率即可得到结果;C .利用每组数据的组中值乘以对应频率并将每组计算结果相加即可得到结果;D .分析频率为0.5时对应的横坐标的值即为中位数.【详解】A .根据统计图可知:[)70,80对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B .不及格的频率为:()0.0100.015100.25+⨯=,所以不及格的人数约为40000.25=1000⨯人,故正确;C .根据频率分布直方图可知平均数为:()450.01550.015650.02750.03850.015950.011070.5⨯+⨯+⨯+⨯+⨯+⨯⨯=,故正确;D .前三组的频率之和为:()0.01+0.0150.02100.450.5+⨯=<,前四组的频率之和为:()0.01+0.0150.020.03100.750.5++⨯=>,所以中位数在第四组数据中,且中位数为:0.50.45701071.70.0310-+⨯≈⨯,故错误;故选:D.11.D 【分析】利用频率分布直方图的性质直接求解.【详解】解:对于A ,90分以上为优秀,由频率分布直方图得优秀的频率为0.010100.1⨯=,∴从全体考生中随机抽取1000人,则其中得优秀考试生约有:10000.1100⨯=人,故A 正确;对于B ,由频率分布直方图得[40,50)的频率为0.01100.1⨯=,[50,100)的频率为:10.10.9-=,∴若要全省的合格考通过率达到96%,则合格分数线约为44分,故B 正确;对于C ,若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为:450.01010550.01510650.02010750.03010850.01510950.0101070.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=分,故C 正确;对于D ,[40,70)的频率为:(0.0100.0150.020)100.45++⨯=,[70,80)的频率为0.030100.3⨯=,∴该省考生物理成绩的中位数为:0.50.45701071.670.3-+⨯≈分,故D 错误.故选:D .【点睛】本题考查频数、合格分数线、平均数、中位数的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题.12.65,65【分析】频率分布直方图中最高矩形的中点横坐标即为众数,利用平分矩形面积可得中位数.【详解】由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.故答案为:65,6513.四【分析】计算前几组的频率之和,判断频率为0.5在哪个区间即可判断中位数.【详解】根据频率分布直方图可知,前三组的频率之和为()0.03750.06250.07520.350.5++⨯=<,前四组的频率之和为()0.03750.06250.0750.120.550.5+++⨯=>,则可以判断中位数在第四组.故答案为:四.【点睛】本题考查根据频率分布直方图判断中位数所在区间,属于基础题.14.67.【分析】本题根据频率分布直方图直接求平均数即可.【详解】解:这次竞赛的平均成绩为:0.03055100.04065100.01575100.01085100.005951067⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=故答案为:67.【点睛】本题考查根据频率分布直方图求平均数,是基础题.15.0.016130【分析】利用频率分布直方图中所有矩形的面积之和为1可求得污染的数据;利用最高矩形底边的中点值可求得众数.【详解】设被污染的数据为a ,利用频率分布直方图中所有矩形的面积之和为1可得0.004100.02100.028100.03210101a ⨯+⨯+⨯+⨯+⨯=,解得0.016a =.由图可知,该班同学的成绩众数为130.故答案为:0.016,13016.4.7 4.75【分析】根据频率分布直方图,取最高矩形底边中点的横坐标即可求出众数,求出第三小组矩形的高,设中位数为x ,由()0.1250.175 4.5510.5x ++-⨯=,解方程即可求解.【详解】由图可知,众数为4.7,第五小组的频率为0.50.30.15⨯=从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,可得第一小组的频率为50.150.1256⨯=,第二小组的频率为70.150.1250.1756⨯==,第三小组的频率为120.150.36⨯=,所以中位在第三小组,第三小组矩形面积为0.3,则第三小组的高为0.310.3=设中位数为x ,则()0.1250.175 4.5510.5x ++-⨯=,解得 4.75x =故答案为:4.7;4.75【点睛】本题考查了根据频率分布直方图求众数、中位数,考查了运算求解能力,属于基础题. 17.(1)填表见解析;作图见解析;(2)平均值为:1.08,答案见解析.【分析】(1)由样本数据,即可完善频率分布表中的数据,并画出频率直方图.(2)由(1)的频率直方图计算样本均值,进而描述汞含量分布规律.【详解】(1)由题设样本数据,则可得频率分布表如下,分组频数频率[)0,0.5031 10[)0.50,1.00101 3[)1.00,1.50122 5[)1.50,2.0042 15[)2.00,2.5011 30合计301(2)根据频率分布直方图估算平均值为:112210.250.75 1.25 1.75 2.25 1.0810351530⨯+⨯+⨯+⨯+⨯≈,分布规律:①该频率分布直方图呈中间高,两边低,大多数鱼身体中汞含量主要集中在区间[]0.5,1.5;②汞含量在区间[]1,1.5的鱼最多,汞含量在区间[]0.5,1的次之,在区间[]2,2.5的最少;③汞含量超过61.0010-⨯的数据所占比例较大,这说明这批鱼被人食用,对人体产生危害的可能性比较大.18.(1)作图见解析;中位数为4.3;(2)35.【分析】(1)设中位数为x ,则有()40.150.05x -⨯=,故可求中位数.(2)利用古典概型的概率公式可求概率.【详解】解:(1)第二组的频率为()120.150.0750.050.10.25-⨯+++=,故第二组小矩形的高为0.125频率分布直方图如图所示,由频率分布直方图可得,第一组和第二组的频率之和为0.20.250.450.5+=<,前三组的频率之和为0.20.250.30.750.5++=>,可知中位数在第三组,设中位数为x ,则有()40.150.50.450.05x -⨯=-=,解得134.33x =≈,所以该社区住户每周锻炼时间的中位数为4.3;。
高中数学课件:平均数及其估计

甲种灯泡比乙种灯泡的平均使用寿命长一些.
思考:一组数据的中位数一般不受少数 几个极端值的影响,这在某些情况下是 一个优点,但它对极端值的不敏感有时 也会额成为缺点,你能举例说明吗?样 本数据的平均数大于(或小于)中位数 说明什么问题?你怎样理解“我们单位 的收入水平比别的单位高”这句话的含 义??
甲班:112 86 106 84 100 105 98 102 94 107 87 112 94 94 99 90 120 98 95 119 108 100 96 115 111 104 95 108 111 105 104 107 119 107 93 102 98 112 112 99 92 102 93 84 94 94 100 90 84 114
读作"西格玛".
处理实验数据的原则是使这个近似值与实验数
据之间的离差最小.设这个近似值为x,那么它与
n个实验值 ai(i = 1,2 ,×××,n )的离差分别为x - a1, x - a2 ,x - a3 ,×××,x - an .由于上述离差有正有负,故 不宜直接相加.可以考虑离差的平方和,即
x a1 2 x a2 2 x an 2 .
0.25×0.04+0.75×0.08+1.25×0.15+1.75 ×0.22+2.25×0.25+2.75×0.14+3.25× 0.06+3.75×0.04+4.25×0.02=2.02(t).
平均数是2.02.
平均数与中位数相等,是必然还是巧合?
思考7:从样本数据可知,该样本的众数是 2.3,中位数是2.0,平均数是1.973,这与我 们从样本频率分布直方图得出的结论有偏差, 你能解释一下原因吗?
中位数平均数众数方差

-100)2+(100-100)2]=1.
(2)因为
,说明甲机床加工零件波动比较大,因此乙机
床加工零件更符合要求.
附注:
1.平均数与方差都是重要的数字特征,是对总体的一种简 明的描述,它们所反映的情况有着重要的实际意义, 平均数、中位数、众数描述其集中趋势,方差和标准 差描述波动大小.
2.平均数、方差的公式推广 (1)若数据x1,x2,…,xn的平均数为 ,那么mx1+a, mx2+a,mx3+a,…,mxn+a的平均数是m +a. (2)数据x1,x2,…,xn的方差为s2. ①s2= ②数据x1+a,x2+a,…,xn+a的方差也为s2; ③数据ax1,ax2,…,axn的方差为a2s2.
频率 组距
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4
2.02这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
5: 甲、乙两台机床同时加工直径为10 mm的零件,为了检验产品的 质量,从产品中各随机抽取6件进行测量,测得数据如下 (单位mm) 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.
(1)完成数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出
统计结论.
【解】 (1)
众数,中位数,平均数yong

三种数字特征的优缺点
特征数 众数 中位数 平均数 优 点 缺 点
体现了样本数据的最大 无法客观反映总体 特征 集中点 不受少数极端值的影响 不受少数极端值的 影响有时也是缺点 与每一个数据有关,更 受少数极端值的影 能反映全体的信息. 响较大,使其在估 计总体时的可靠性 降低.
思考7:一组数据的中位数一般不受少数几个极端值的影
人员
周工资 人数 合计
经理
2200 1 2200
管理人员 高级技工
250 6 1500 220 5 1100
工人
200 10 2000
学徒
100
合计
1 23 100 6900
(1)指出这个问题中周工资的众数、中 位数、平均数 (的工资水平吗?为什么?
分析:众数为200,中位数为220,
探究1:众数、中位数和平均数
思考1:如何从频率分布直方图中估计众数、中位数、平 均数?
思考2:在城市居民月均用水量样本数据的频率分布直方 图中,你认为众数应在哪个小矩形内?由此估计总体的众 数是什么?
频率 0.5 组距 0.4 0.3 0.2 0.1
O
取最高矩形下端 中点的横坐标 2.25作为众数.
思考6:从居民月均用水量样本数据可知,该样本的众数 是2.3,中位数是2.0,平均数是1.973,这与我们从样本频 率分布直方图得出的结论有偏差,你能解释一下原因吗?
在制作频率分布直方图“丢失”了一些样本 数据,得到的是一个估计值,且所得估计值与 数据分组有关. 注:在只有样本频率分布直方图的情况下,才可按 上述方法估计众数、中位数和平均数,并由此估计 总体特征.
1 ( x1 x 2 x n ) n
复习运用
从甲、乙、丙三个厂家生产的同一件产品中抽取 8 件产品,对其寿品进行跟踪调查结果如下(单位:年) : 甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,10,12,13; 丙:3,3,4,7,9,10,11,12; 三个厂家在广告中都称该产品的使用寿命是 8 年, 请 根据结果判断厂家在广告中分别运用了平均数、众数、 中位数中哪一种集中趋势的特征数: 众数 乙:_________, 中位数 丙:_________ 平均数 。 甲:________,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习好资料 欢迎下载
频率分布直方图
用样本的数字特征估计总体的数字特征
1、 众数:在一组数据中,出现次数最多的数称为众数
2、 中位数:在按大小顺序排列的一组数据中,当一组数有奇数个时,居于中间的数称为中位数,当一组数据有偶数个是,居于中间两数的平均数称为中位数
3、 平均数:是指一组数据的算术平均数
若是频率分布直方图中,这样计算:
1、 众数:在频率分布直方图中,用面积最大的矩形的横轴中点对应的数来估计众数(最高矩形的横坐标中点)
2、 中位数:在频率分布直方图中,是用使图形左右两边面积相等的与横轴垂直的直线所对应的横坐标来估计中位数。
3、 平均数:在频率分布直方图中,利用每个小矩形的面积乘以小矩形底边中点的横坐标之和来估计平均数。
例题:根据右图频率分布直方图,估计以下
(1) 众数
(2) 中位数
(3) 平均数
例题:某学校100名学生期中考试语文成绩的频率分布直方图如图4所示,其中成绩分组区间是:[)60,50,[)70,60,[)80,70,[)90,80,[]100,90.
(1) 求图中a 的值
(2) 根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3) 若这100名学生语文成绩某些分数段的人数()x 与数学成绩相应分数段的人数()y 之比如下表所示,求数学成绩在[)90,50之外的人数.
0.005。