人教版高中数学必修三 第二章 统计数据的数字特征用样本估计总体
人教A版高中数学必修3第二章2.2.2 用样本的数字特征估计总体的数字特征

2.2.2 用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数学情分析:本节课的学习者是高一学生,他们在初中已经学习过统计的初步知识,他们的观察、猜想能力较强。
但演绎推理、归纳、运用数学意识的思想比较薄弱,思维的广阔性、紧密性、灵活性比较欠缺,自主探究和合作学习能力需要在课堂教学中进一步加强和引导。
一、三维目标:1、知识与技能(1)能利用频率分布直方图估计总体的众数、中位数、平均数;(2)能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;。
(3)形成对数据处理过程进行初步评价的意识。
2、过程与方法初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.3、情感态度与价值观在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、重点与难点重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.难点:能应用相关知识解决简单的实际问题。
三、教学过程导入新课在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征. (板书课题)新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.。
高中数学人教A版必修三第二章2.2.2用样本的数字特征估计总体的数字特征课件

2、求下列各组数据的中位数
(1)1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
2.已知样本数据 x1,x2,…,xn 的均值 x =5,则样本数据
学徒 100 1 100
合计
23 6900
如何在频率散布直方图中估计平均数
频率/组距
0.08
0.16 0.30 0.50
0.44 0.40 0.50 0.28 0.30
0.12 0.20 0.08 0.04 0.10
频率/组距 0.5 1 1.5 2 2.5
平均数的估计值等于频率 散布直方图中每个小矩形的面 积乘以小矩形底边中点的横坐 标之和.
1.求出a、p、n; 2.补全频率散布直方图;
2.2.2用样本的数字特征估计 总体的数字特征
众数、中位数、平均数
用样本的数字特征估计总体的数字特征
1.众数、中位数、平均数的概念 (1)众数:一组数据中_出__现__次__数__最__多__的数.
按顺序排好
(2)中位数:一组数据按大小顺序排列后,处于_中__间__位置 的数.如果个数是偶数,则取_中__间__两个数据的平均数.
0.08 0.04
0.5 1 1.5 2 2.5
0.06 0.04
月均用水量/t
0.02
3 3.5 4 4.5
2.02
[典例] 某中学举行电脑知识竞赛,现将高一参赛学生的成 绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知 图中从左到右的第一、二、三、四、五小组的频率分别是 0.30,0.40,0.15,0.10,0.05.
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_3

课题:2.2.2 用样本的数字特征估计总体的数字特征(一)教学设计一、教材解析(一)教材地位与作用本节课选自人教B版必修3,第二章第二节第二讲,是一节探究课,是在第一讲中已经学习了用频率分布表、频率分布直方图、折线图、茎叶图的基础上从形的角度通过抽样估计整体,并结合初中学习的数字特征众数、中位数、平均数来研究数据进而估计整体,用频率分布直方图研究整体特征非常直接呈现出数据的分布及集中趋势,但原始数据丢失;怎样将频率分布直方图和数字特征很好的结合起来是我们本节课主要突破的问题。
教学重点:从频率分布直方图中估计总体的数字特征教学难点:从频率分布直方图中估计总体的中位数、平均数本节课在重难点的突破上采用类比的思想,引导学生用频率的思想重新定义众数、中位数、平均数,再类比到频率分布直方图,使学生能够更好地理解教材上所给出的运算方法。
(二)教学目标(1)会借助频率分布直方图从“形”的角度估计总体的数字特征,并作出合理的解释,体会数形结合的数学思想.(2)在解决统计问题的过程中,通过自主探索与合作交流,经历数字特征的生成过程,会用样本的数字特征估计总体的数字特征,体会用样本估计总体的思想.二、设计思路(一)教学设计构成本学案是按照罗定邦中学“1+1主体建构”的课堂模式要求,三案并举,包括:自主学习案、合作探究案、课后作业案。
自主学习案是学生课前预习,自主完成并检测,合作探究案是提前预习+课堂小组讨论、讲解点评,课后练习案是课后巩固提升,自主完成。
(二)教学媒体利用本节课我们要运用多媒体课件、平板电脑、定邦云平台,在自主自测和例题反馈当堂检测部分将运用定邦教育云平台上传答案并统计学生的做题情况,及时反馈、分析、有针对想的讲解。
让学生在生动具体的情境中感悟知识的发生和发展过程,优化学生的认识结构.三、教学过程设计(一)教学流程设计(二)教学过程设计一、 情境引入 我们第9周刚进行了期中考试,在理科班617位同学的数学成绩中随机抽取100位同学的数学成绩对全级数学成绩分析,100名同学的数学成绩如下。
人教版高中数学必修三 第二章 统计数据的数字特征用样本估计总体

数据的数字特征用样本估计总体一.课前热身二.知识结构图三.新知识全解(基本知识的详解及解决方法)知识点1.用样本的数字特征估计总体的数字特征:初中学过样本的众数(样本观测值中出现次数最多的数)样本中位数和平均值的数字特征,它们只能作为个体相应特征的估计。
这些数字特征刻划一组数据集中趋势的统计量。
刻划数据离散程度的统计量,如极差与方差刻划数据离散程度的度量,其理想形式应满足以下三条原则:(1)应充分利用所得到的数据,以便提供更确切的信息;(2)仅用一个数值来刻画数据的离散程度;(3)对于不同的数据集,当离散程度大时,该数据值亦大。
极差显然不满足上面的第一条原则,它只是利用了数据中最大和最小的两个值,而且对极值过于敏感,但由于只设计两个数据,便于得到,所以极差在实际中也经常应用。
方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始观测数据相同的单位,解决这个局限性的一种方法是取方差的正的平方根:nx x x x x x s s n 222212)()()(-+-+-==称为标准差,标准差的单位与原始测量单位相同。
在统计中,我们通常用标准差来刻画数据的离散程度。
例1(2002新课程)甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/2km )其中产量比较稳定的冬小麦品种是( )分析:方差、标准差分别反映数据的稳定程度,集中与离散的程度。
解:102.10101.109.98.951=++++⨯=)(甲x ; ;)(乙108.97.98.103.104.951=++++⨯=x即甲乙两种冬小麦的平均产量的均值都等于10,其方差分别为02.004.0001.001.004.0512=++++⨯=)(甲s 244.004.009.064.009.036.0512=++++⨯=)(乙s即22乙甲s s <,表示甲种小麦的产量比较稳定。
变式练习1 某学校的日睡眠时间的抽样频率分布见下表:试估计该校学生的平均睡眠时间。
最新人教版高中数学必修3第二章《用样本的数字特征估计总体》

2.2.2 用样本的数字特征估计总体的数字特征1.掌握众数、中位数、平均数、标准差、方差的定义和特征.2.会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题.1.众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能________个,也可能没有,反映了该组数据的__________.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.【做一做1】 数据组8,-1,0,4,17,4,3的众数是__________.2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的__________.在频率分布直方图中,中位数左边和右边的直方图的面积______.中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.【做一做2】 数据组-5,7,9,6,-1,0的中位数是__________. 3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x =____________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中________的影响较大,使平均数在估计总体时可靠性降低.【做一做3】 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是__________.4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =______________________________. 可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕________波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较____;标准差较小,数据的离散程度较____.【做一做4】 一组数据的单位是m ,平均数是x ,标准差为s ,则( ) A .x 与s 的单位都是km B .x 与s 的单位都是cm C .x 与s 的单位都是mD .x 与s 的单位不同5.方差(1)定义:标准差的平方,即 s 2=________________________.(2)特征:与________的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:________.数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为as .【做一做5】 下列刻画一组数据离散程度的是( ) A .平均数 B .方差 C .中位数 D .众数 6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用______的平均数、众数、中位数、标准差、方差来估计.这与上一节用______的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.【做一做6-1】 下列判断正确的是( ) A .样本平均数一定小于总体平均数 B .样本平均数一定大于总体平均数 C .样本平均数一定等于总体平均数D .样本容量越大,样本平均数越接近总体平均数【做一做6-2】 电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( )A .27B .28C .29D .30答案:1.(1)最多 (2)不止一 集中趋势 【做一做1】 42.(1)中间 (2)唯一 集中趋势 相等【做一做2】 3 将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是0+62=3.3.(1)x 1+x 2+…+x nn(2)平均水平 信息 极端值【做一做3】 14.7 平均数是110(15+17+14+10+15+17+17+16+14+12)=14.7.4.(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)平均数 大 小 【做一做4】 C x 与s 的单位都与数据组中的数据单位相同,是m. 5.(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)标准差 (3)[0,+∞)【做一做5】 B 方差刻画一组数据离散程度的大小. 6.样本 样本 【做一做6-1】 D【做一做6-2】 B 这10个数据的平均数是110(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.1.理解众数、中位数、平均数剖析:(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使其无法客观地反映总体特征.(2)中位数不受少数几个极端值的影响,容易计算,但它对极端值的不敏感有时也会成为缺点.(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止由于个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.(4)在一组数据中,它们的众数、中位数、平均数可能相同,也可能不同,而实际问题中,计算平均数时应该注意按实际要求进行计算.(5)实际问题中求得的平均数、众数和中位数应带上单位. 2.众数、中位数、平均数与频率分布直方图的关系剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形的中点的横坐标.(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数的值不一致.(3)平均数显然是频率分布直方图的“重心”.我们知道,n 个样本数据x 1,x 2,…,x n 的平均数x =1n (x 1+x 2+x 3+…+x n ),则就有n x =x 1+x 2+x 3+…+x n ,所以x 对数据有“取齐”的作用,代表了一组数据的数值平均水平.在频率分布直方图中,平均数是直方图的平衡点,假设横轴表示一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡.3.理解方差与标准差剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.题型一 计算方差(标准差)【例题1】 从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为________.反思:求一组数据的方差和标准差的步骤如下: ①先求平均数x .②代入公式得方差和标准差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 题型二 众数、中位数、平均数的应用【例题2】 某工厂人员及月工资构成如下:(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么? 分析:由平均数的定义→计算平均数→已知数据从小到大排列→得中位数、众数→结论反思:(1)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.题型三 方差的应用【例题3】 甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203 204 202 196 199 201 205 197 202 199 乙:201 200 208 206 210 209 200 193 194 194 (1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?反思:研究两个样本的波动情况或比较它们的稳定性、可靠性、平整性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再比较两个样本方差的大小来作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式来计算平均数和方差,这样可避免计算的烦琐,降低错误率.题型四 易错辨析【例题4】 小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?错解:这五次数学考试的平均分是96+98+95+93+455=85.4,则按平均分给小明一个“良好”.错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩.答案:【例题1】2105这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为300100=3,则该100人成绩的标准差为1100[(5-3)2×20+(4-3)2×10+(3-3)2×30+(2-3)2×30+(1-3)2×10] =2105. 【例题2】 解:(1)由表格可知,众数为2 000元.把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.【例题3】 解:(1)x 甲=110(3+4+2-4-1+1+5-3+2-1)+200=200.8.x 乙=110(1+0+8+6+10+9+0-7-6-6)+200=201.5.s 2甲=7.96,s 2乙=38.05.(2)∵200<x 甲<x 乙,∴甲台包装机包装的10袋糖果的平均质量更接近于200克.∵s 2甲<s 2乙,∴甲台包装机包装的10袋糖果的质量比较稳定.【例题4】 正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.1.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为()A.3与3 B.23与3 C.3与23 D.23与232.(2011·北京海淀二模,理5)某赛季甲、乙两名篮球运动员各13场比赛的得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是() A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员的得分平均值大于乙运动员的得分平均值D.甲运动员的成绩比乙运动员的成绩稳定3.抛硬币20次,抛得正面朝上12次,反面朝上8次.如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是__________,得分的方差是__________.4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则x2+y2=__________.5.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根赛.答案:1.D中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.2.D甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分的中位数为26,所以B项正确;甲运动员的得分平均值x甲=113(18+18+19+20+21+26+30+32+33+35+40+41+47)=34313,乙运动员的得分平均值x乙=113(17+17+19+19+22+25+26+27+29+29+30+32+33)=32513,甲运动员的得分平均值大于乙运动员的得分平均值,所以C项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定.3.2.20.96总得分为12×3+8×1=44,则平均分是4420=2.2,方差s2=120[(3-2.2)2×12+(1-2.2)2×8]=0.96.4.208由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又由于方差为2,则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,整理得x2+y2-20(x+y)=-192,则x2+y2=20(x+y)-192=20×20-192=208. 5.解:设甲乙两人成绩的平均数分别为x甲,x乙,则x甲=130+1(380751)6-+++++=133,x乙=130+1(318426)6-++-+=133,2 s 甲=2222221[(6)5(3)42(2)]6-++-+++-=473,2 s 乙=2222221[0(4)51(5)3]6+-+++-+=383.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.。
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_7

(3)
例5:已知一组数据x1,x2,…,x5的平均数为
如图所示的是表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得
.甲、乙两名中学生在一年里各学科成绩的平均分相等,方差不相等,正确评价它们学
.成绩虽然一样,方差较大的,说明潜力大,学习态度扎实
.表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定
.说明他们学习水平不一样,方差较小的同学,学习成绩不稳定,成绩忽高忽低
)
名学生右眼视力的检查结果如下表所示:
0.50.60.70.8 1.0
4468该班学生右眼视力的众数和中位数分别是()。
人教版高中数学必修三第二章第2节 2.2.2用样本的数字特征估计总体的数字特征 课件

• 问题4:书本73页的探究如何理解?
• 问题5: 总结在利用众数、中位数、平均数估计总体的 数字特征时各自的优缺点。
三种数字特征的优缺点
典例解析
[例] 某中学举行电脑知识竞赛,现将高一参赛学生的成 绩进行整理后分成五组绘制成如图所示的频率分布直方图,
80.024
0.02
0.01
0.01
20 . 0 0
08 . 0 0
4 0 90 1001 11 21301401 5 次数
课堂小结
1、如何从样本数据中求众数、平均数、中位 数的方法
2、如何从频率分布直方图中估计众数、中位 数、平均数? • 众数:最高矩形的中点的横坐标。 • 中位数:两边小长方形面积相等 • 平均数:频率分布直方图中每个小矩形的
面积乘以小矩形底边中点的横坐标之和。
1.成为世界上经济增长速度最快的国 家,创 造了世 界经济 增长史 上的新 奇迹。 1.否定商 品经济 的存在 ,否定 市场及 价值规 律对经 济的调 节作用 。 35、生命是以时间为单位的,浪费别 人的时 间等于 谋财害 命;浪费 自己的 时间, 等于慢 性自杀 。—— 鲁迅 36、社会上崇敬名人,于是以为名人的 话就是 名言, 却忘记 了他之 所以得 名是那 一种学 问或事 业--鲁迅 38、推销员接近顾客的方式,往往决 定自己 在他们 心目中 的地位 是“接 单者” 还是“ 建议者 ”。 39、事先写出自己所要提出的每点意 见,以 合乎逻 辑的顺 序表达 出来: 言简意 骇,抓 住重点 。 2、人生的成功,不在于拿到一幅好 牌,而 是怎样 将坏牌 打好。 3、人生的路每一个人都要走一趟, 同样是 一条路 每一个 人走起 来却有 着不同 的感受 ,是好 是坏那 就要靠 几分的 机缘与 自己的 抉择。 38、推销员接近顾客的方式,往往决 定自己 在他们 心目中 的地位 是“接 单者” 还是“ 建议者 ”。
人教版高中数学必修3第二章统计-《2.2.2用样本的数字特征估计总体数字特征》教案(5)

2.2.2用样本的数字特征估计总体的数字特征(众数,中位数,平均数)学习目标一.能力目标:(1). 能利用频率颁布直方图估计总体的众数,中位数,平均数.(2). 能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法。
(3)初步体会、领悟“用数据说话”的统计思想方法。
二.情感目标:通过对有关数据的搜集、整理、分析、判断培养学生“实事求是”的科学态度和严谨的工作作风。
三.学习重点、难点(1).根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征。
(2).体会样本数字特征具有随机性。
四.基本流程五. 教学情景设计例1: 从甲乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1500 1500 1500 1500 1500 1500 1500 2000 2000 2000 2000 2000 2500 2500 2500乙公司:700 700 700 700 700 700 700 700 700 700 700 700 700 700 700 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 10001000 1000 1000 1000 1000 1000 1000 1000 10001000 1000 6000 8000 10000试计算这两个公司50名员工月工资平均数,众数,中位数,并估计这两个企业员工平均工资。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的数字特征用样本估计总体一.课前热身二.知识结构图三.新知识全解(基本知识的详解及解决方法)知识点1.用样本的数字特征估计总体的数字特征:初中学过样本的众数(样本观测值中出现次数最多的数)样本中位数和平均值的数字特征,它们只能作为个体相应特征的估计。
这些数字特征刻划一组数据集中趋势的统计量。
刻划数据离散程度的统计量,如极差与方差刻划数据离散程度的度量,其理想形式应满足以下三条原则:(1)应充分利用所得到的数据,以便提供更确切的信息;(2)仅用一个数值来刻画数据的离散程度;(3)对于不同的数据集,当离散程度大时,该数据值亦大。
极差显然不满足上面的第一条原则,它只是利用了数据中最大和最小的两个值,而且对极值过于敏感,但由于只设计两个数据,便于得到,所以极差在实际中也经常应用。
方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始观测数据相同的单位,解决这个局限性的一种方法是取方差的正的平方根:nx x x x x x s s n 222212)()()(-+-+-==称为标准差,标准差的单位与原始测量单位相同。
在统计中,我们通常用标准差来刻画数据的离散程度。
例1(2002新课程)甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/2km )其中产量比较稳定的冬小麦品种是( )分析:方差、标准差分别反映数据的稳定程度,集中与离散的程度。
解:102.10101.109.98.951=++++⨯=)(甲x ; ;)(乙108.97.98.103.104.951=++++⨯=x即甲乙两种冬小麦的平均产量的均值都等于10,其方差分别为02.004.0001.001.004.0512=++++⨯=)(甲s 244.004.009.064.009.036.0512=++++⨯=)(乙s即22乙甲s s <,表示甲种小麦的产量比较稳定。
变式练习1 某学校的日睡眠时间的抽样频率分布见下表:试估计该校学生的平均睡眠时间。
变式练习2 甲乙两台机床同时生产一种零件10天中,两台机床每天的次品数分别是: 甲:0 1 0 2 2 0 3 1 2 4 乙:2 3 1 1 0 2 1 1 0 1分别计算这两组数据的平均值与标准差,从计算结果看,哪台机床的性能较好? 变式练习3 下列数据是30个不同的国家中每100000名男性患某种疾病的死亡率: 27.0 23.9 41.6 33.1 40.6 18.8 13.7 28.9 13.2 14.5 27.0 34.8 28.9 3.2 50.1 5.6 8.7 15.2 7.1 5.2 16.5 13.8 19.2 11.2 15.7 10.0 5.6 1.5 33.8 9.2 请由这些数据计算平均数、中位数和标准差,并对它们的含义进行解释。
知识点2 、用样本的频率分布估计总体分布频率分布表和频率分布图,从各个小组数据在样本容量所占比例大小的角度,来表示数据分布的规律。
它可以使我们看到正个样本数据的频率分布情况,步骤如下: (1)求极差 (2)决定组距和组数 (3)将数据分组 (4)频率分布表 (5)画频率分布直方图频率分布折线图:连接频率分布直方图中各小长方形上端点的中点,就得到频率分布折线图。
一般的,当总体中的个数较多,抽样时样本容量就不能太小,随着样本容量的增加,作图时所分的组数也增加,相应的频率折线图会越来越接近一条光滑的曲线。
例1 公交车的数量太多容易造成资源的浪费,太少难以满足乘客的需求,为此,公交公司在某站台随机调查了80名乘客,他们的侯车时间如下所示(单位:min )17 14 20 12 10 24 18 17 1 22 13 19 28 5 34 7 25 18 28 1 15 31 12 11 10 16 12 9 10 13 19 10 12 12 16 22 17 23 16 15 16 11 9 3 13 2 18 22 19 9 23 28 15 21 28 12 11 14 15 3 11 6 2 18 25 5 12 15 20 16 12 28 20 12 28 15 8 32 18 9 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图: (2)这80名乘客候车时间的平均数是多少?标准差呢? (3)你能为公交公司提出什么建议?分析:样本数据较多,我们可以利用计算器计算平均数和标准差。
解:(1)①由数据最大值、最小值得到:最大值为34,最小值1,极差=34-1=33;②确定组距为5(min ),6.6533==组距极差,分成7组;③第一组起点0;④由各组累计频数的算法,得到各组的频数。
频率分布见下表:频率分布直方图如图所示:频率折线图略(2)这80名乘客的乘车时间的平均值是15.5min;标准差是7.5;(3)公交公司可适当的增加公交车的数量。
变式练习4、(2007年淄博一模)下图是容量为100的样本的频率分布直方图,试根据图中的数据,回答下列问题:(1)样本数据在[)6,2内的频率为();(2)样本数据在[)10,6内的频率为();易错剖析:在画频率分布直方图时应注意纵坐标为组距频率,而不是频率,每个小矩形的宽度为i x ∆(分组的宽度),高为iix f ∆,小矩形的面积恰好为相应的频率i f ,图中所有小矩形的面积之和,也就是落在各个宽度的区间内的频率之和等于1。
例3、对于某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表; (2)画出频率分布直方图;(3)估计元件寿命,在100~400以内的百分比为多少? (4)估计电子元件寿命在400以上的百分比为多少? 分析:利用样本频率分布估计总体频率分布。
解:(1)频率分布表为: 频率分布直方图,如图所示:(3)由频率分布表或由频率分布直方图,可知寿命在100h~400h内的百分比约为65%;(4)由频率分布表或由频率分布直方图可知寿命在400h以上的电子元件的百分比约35%;点拨:利用样本在某一范围内的频率,也可以近似地估计总体在这一范围内的频率。
变式练习5:在一批棉花中抽测了60根棉花的纤维长度,结果如下(单位:mm)82 202 352 321 25 293 293 86 28 206323 355 357 33 325 113 233 294 50 296115 236 357 326 52 301 140 328 238 35858 255 143 360 340 302 370 343 260 30359 146 60 263 170 305 380 346 61 305175 348 264 383 62 306 195 350 265 385作出这个样本的频率分布直方图,棉花的纤维长度是棉花质量的重要指标,你能从图中分析出这批棉花的质量状况吗?四、问题探究(重点、难点、疑点以及解决方法)样本的数字特征包括众数中位数、平均数标准差、方差,它们各有优缺点,我们要考虑所选样本代表性,就要从数字特征入手,但众多的数字特征哪一个能更好的用来评价我们所选取的样本哪?这便成为了我们首先要考虑的问题。
每个样本的数字特征它从不同的方面来刻画样本中数据,所以我们要来研究一下它们的共性与差异。
探究1:数字特征的优缺点①众数体现了样本数据的最大中点,但它忽视了其它的数据信息,无法客观反映总体特征;②中位数是样本数据所有点频率的等分线,它不受少数极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点;③由于平均数与样本的每一个数据有关,所以任何一个数据的改变都会引起平均数的变化,这是众数,中位数都不具备的性质,也正是这个原因,与众数、中位数比较起来,平均数可以放映出更多关于样本数据全体的信息。
但平均数据中的极端值的影响较大,使平均数在估计总体时可靠性降低;④标准差、方差描述一组数据围绕平均数波动的大小,但方差与原始数据的单位不同且平方后夸大了偏差程度,在实际问题中一般都用标准差。
例4、在一次人才招聘会上,有一家公司的招聘员告诉你“我们公司的收入水平很很高”,去年在50名员工中,最高年收入达到了100万,他们的年收入的平均数是3.5万”如果你希望获得年薪2.5万⑴你是否能够判断自己可以成为此公司的一名高收入者?⑵如果招聘员继续告诉你“员工收入的变化范围是从0.5万到100万”这个信息是否足以作出自己是否受聘的决定?为什么?⑶如果招聘员继续给你提供了如下信息:“员工收入的中间50%(即最少的25%和最多的25%后所剩的)变化范围是1万到3万”你又该如何使用这条信息来作出是否受聘的决定?⑷你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多?分析:理解数字特征的作用。
解:⑴不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数,现在已经知道至少有一个人的收入为X 50=100万元。
那么其他员工的收入之和为Y =3.5×50-100=75万元 ,每人平均只有1.53万元。
如果再有几个收入特别高者,那么初进公司的员工的收入将会很低。
⑵不能,要看中位数是多少。
⑶能,可以确定又75%的员工工资在1万元以上,其中25%的员工工资在3万元以上。
⑷收入的中位数大约是2万元,因为有年收入100万元这个极端值的影响,使得年平均收入比中位数高许多。
例5、(2007年普通高等学校招生全国统一考试(海南)第11题).甲、乙、丙三名射箭运动123s s s ,,分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )A.312s s s >> B.213s s s >> C.123s s s >> D.231s s s >>解:5.8205105958571=⨯+⨯+⨯+⨯=x ,118.1])5.810(5)5.89(5)5.88(5)5.87(5[20122221=-⨯+-⨯+-⨯+-⨯⨯=s 5.8206104948672=⨯+⨯+⨯+⨯=x,204.1])5.810(6)5.89(4)5.88(4)5.87(6[20122222=-⨯+-⨯+-⨯+-⨯⨯=s 5.8204106968473=⨯+⨯+⨯+⨯=x,025.1])5.810(4)5.89(6)5.88(6)5.87(4[20122223=-⨯+-⨯+-⨯+-⨯⨯=s 答案:B变式练习5:在去年的足球甲A 联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4。
你认为下列说法中哪一种是正确的,为什么? ⑴平均说来一队比二队防守技术好; ⑵二队比一队技术水平更稳定;⑶一队有时表现很差,有时表现又非常好; ⑷二队很少不失球。