2015年广东省创新杯说课大赛数学类一等奖作品:用样本频率分布估计总体

合集下载

2015高中数学1.5.1估计总体的分布课件(北师大版必修三)

2015高中数学1.5.1估计总体的分布课件(北师大版必修三)

§5用样本估计总体5.1估计总体的分布一则新闻:据新华社报道:对42种电冰箱的抽查,抽样合格率为83.3%.对50种黄酒的抽查,抽样合格率为84%.一是如何从总体中抽取样本? 二是如何用样本估计总体?JSEh••・ Jflk JO^ jflk ••・ jrtb JU^ Jfik JS^ ・•・jQh舉窈黛幫热乂舉密彎垛◎颦叢*舉嚳舉* 2樂樂*舉臓策堆a 蝴隼'躍新课导入温聲提示用所命刼对片,£*4j#M 圧生现*・学习目标1 •学会用样本的频率分布估计总体分布.(重点、难点)2・会根据样本数据画出频率分布直方图及频率分布折线图.(重点)课堂探究例1895年,在英国伦敦有106块男性头盖骨被挖掘出土•经考证,这些头盖1665〜1666年的大下所示(单位:mm):146 141 139 140 145 141 142 131 142 140 144 140138 139 147 139 141 137 141 132 140 140 141 143134 146 134 142 133 149 140 140 143 143 149 136141 143 143 141 138 136 138 144 136 145 143 137142 146 140 148 140 140 139 139 144 138 146 153148 152 143 140 141 145 148 139 136 141 140 139158 135 132 148 142 145 145 121 129 143 148 138149 146 141 142 144 13? 153 148 144 138 150 148133145 145 142 143 143 148 141 145 141请你估计在1665-1666年,英国男性头盖骨宽度的分布情况.解:如果把总体看作是1665-1666年的英国可以先将以上数据按每个数据岀现的频数和频率汇成表:从表格中,我们就能估计出总体大致的分布情况了,如在1665〜1666年, 英国男性头盖骨宽度主要在136〜149 mm, 135 mm以下以及150 mm以上所占的比例相对较小等•但是,这些关于分布情况的描述仍不够形象.w 护杠w卢匕W 卢❻X」为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组, 再画频数分布直方图,用图中矩形的高度来反映频数.我们也可以用区间上矩形的面积来反映频率,得到 下图.160宽度/mm0.10 0.080.060.040.02o'_____120 125 130 135 140 145 150 1550017200116UUQU (10L14若每个小矩形的宽度为(分组的宽度),高为丄AXj 小矩形的面积恰为相应的频率fi,通常我们称这样' 的图形为频率分布直方图.思考交流观察此频率分布直方图,你能 知道:(1) 头盖骨的宽度位于哪个 区间的数据最多?(2) 头盖骨的宽度在140〜 145 mm 的频率约是多少? (3) 头盖骨的宽度小于140 mm 的频率约是多少? (4) 头盖骨的宽度在137〜 142 mm 的频率约是多少?0.080.060.040.02V.W15 V^WU fton 1UW120 125 130 135 140 145 150 155 160 宽度/mm(1) 最多140 ~ 145mm 的 (2) 0.434 (3 ) 0.283 (4) 0.298通常,在频率分布直方图中,按照分组原则,再在左 边和右边各加一个区间•从所加的左边区间的中点开 始,用线段依次连接各个矩形的顶端中点,直至右 边所加区间的中点,就可以得到一条折线,我们称 之为频率折线图.(如上图所示)0.10 0.08 0.06 0.04 0.02 0锂度/mrn【变式练习】我国是世界上严重缺水的国家之一,城市缺水问题较为突出•某市政府为了节约用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的按平价收费,超过a的按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理?你认为为了较为合理地确定出这个标准,需要做什么工作?解析:由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况•假设通过抽样,我们获得了100位居民某年的月均用水量(单位:t):100位居民的月均用水量(单位:t )3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2回0.40.30.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.50.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.70.64.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.90.8回3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.80.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.60.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.50.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.70.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2从上面这些数字,我们很容易发现居民的月均用水量的最小值是0・2t,最大值是4・3t・其他在0.2〜4・3 •很难再发现其他信息•我们很难从随意记录的数据中直接看出规律•为此,我们需要对统计数据进行整理与分析•这就用到了我们今天学习的频率分布直方图.提升总结:画频率分布直方图的步骤:1・求极差(即一组数据中最大值与最小值的差),知道这组数据的变动范围是4. 3-0. 2=4. 1 (t)•2.决定组距与组数(将数据分组).组距:指每个小组的两个端点的距离.组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组. 组= ±1 = 8.2组距0.53.将数据分组.(8. 2取整,分为9组)4.列出频率分布表.(学生填写需一栏)5•画出频率分布直方图.注意(1)第几组频率二第几组频数样本容量频率(2)纵坐标二组距100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5 , 1)80.08[1 , 1.5)150」5 [1.5,2)220.22 [2,2.5)250.25 [2.5,3)140」4 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02100位居民月均用水量的频率分布表频率组距注:小长方形的面积二组距X =频率. 各长方形的面积总和等于L课堂训练1.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17. 5~18 岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56. 5, 64. 5]的学生人数是( )A. 20B. 30C. 40D. 50C2・(2013 •福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40, 50), [50, 60), [60, 70), [70, 80), [80, 90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600 名,据此估计,该模块测试成绩不少于60分的学生人数为(B)A. 588B. 480C. 450D. 1203・(2013 •陕西高考)对一批产品的长度(单位: 加加)进行抽样检测,右下图为检测结果的频率分布直方图. 根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25, 30)上的为二等品,在区间[10,⑸和[30, 35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为(m mA. 0. 09B. 0. 20C. 0. 25D. 0. 454•观察新生婴儿的体重,其频率分布直方图如图所示, 则新生婴儿体重在(2 700,3 000)内的频率为:_Q 丄.△Xi 2 400 2 700 3 0003 300 3 600 3 9000. 001.体重/g0 5. (2014 •江苏高考)设抽测的树木的底部周长均在区间[80, 130] ±,其频率分布直方图如图所示,则在抽测的60株树木中,有 _____ 株树木的底部周长小于100cm. 80 90 100 110 120 130/cm0.030 0.025 0.020 0.015 0.010 24课堂小结1.会用样本的频率分布估计总体分布. 2•会画频率分布直方图、频率分布折线图.名言警句行动与不满足是进步的第一必需品.。

必修三2.2.用样本估计总体(教案)

必修三2.2.用样本估计总体(教案)

2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。

如何用样本的频率分布直方图估计总体的数字特征

如何用样本的频率分布直方图估计总体的数字特征

如何用样本的频率分布直方图估计总体的数字特征
题目1:某校从500名12岁的男孩中用随机抽样的方式抽出120人,将其身高(单位:cm)分成九段 :[)122126,,[)126130,,[)130140,,…,[)154158,后,得到如下表格:
有人绘制了如下的样本频率分布表和频率分布直方图如下,请你观察信息,回答问题:但是
(1)频率分布直方图中有些矩形的“高”的数据并不明显,请你计算从左到右的第2、4、6、7、8个矩形的“高”。

它们分别为: 、 、 、 、 。

(2)根据频率分布直方图:
①估计这500名学生身高的众数;②估计这500名学生身高的中位数;
③估计这500名学生身高的平均值。

④估计身高小于134cm的人数占总人数的百分比。

⑤估计身高超过148cm的人数占总人数的百分比。

解:(1)样本频率分布表如右: 第2个矩形的“高” 第4个矩形的“高” 第6个矩形的“高” 第7个矩形的“高” 第8个矩形的“高”
(2)
cm )
题目2:为了了解高一学生的体能
(1)第二小组的频率是多少?样本
容量是多少?
(2)若次数在110以上(含110次)
为达标,试估计该学校全体高一
学生的达标率是多少?
在这次测试中,学生跳绳次数的众数
和中位数、平均数各是多少?。

2015高中数学必修3课件 2.2用样本估计总体.1

2015高中数学必修3课件 2.2用样本估计总体.1

目录 退出
第十六页,编辑于星期五:十二点 十三分。
[120,125) 11 0.11 0.022
[125,130) 6 0.06 0.012
[130,135] 2 0.02 0.004
合计
100 1 0.2
注:表中加上“
频率 组距
”一列,这是为画频率分布直方图准备的,因为
它是频率分布直方图的纵坐标.
第二十二页,编辑于星期五:十二点 十三分。
(2)频率分布直方图如图所示:
目录 退出
第二十三页,编辑于星期五:十二点 十三分。
(3)成绩在[75.5,80.5)的学生人数占成绩在[70.5,80.5)的学生人 数的12,因为成绩在[70.5,80.5)的频率为 0.2,所以成绩在[75.5,80.5)的 频率为 0.1.成绩在[80.5,85.5]的学生人数占成绩在[80.5,90.5)的学生 人数的12,因为成绩在[80.5,90.5)的频率为 0.32,所以成绩在[80.5,85.5) 的频率为 0.16.
迁移与应用
下图是某公司 10 个销售店某月销售某产品数量(单位:台)的茎 叶图,则数据落在区间[22,30)内的频率为( )
A.0.2 答案:B
1 89
2 12279 3 003
B.0.4
C.0.5
D.0.6
解析:∵数据总个数 n=10,
又落在区间[22,30)内的数据个数为 4, ∴所求的频率为140=0.4.
目录 退出
第二十九页,编辑于星期五:十二点 十三分。
在频率分布直方图中,如不作特别说明,纵轴表示频 组率 距,各长方形 的面积表示各组的频率,各长方形的面积之和为 1.
目录 退出
第三十页,编辑于星期五:十二点 十三分。

2015年高考数学(理)总复习精品课件:第16章第2讲用样本估计总体

2015年高考数学(理)总复习精品课件:第16章第2讲用样本估计总体

第2讲用样本估计总体[匚口亘』由室厶过去.1 •用样本估计总体通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的分布,另_种是用样本的数字特征估计总体的数字特征2.统计图(1)频率分布直方图:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5〜极差12组.组距=组数.③将数据分组:通常对组内数值所在区间取左闭右开区间.最后一组取闭区间•也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映上个数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的频率组距,这样得到一系列的长方形,每个长方形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于1 .(2)频率分布折线图和总体密度曲线:①频率分布折线图:连接频率分布直方图中各长方形上端的中点,就得频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线.⑶茎叶图:当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有佶息,而址可以随时记录,给数据的记录和表示都带来方便.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数:①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:样本数据的算术平均数,即T- -(^i+^+-+xj④在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差:①标准差(其中/是样本数据的第〃项,n是样木容量,匚是平均数).②标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.嶷础自测1.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图16-2-1),设甲、乙两组数据的平均数分别为匚甲,匚乙,中位数分别为加甲,m乙则()A.兀甲v x乙,m甲>加乙B.X甲vx乙,m甲V加乙C.兀甲>兀乙,m甲>加乙D.兀甲>兀乙,m甲V加乙屮乙8650 88400102 875 2202 3 3 78 0 03 1 2 4 4 83 1423 8图16-2-1根据平均数的概念易计算出兀甲< 兀乙,又加甲 甘=29.故选B.解析: =20 9 m (18 + 22 2答案:B2•某一网络公司为了调查一住宅区连接互联网情况,从该住宅区28 000住户中随机抽取了 210户进行调查,调查数据如 图16-2-2,则估计该住宅区已接入互联网的住户数是(C )户数f已接■未接[]图 16-2-25500 6554A.90B.1200C. 12 000D. 14 000新住户住户类型3.(2013年湖北)从某小区抽取100户居民进行月用电量调发现其用电量都在50到350度之间,频率分布直方图如图16-2-3 所示.(1)直方图中兀的值为0.0044 ;(2)在这些用户中,用电量落在区间[100,250)内的户数为704•甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是(C )A.甲B.乙C.丙D.T解析:由表可知,乙、丙的平均成绩最好,平均环数为8.9 ;但乙的方差大,说明乙的波动性大,所以丙为最佳人选,故选C.5.(2012年湖南)如图1624是某学校一名篮球运 动员在五场比赛中所得分数的茎叶图,则该运动员在 这五场比赛中得分的方羞为6.8 .注:方差¥ =厂工)2 + (兀2_工)2+•••+(%厂工几其中工为兀1,X2,…,%”的平均数) 解析:工=*(8+9+10+13+15)= 11,s2 = £[(8 —11)2 + (9—11)2 + (10—11)2 + (13—11)2 + (15 — 11)2] = 6.8.0 8 910 3 5图 1624考点1频率分布直方图的绘制及其应用例1:某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:(1)求出表中字母加,巧M, N所对应的数值;(2)在给出的直角坐标系中画出频率分布直方图(图16・2・5);⑶估计该校高一女生身高在149.5〜165.5 cm范围内有多少人?频率*0.070.050.040.030.020.01——1----- 1 ------ 1 ----- 1 ----- 1 ----- 1 --------- ►145.5149.5 153.5 157.5 161.5 165.5 1695 身高/cm图16-2-5Q解:(1)由题意M=Q-J^=50,落在区间165.5〜169.5内数据频数m = 50 - (8 + 6+ 14 + 10 + 8) = 4 ,频率为〃 =0.08,总频率N 二1.00.(2)频率分布直方图如图D57 :⑶该所学校高一女生身高在149.5〜165.5 cm 之间的比例 为0.12 +0.28 + 0.20 + 0.16 = 0.76 ,则该校高一女生在此范围内 的人数为450x0.76 = 342(人).【方法与技巧】用频率分布直方图解决相关问题时,应正 确理解图表中各个量的意义,识图掌握信息是解决该类问题的率分布直方图中各长方形高的比也就是其频率之比;③直方图 中每一个矩形的面积是样本数据落在这个区间上的频率,所有 的小矩形的面积之和等于1,即频率之和为].关键.频率分布直方图有以下几个要点:①纵轴表示频率解析:根据题意,频率分布表可得:答案为A. 答案:A考点2茎叶图的应用例2: (2012年陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图16-2-7),则该样本的中位数、 解析:根据茎叶图可知样本中共有30个数据,中位数为46 ,出现次数最多的是45 ,最大数与最小数的差为68 - 12 = 56. 故选A.答案:A众数、极差分别是(A. 46,45,56B. 46,45,53C. 47,45,56D ・45,47,53 1 25 2 02 3 3 3 124489 4 55 5778 89 5 0011479 6 178 图 16-2-7【方法与技巧】(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.【互动探究】2•图16・2・8是某学生的数学考试成绩茎叶图,第1次到14 次的考试成绩依次记为41,A2,…,Ay•图16-2-9是统计茎叶图中成绩在一定范围内考试次数的一个算法流程图•那么算法流程图输出的结果是____________11 4图16-2-8解析:算法流程图输出的数表示考试成绩中大于或等于90 分的次数.答案:10解:⑴记甲被抽到的成绩为X ,乙被抽到成绩为y ,用数对(兀/ y)表示基本事件.从甲、乙两人的成绩中各随机抽取一个,则共有(5,6) , (5,7),(5,8) , (5,9) , (6,6) , (6,7) , (6,8) , (6,9) , (9,6) , (9,7) , (9,8) , (9,9), (10,6) ,(10,7) , (10,8) , (10,9) , 16 种结果.记甲的成绩比乙咼为事件4,则4 包含(9,6) , (9,7) , (9,8) , (10,6) , (10,7) , (10,8) , (10,9)7有7种结果…;P(4)=话⑵甲的成绩平均数x 1 = ~上字一 =7.5,乙 的成绩平均数 厂=6+7 丁 8+9 = 75甲的成绩方差:° (5-7.5)2+(6-7.5)2 + (9-7.5)2 + (10-7.5)2‘ . s ] == 4.25, 乙的成绩方差: ](6-7.5)2+(7—7.5)2 + (8—7.5)2+(9—7.5)2】•••选派乙运动员参加决赛比较合适. 2 2S> 2 1 S 9【方法与技巧】(1)众数体现了样本数据的最大集中点,但无法客观的反映总体特征.(2)中位数是样本数据所占频率的等分线.(3)标准差、方差描述了一组数据围绕平均数波动的大小. 标准差、方差越大,数据越分散;标准差、方差越小,数据越集中.【互动探究】3.(2013年辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为10 .难点突破O统计图与离散型随机变量的分布列的结合在高考中常以频率分布直方图或茎叶图的形式出现考查离散型随机变量的分布列及方差问题,这也是近几年高考出题的热点问题.例题:(2012年广东广州高中毕业班综合测试)如图16210 所示的茎叶图记录了甲、乙两个小组(每小组4人)在期末考试中的数学成绩•乙组记录中有一个数据模糊,无法确认,在图中以G表示•已知甲、乙两个小组的数学成绩的平均分相同.⑴求G的值;(2)求乙组四名同学数学成绩的方差;(3)分别从甲、乙两组同学中各随机选取一名甲组9 7乙组879a 3X,求随机变量X的分布列和均值(数学期望). 图16210同学,记这两名同学数学成绩之差的绝对值为 6 6解:⑴依题意,得|x(87 + 89 + 96+96)=|x (87+90+^+93+95),解得0 = 3.(2)根据已知条件,可以求得两组同学数学成绩的平均分都为7=92.所以乙组四名同学数学成绩的方差为『=*87 —92)2+(93 - 92)2+ (93 - 92)2+(95 一92)2]=9.(3)分别从甲、乙两组同学中各随机选取一名同学,共有4X4 =16(种)可能的结果.这两名同学成绩之差的绝对值X的所有情况如下表:所以X的所有可能取值为0,123,4,6,&9.1 2 1由表,可得P(X=O)=J^, P(X=1)=J^, P(X=2)=话,P(X4 2 3 1= 3)=吋P(X=4)=厉,P(X=6)=吋P(X=8)=厉,P(X=9) 2所以随机变量X的分布列为:随机变量X的数学期望为E(X) = OX 寻+1X 磊+ 2X 害+3X 磊+ 4X 磊+ 6><乖+1 2 68_178X T6+9X16=l6_ 4 ・。

用样本估计总体

用样本估计总体
样本容量
组数
总体密度曲线
各个范围内取值的百分比
总体在
用样本的数字特征估计总体的数字特征 众数、中位数、平均数 众数:在一组数据中,出现次数 的数据叫做 这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的 . 平均数:样本数据的算术平均数.即 = .
题型三
思维启迪
解析
探究提高
用样本的数字特征估计总体的数字特征
题型分类·深度剖析
题型三
思维启迪
解析
探究提高
用样本的数字特征估计总体的数字特征
题型分类·深度剖析
D
思想方法·感悟提高
方 法 与 技 巧
思想方法·感悟提高 失 误 与 防 范
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
最多
最中

中位数
(2)样本方差、标准差 标准差s= 其中xn是 ,n是 , 是 . 是反映总体波动大小的特征数,样本方差是 标准差的 .通常用样本方差估计总体方差,当 时,样本方差很接近总体方差.
2
3
4
5
6
7
8
9
1
练出高分
解 析
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
1,1,3,3
A组 专项基础训练

9.5 用样本的频率分布估计总体分布课件-2023届广东省高职高考数学第一轮复习第九章概率与统计初步


A.甲
B.乙
C.丙
D.丁
【解析】 因为丙的平均数最大,方差最小,故选 C.
8.在学校组织的一次技能竞赛中,某班学生
成绩的频率分布直方图如图所示,若低于 60
分的有 12 人,则该班学生的人数为( B )
A.35
B.40
C.45
D.50
第 8 题图
【解析】 如图所知:低于 60 分的频率为 20×(0.005+0.010)=0.3, 设该班有学生 n 人,则1n2=0.3,解得 n=40,故选 B.
=0.4×40=16,故选 D.
4.某同学进行技能训练,录得近五次的训练成绩分别为:88,84,86,
85,87,则这组数据的方差为( A )
A.2
B.3
C.4
D.9
【解析】 因为x-=x1+x2+x53+x4+x5=86,所以,方差 s2=n1[(x1-x-)2

(x2


x
)2



(xn


二、填 空 题
9.将一个容量为 m 的样本分成 3 组,已知第 1 组的频数为 8,第 2 和第 3 组的频率为 0.15 和 0.45,则 m=___2_0__. 【解析】 由题意得,第一组的频率为m8 ,则m8 +0.15+0.45=1,解得 m=20.
10.容量为 100 的样本数据,按从小到大的顺序分为 8 组,如下表: 组号 1 2 3 4 5 6 7 8 频数 10 13 14 14 15 13 12 9
9.5 用样本的频率分布估计总体分布
知识点1 知识点2
1.用样本的频率分布估计总体 (1)频数与频率 将一组数据按要求分成若干个组,各组内数据的个数叫做该组的频 数,每组的频数除以全体数据的个数的商叫做该组的频率,频率反 映数据在每组中所占比例的大小.

14-15版:1.5 用样本估计总体(创新设计)

§5用样本估计总体5.1估计总体的分布5.2估计总体的数字特征[学习目标]1.学会列频率分布表,会画频率分布直方图;2.会用频率分布表或分布直方图估计总体分布,并作出合理解释;3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.[知识链接]1.已知函数f(x)=-x2-2x+3,则函数的单调递增区间为(-∞,-1),单调递减区间为(-1,+∞).2.已知一组数分别为:2,3,5,7,8,10,11,则其中位数为7;数据2,3,5,7,8,10,则其中位数为6.3.在数据2,2,3,4,4,5,5,6,7,8中众数为2,4,5.4.一组数据的和除以数据的个数所得到的数叫做这组数据的平均数.例如,数据1,2,3,3,4,5的平均数为3.[预习导引]1.用样本估计总体的两种情况(1)用样本的分布估计总体的分布.(2)用样本的数字特征估计总体的数字特征.2.频率分布直方图在频率分布直方图中,纵轴表示f iΔx i,数据落在各小组内的频率用频率直方图的面积来表示,各小长方形的面积的总和等于1.3.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.要点一频率分布直方图的绘制例1调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165 171169167169151168170168160174 165168174159167156157164169180 176157162161158164163163167161(1)作出频率分布表;(2)画出频率分布直方图.解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:(2)频率分布直方图如图所示.规律方法 1.组数的决定方法是:设数据总数目为n,一般地,当n≤50,则分为5~8组;当50≤n≤100时,则分为8~12组较为合适.2.分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.3.画频率分布直方图小长方形高的方法是:假设频数为1的小长方形的高为h,则频数为k的小长方形高为kh.跟踪演练1美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解(1)以4为组距,列表如下:(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.要点二频率分布直方图的综合应用例2为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?解(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.规律方法频率分布直方图的性质:(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)样本容量=频数/相应的频率.跟踪演练2(2013·福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120答案B解析不少于60分的学生的频率为(0.030+0.025+0.015+0.010)×10=0.8,∴该模块测试成绩不少于60分的学生人数应为600×0.8=480.要点三频率分布与数字特征的综合应用例3已知一组数据:125121123125127129125128130129 126124125127126122124125126128(1)填写下面的频率分布表:(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 解 (1)(2)(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数:x -=122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x -=125.75.规律方法 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边的中点; (2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和. 2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致. 跟踪演练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生成绩的众数、中位数.(2)高一参赛学生的平均成绩.解(1)由图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,x-=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67.1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是() A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案C解析由用样本估计总体的性质可得.2.频率分布直方图中,小长方形的面积等于()A .组距B .频率C .组数D .频数 答案 B解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.3.(2013·岳阳高一检测)某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,知频率=0.02×5=0.1.∴0.1×100=10人.4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n 的值为( )A .640B .320C .240D .160 答案 B解析 依题意得40n =0.125,∴n =400.125=320.5.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.答案1000.15解析设参赛的人数为n,第二小组的频率为0.4,依题意40n=0.4,∴n=100,优秀的频率=0.10+0.05=0.15.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同,这一现象其原因就在于样本的随机性.在随机抽样中,这种偏差是不可避免的.如果抽样的方法比较合理,那么样本可以反映总体的信息,特别是当样本容量很大时,这种反映比较接近总体的真实情况.。

高考数学总复习第十章算法初步统计与统计10.3用样本估计总体市赛课公开课一等奖省名师优质课获奖PPT


15/29
-16考点1
考点2
考点3
对点训练1(1)(山东枣庄一模)为了解本市居民生活成本,甲、乙、
丙三名同学利用假期分别对三个小区进行了“家庭每个月日常消
费额”调查.他们将调查所得到数据分别绘制成频率分布直方图(如
图所表示),甲、乙、丙所调查数据标准差分别为s1,s2,s3,则它们大
小关系为 (
)
个数中位数是1.75与1.77平均数,即为1.76.
关闭
1.76
解析
答案
11/29
-12考点1
考点2
考点3
考点 1
频率分布直方图及其应用
例1某城市100户居民月平均用电量(单位:千瓦时),以
[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,30
14/29
-15考点1
考点2
考点3
思索频率分布直方图有哪些性质?怎样利用频率分布直方图求众
数、中位数与平均数?
解题心得1.频率分布直方图性质.
频率
(1)小长方形的面积=组距×
组距
=频率;
(2)各小长方形的面积之和等于 1;
频率
1
组距
组距
(3)小长方形的高=
,所有小长方形的高的和为
.
2.要了解并记准频率分布直方图与众数、中位数及平均数关系.
中位数相等,则65=60+y,所以y=5.
又两组数据平均值相等,所以56+62+65+70+x+74=59+61+67+65+78,解
关闭
得x=3.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档