用样本估计总体(频率分布直方图、平均数、方差等)课案

合集下载

高中数学《总体分布的估计》教案1(1) 新人教A版必修3

高中数学《总体分布的估计》教案1(1) 新人教A版必修3

总体分布的估计(1)用样本的数字特征估计总体的数字特征教学目标:知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。

(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。

(3)会用样本的基本数字特征估计总体的基本数字特征。

(4)形成对数据处理过程进行初步评价的意识。

过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。

情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。

重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。

难点:能应用相关知识解决简单的实际问题。

教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。

——用样本的数字特征估计总体的数字特征(板出课题)。

【探究新知】<一>、众数、中位数、平均数〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。

例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。

高中数学必修二 (教案)用样本估计总体

高中数学必修二  (教案)用样本估计总体

用样本估计总体【第一课时】【教学目标】1.会画一组数据的频率分布表、频率分布直方图.2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.3.掌握求n个数据的第p百分位数的方法.【教学重难点】1.频率分布表、频率分布直方图.2.用样本估计总体.3.总体百分位数的估计.【教学过程】一、问题导入预习教材内容,思考以下问题:1.绘制频率分布表和频率分布直方图有哪些步骤?2.频率分布直方图有哪些特征?3.如何求n个数据的第p百分位数?二、基础知识1.频率分布表、频率分布直方图的制作步骤及意义2.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.三、合作探究1.频率分布表、频率分布直方图、频率分布折线图的绘制角度一:频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以4频率累计频率分布直方图和频率分布折线图如图所示.(1)在列频率分布表时,极差、组距、组数有如下关系: ①若极差组距为整数,则极差组距=组数;②若极差组距不为整数,则极差组距的整数部分+1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.角度二:频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少? (3)样本中不达标的学生人数是多少? (4)第三组的频数是多少?【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12. 所以样本中不达标的学生人数为150×0.12=18(人).(4)第三小组的频率为172+4+17+15+9+3=0.34.又因为样本量为150,所以第三组的频数为150×0.34=51.频率分布直方图的应用中的计算问题 (1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)频数样本量=频率,此关系式的变形为频数频率=样本量,样本量×频率=频数.2.条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题: (1)求抽取的学生数;(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比. 【解】(1)从统计图上可以看出,喜欢收听于丹析《庄子》的男生有20人,女生有10人; 喜欢收听《故宫博物院》的男生有30人,女生有15人; 喜欢收听于丹析《论语》的男生有30人,女生有38人; 喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为106 300,由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有106300×3 000=1 060(人).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为45300×100%=15%.(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.3.折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1)护士每隔几小时给小明测量一次体温?(2)近三天来,小明的最高体温、最低体温分别是多少?(3)从体温看,小明的病情是在恶化还是在好转?(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10凌晨6时出院.(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.4.扇形统计图下图是A ,B 两所学校艺术节期间收到的各类艺术作品的情况的统计图: (1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2)已知A 学校收到的剪纸作品比B 学校的多20件,收到的书法作品比B 学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?【解】(1)不能.因为两所学校收到艺术作品的总数不知道.(2)设A 学校收到艺术作品的总数为x 件,B 学校收到艺术作品的总数为y 件,则⎩⎨⎧10%x -5%y =20,50%y -40%x =100,解得⎩⎨⎧x =500,y =600,即A 学校收到艺术作品的总数为500件,B 学校收到艺术作品的总数为600件.(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.5.百分位数的计算试求甲、乙两组数的25%分位数与75%分位数.【解】因为数据个数为20,而且20×25%=5,20×75%=15.因此,甲组数的25%分位数为x5+x62=2+32=2.5;甲组数的75%分位数为x15+x162=9+102=9.5.乙组数的25%分位数为x5+x62=1+12=1,乙组的75%分位数为x15+x162=10+142=12.求百分位数时,一定要将数据按照从小到大的顺序排列.【课堂检测】1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为()A.0.1B.0.2C.0.3 D.0.4解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.3.观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.【第二课时】 【教学目标】1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的众数、中位数、平均数.2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准差.【教学重难点】会用样本的基本数字特征来估计总体的基本数字特征.【教学过程】一、基础知识1.众数、中位数、平均数 众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.2.方差、标准差标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x .二、合作探究1.众数、中位数、平均数的计算(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为()A.85,85,85B.87,85,86C.87,85,85D.87,85,90(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为() A.2,5B.5,5C.5,8D.8,8答案(1)C(2)C解析(1)平均数为100+95+90×2+85×4+80+7510=87,众数为85,中位数为85.(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为9+15+10+y+18+245=16.8,所以y=8,所以x,y的值分别为5,8.【教师小结】平均数、众数、中位数的计算方法:平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.2.标准差、方差的计算及应用甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?解(1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.【教师小结】(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.三、课堂总结1.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.【课堂检测】1.某市2017年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是( )A .19B .20C .21.5D .23答案 B解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B .2.下列关于平均数、中位数、众数的说法中正确的一个是( )A .中位数可以准确地反映出总体的情况B .平均数可以准确地反映出总体的情况C .众数可以准确地反映出总体的情况D .平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况答案 D3.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得的数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差答案 D4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84, a 2=80+4+4+6+4+75=85,故选B . 5.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.答案 16解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.。

用样本的频率分布估计总体分布教案

用样本的频率分布估计总体分布教案

用样本的频率分布估计总体分布教案教案:用样本的频率分布估计总体分布一、教学目标:1.了解频率分布的概念和作用;2.学会使用频率分布来估计总体分布;3.掌握构建频率分布表的方法;4.能够利用频率分布表对总体进行估计。

二、教学内容:1.频率分布的概念和作用2.构建频率分布表的方法3.利用频率分布表对总体进行估计三、教学过程:一、频率分布的概念和作用(10分钟)1.频率分布是指对一组数据中各个数值出现的次数进行统计,从而得到数值的分布情况。

2.频率分布的作用是可以帮助我们了解数据的分布规律,从而对总体进行估计。

二、构建频率分布表的方法(30分钟)1.确定数据的分组区间:首先需要确定分组的宽度,即把数据分为若干个区间。

常用的方法有等宽分组和等频分组。

2.计算各个分组的频数:统计每个区间内数据的个数。

3.计算各个分组的频率:将各个分组的频数除以总样本数量,得到各个分组的频率。

4.制作频率分布表:将各个分组的上界、下界、频数和频率列成表格。

三、利用频率分布表对总体进行估计(40分钟)1.利用频率分布表进行估计的方法有两种:直接估计和间接估计。

2.直接估计是通过频率分布表直接读取各个分组的频率来估计总体分布。

3.间接估计是通过频率分布表的图形化表示来估计总体分布,常用的图形有直方图和折线图。

4.对于直方图,可以通过观察分布的形状和峰值来估计总体的分布情况。

5.对于折线图,可以通过观察分布曲线的形状来估计总体的分布情况。

四、练习和小结(20分钟)1.让学生根据给定的数据,完成频率分布表的构建。

2.让学生根据给定的频率分布表,进行总体分布的估计。

3.对学生进行小结和概念回顾,检查他们对于频率分布和总体估计的理解程度。

四、教学反思:通过本节课的教学,学生能够了解频率分布的概念和作用,掌握构建频率分布表的方法,以及利用频率分布表对总体进行估计的方法。

在教学过程中,可以利用实际案例和练习来加深学生对于频率分布和总体估计的理解。

必修三2.2.用样本估计总体(教案)

必修三2.2.用样本估计总体(教案)

2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。

用样本估计总体

用样本估计总体
返回
解析:甲比赛得分旳中位数为28,乙比赛得分旳中位 数为36,所以甲、乙两人比赛得分旳中位数之和为28 +36=64. 答案: 64
返回
4.(2023·台州联考)甲、乙两个体能康复训练小组各有 10名组员,经过一段时间训练后,某项体能测试成 果旳茎叶图如图所示,则这两个小组中体能测试平 均成绩较高旳是________组.
返回
[自主解答] (1)当X=8时,由茎叶图可知,乙组同学的植树棵数 是:8,8,9,10, 所以平均数为: x =8+8+49+10=345; 方差为:s2=14×[(8-345)2+(8-345)2+(9-345)2+(10-345)2]=1116.
返回
(2)记甲组四名同学为A1,A2,A3,A4,他们植树旳棵 数依次为9,9,11,11; 乙组四名同学为B1,B2,B3,B4,他们植树旳棵数依 次为9,8,9,10.分别从甲、乙两组中随机选用一名同学, 全部可能旳成果有16个: (A1,B1),(A1,B2),(A1,B3),(A1,B4), (A2,B1),(A2,B2),(A2,B3),(A2,B4), (A3,B1),(A3,B2),(A3,B3),(A3,B4), (A4,B1),(A4,B2),(A4,B3),(A4,B4),
返回
2.对原则差与方差旳了解: 原则差、方差描述了一组数据围绕平均数波动旳大 小.原则差、方差越大,数据旳离散程度越大,原则 差、方差越小,数据旳离散程度越小,因为方差与原 始数据旳单位不同,且平方后可能夸张了偏差旳程度, 所以虽然方差与原则差在刻画样本数据旳分散程度上 是一样旳,但在处理实际问题时,一般多采用原则差.
学生旳体重情况,将所得旳数据整顿后,画出了频率 分布直方图(如图),已知图中从左到右旳前3个小组旳 频率之比为1∶2∶3,第2小组旳频数为12,则报考飞 行员旳学生人数是________.

《用样本估计总体》 讲义

《用样本估计总体》 讲义

《用样本估计总体》讲义在我们的日常生活和各种研究领域中,常常会遇到需要了解某个总体情况的情况,但由于总体规模过大、难以全面测量或成本过高,这时就需要通过抽取样本并用样本的特征来估计总体的特征。

这就是我们所说的“用样本估计总体”。

一、为什么要用样本估计总体想象一下,要了解一个城市所有居民的收入水平,直接去调查每一个人几乎是不可能的任务。

但如果我们从这个城市中随机抽取一部分居民进行调查,通过对这部分样本的分析,就能够对整个城市居民的收入情况有一个大致的了解。

用样本估计总体的好处主要有以下几点:1、降低成本:全面调查总体往往需要耗费大量的时间、人力和物力,而抽取样本进行调查则可以大大降低这些成本。

2、提高效率:样本调查可以在较短的时间内完成,更快地获得结果。

3、具有可行性:对于一些大规模、无限的总体,如全国消费者的喜好,全面调查是不现实的,样本估计则成为唯一可行的方法。

二、样本与总体的关系样本是从总体中抽取的一部分个体或观察值,而总体则是我们所关心的所有个体或观察值的集合。

样本应该具有代表性,能够反映总体的特征。

为了确保样本的代表性,抽样的方法就显得至关重要。

常见的抽样方法有简单随机抽样、分层抽样和系统抽样等。

简单随机抽样是最基本的抽样方法,每个个体被抽取的概率相等。

例如,从一个装有编号为 1 到 100 的球的箱子中,随机抽取 10 个球,每个球被抽到的机会相同。

分层抽样则是将总体按照某些特征分成不同的层次,然后从每个层次中独立地进行抽样。

比如要调查一个学校学生的学习情况,可以按照年级分层抽样。

系统抽样是按照一定的规则抽取样本,比如从 1000 个学生中抽取50 个,可以先将学生编号,然后每隔 20 个抽取一个。

三、样本的特征样本具有一些可以描述和测量的特征,如均值、方差、标准差、中位数、众数等。

均值就是样本中所有数据的平均值,它反映了样本数据的集中趋势。

例如,一个班级学生的考试成绩样本为 80、85、90、95、100,其均值就是(80 + 85 + 90 + 95 + 100) / 5 = 90 分。

用样本估计总体(频率分布直方图、平均数、方差等)

用样本估计总体(频率分布直方图、平均数、方差等)

s2
1 10
4 (2 5)2
2 (5 5)2
4 (8 5)2
7.2
3.(2015 江苏苏州市高三上调考)如图是小王
所做的六套数学附加题得分(满分 40)的茎叶
图,则其平均得分为 .
JSY33
第 3 题图
【考点】茎叶图.
【答案】 31.
【分析】 根据茎叶图的数据,得;
数据的平均分为
x = 18 28 30 32 38 40 =31. 6
55、在公路发展的早期,它们的趋势还能顺从地貌,即沿河流或森林的边缘发展。可 如今,公路已无所不在,狼、熊等原本可以自由游荡的动物种群被分割得七零八落。 与大型动物的种群相比,较小动物的种群在数量上具有更大的波动性,更容易发生杂 居现象。这段话主要讲述的是 。 A.公路发展的趋势 B.公路对动物的影响 C.动物生存状态的变化 D.不同动物的不同命运
56、从3月下旬到10月上旬,太阳在地球上直射位置的移动规律是: A.赤道→南回归线→赤道 B.赤道→北回归线→赤道 C.南回归线→赤道→北回归线
D.人权是个人权利和集体人权的统一
67、在觅食过程中,成百上千只蚂蚁在蚁穴和食物所在处之间来来往往,最终都能够 在相对最短时间内得到食物,却从来不会有拥堵现象出现。德国科学家赫尔冰发现, 避免道路拥堵是基于蚂蚁之间的交流。在一条路有可能出现拥堵时,返回的蚂蚁就向 迎面过来的同伴发出信息素,让它选择另一条路。他认为,人类可以采取相同方法减 少车辆拥塞现象。
这段文字的主旨是 。
A.城市发展面临危机 B.城市是人类文明的中心所在 C.城市的演进伴随着各种问题 D.城市要健康发展必须积极有效地应对各种挑战
69、1983年,沃伦和马歇尔发现人的胃内有幽螺菌(HP),并分离培养成功,为常见的 胃病病因和诊治作出了划时代的贡献。世界上约1/3人口感染HP,我国感染率较高, 儿童占50%以上,成人占70%以上。HP主要通过口口传播,也可经中介物如餐具、牙 具或患者排泄物污染他人的手或食物从而导致感染。防止儿童感染HP,在防止青少年 胃病,促进儿童健康成长和社会公共卫生等方面都有重大意义。

9.2用样本估计总体

9.2用样本估计总体

授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。

(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

考点2 用样本估计总体(频率分布直方图、平均数、方差等)1. (15泰州一模)若数据2,x ,2,2的方差为0,则x=.【考点】极差、方差与标准差. 【答案】2【分析】因为数据2,x ,2,2的方差为0,由其平均数为64x+,得到22166320444x x x ⎡⎤++⎛⎫⎛⎫-+-=⎢⎥⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦,解得x =2. 2.(15江苏高考压轴)样本容量为10的一组数据,它们的平均数是5,频率如图所示,则这组数据的方差等于 .第2题图 cqn17【答案】7.2【分析】2出现100.44⨯=次,5出现100.22⨯=次,8出现100.44⨯=次,所以222214(25)2(55)4(85)7.210s ⎡⎤=⨯-+⨯-+⨯-=⎣⎦ 3.(2015江苏苏州市高三上调考)如图是小王所做的六套数学附加题得分(满分40)的茎叶图,则其平均得分为 .JSY33第3题图 【考点】茎叶图. 【答案】31.【分析】根据茎叶图的数据,得; 数据的平均分为x =1828303238406+++++=31.故答案为:31.4.(淮安都梁中学2015届高三10月调研)某校为了解2015届高三同学寒假期间学习情况,抽查了100名同学,统计他们每天平均学习时间,绘成频率分布直方图(如图).则这100名同学中学习时间在6~8小时内的同学为 人.zl085 第4题图【考点】频率分布直方图;用样本的频率分布估计总体分布. 【答案】30【分析】∵这100名同学中学习时间在6~8小时外的频率为 (0.04+0.12+0.14+0.05)×2=0.7∴这100名同学中学习时间在6~8小时内为1-0.7=0.3∴这100名同学中学习时间在6~8小时内的同学为100×0.3=30.5.(徐州市2014届高考信息卷)甲、乙两个学习小组各有10名学生,他们在一次数学测验中成绩的茎叶图如图所示,则在这次测验中成绩较好的是 组. 【考点】茎叶图.第5题图 zl060【答案】甲【分析】甲的平均分为6374798183848686889081.410x +++++++++==甲,5864677475767679808273.110x +++++++++==乙;x x >乙甲,且甲的成绩多集中在80分上,乙的成绩多集中在70分上,∴甲组的成绩较好些; 故答案为:甲.6. (南通市2015届高三第三次调研)为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在[]50,150中,其频率分布直方图如图所示.已知在[50 75),中的频数为100,则n的值为.zl071第6题图【考点】考查简单统计知识,直方图,频率.【答案】1000【分析】由频率分布直方图得在[50 75),之间的频率与组距比值为0.004,由题这区间的频数为100,组距为25,则10010000.00425n==⨯.7.(2015高考冲刺压轴卷江苏试卷一)某校的一次英语听力测试中用以下茎叶图记录了甲、乙两组各5名学生的听力成绩(单位:分).第7题图FGQ26已知甲组数据的众数为15,乙组数据的中位数为17,则x、y的值分别为________.【考点】茎叶图.【答案】5,7【分析】根据茎叶图知,甲组数据是9,15,10+x,21,27;∵它的众数为15,∴x=5;同理,根据茎叶图知乙组数据是9,13,10+y,18,27,∵它的中位数为17,∴y=7.故x、y的值分别为:5,7.8.(15南京师大附中高三上学期12月月考数学试卷)对某种花卉的开放花期追踪调查,调查情况如表:花期(天) 11~13 14~16 17~19 20~22个数20 40 30 10则这种卉的平均花期为________天.【考点】众数、中位数、平均数.【答案】16【分析】由表格知,花期平均为12天的有20个,花期平均为15天的有40个,花期平均为18天的有30个,花期平均为21天的有10个, ∴这种花卉的评价花期是122015401830211016100⨯+⨯+⨯+⨯≈.9. (15南京市湖滨中学高三上学期10月学情检测数学试卷)如图,是某班一次竞赛成绩的频数分布直方图,利用组中值可估计其的平均分为 .Abc2 第9题图【考点】频率分布直方图.【答案】62【分析】由频数分布直方图得,总人数是2+4+6+8+10=30人,利用组中值可估计其的平均分为:210430650107089030⨯+⨯+⨯+⨯+⨯ =62.10. (15宿迁市沭阳县银河学校高三上学期开学试卷)如果数据1x ,2x ,3x ,…,n x 的方差是a ,若数据31x ﹣2,32x ﹣2,33x ﹣2,…,3n x ﹣2的方差为9,则a = .【考点】极差、方差与标准差. 【答案】1【分析】根据题意,设数据1x ,2x ,…,n x 的平均数设为x , ∴方差2s =1n[21()x x -+22()x x -+…+2()n x x -]=a ; ∴数据31x ﹣2,32x ﹣2,…,3n x ﹣2的平均数为3x ﹣2, 方差2S =1n[21(3232)x x --++22(3232)x x --++…+2(3232)n x x --+] =9·1n[21()x x -+22()x x -+…+2()n x x -]=9a =9; ∴a =1.11. (2015·扬州中学模拟)如图是某小组在一次测验中的数学成绩的茎叶图,则平均成绩是________.JSY147 第11题图【答案】78【分析】该小组的平均成绩是61697377848696787++++++=.12. (2015·南京、盐城模拟)某地区教育主管部门为了对该地区模拟考试成绩进行分析,随机抽取了150分到450分之间的1 000名学生的成绩,并根据这1 000名学生的成绩画出样本的频率分布直方图(如图),则成绩在[300,350)内的学生共有________人.JSY148 第12题图【答案】300【分析】由频率分布直方图可得成绩在[300,350)的频率是1-(0.001+0.001+0.004+0.005+0.003)×50=1-0.7=0.3,所以成绩在[300,350)的学生人数是0.3×1 000=300.13. (2015·无锡模拟)甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图(如图),则他们在这次测验中成绩较好的是________组.JSY149 第13题图【答案】甲【分析】依题意,注意到将甲、乙两组的10名同学的成绩均由小到大排列,可看出甲组的10名同学的成绩均不低于相应位置乙组的10名同学的成绩,因此他们在这次测验中成绩较好的是甲组.14. 在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为________.【答案】32【分析】由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1,∴x=0.2,故中间一组的频数为160×0.2=32.15. 如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为________.JSY150 第15题图【答案】0.2【分析】由频率分布直方图可知,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的上网人数的频率成递减的等差数列分布,所以年龄在[35,40)的网民出现的频率为0.2.16. (2015·苏、锡、常、镇四市调研)样本容量为100的频率分布直方图如图所示,由此估计样本数据落在[6,10]内的频数为________.JSY151 第16题图【答案】32【分析】由直方图可得样本数据落在[6,10]内的频率是0.08×4=0.32,又样本容量是100,所以频数为0.32×100=32.17. (2015·启东中学模拟)某学校为了解该校600名男生的百米成绩(单位:s),随机选择了50名学生进行调查,如图是这50名学生百米成绩的频率分布直方图.根据样本的频率分布,估计这600名学生中成绩在[13,15](单位:s)内的人数大约是________.JSY152 第17题图【答案】120【分析】依题意,可估计这600名学生中成绩在[13,15](单位:s)内的人数大约是600×(0.02+0.18)=120.18. 某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是________.JSY153 第18题图【答案】1【分析】当x ≥4时,898992939291946409177++++++=≠,∴x <4,则89899293929190917x +++++++=,∴x =1.19. (2015·扬州检测)某校从高一年级学生中随机抽取100名学生,将他们期中考试的数学成绩(均为整数)分成六段:[40,50),[50,60),…,[90,100]后得到频率分布直方图(如图所示),则分数在[70,80)内的人数是________.JSY154 第19题图【答案】30【分析】这些学生中分数在[70,80)内的人数是100×[1-(0.005+0.010+0.015×2+0.025)×10]=30.。

相关文档
最新文档