用样本估计总体2
第2节用样本估计总体

法二 (数据分布法)从茎叶图看,从小到大看,甲的每个数据都比乙对应的 数据小,所以甲的平均数较小;甲的数据在(70,80)内有3个,(80,90)内有2 个,90以上的有1个; 而乙的数据在(70,80)内有1个,(80,90)内有3个,90以上的有2个. 显然乙的数据分布较为集中,所以乙的方差较小.故选D.
第2节用样本估计总体
考纲展示 1.了解分布的意义和作用,能根据 频率分布表画频率分布直方图、 频率折线图、茎叶图,体会它们各 自的特点. 2.理解样本数据标准差的意义和 作用,会计算数据标准差. 3.能从样本数据中提取基本的数 字特征(如平均数、标准差),并做 出合理的解释.
4.会用样本的频率分布估计总体分 布,会用样本的基本数字特征估计总 体的基本数字特征,理解用样本估计 总体的思想. 5.会用随机抽样的基本方法和样本 估计总体的思想解决一些简单的实 际问题.
用茎叶图表示数据的优点是(1)所有的信息都
4.样本的数字特征
数
字 特
定义
征
特点
在一组数据中出 体现了样本数据的最大集中点,
现次数最多的数 不受极端值的影响,而且可能不
据
唯一
将一组数据按大 小顺序依次排列, 处在最中间位置 中位数不受极端值的影响,仅利
反映了各个样本数据聚集
标准差是样本数据到 于样本平均数周围的程度
(A)该校九年级学生1分钟仰卧起坐的次数的中位数为26.25 (B)该校九年级学生1分钟仰卧起坐的次数的众数为27.5 (C)该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320 (D)该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应 的数值,是26.25,故A对;众数是最高矩形的中间值27.5,故B对;1分钟仰卧 起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30 的人数为320,故C对;1分钟仰卧起坐的次数少于20的频率为0.1,所以估 计1分钟仰卧起坐的次数少于20的人数为160,故D错.故选D.
用样本频率分布估计总体分布第二课

1
用样本的频率分布估计 总体分布(二)
2
回顾
画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表
五、画出频率分布直方图(纵轴表示频率/组距)
7
新课讲解
频率分布折线图
频率/组距
0.50
0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
连接频率直方图中各小长方形上端中点的折线,叫 频率分布折线图
8
当样本容量无限增大,分组的组距无限缩小,那 么频率分布折线图就会无限接近一条光滑曲线
0.00047 0
0.00033 0.0002
频率/组距 0.0014
0.0012
0.001
0.0008
0.0006
0.0004
0.0002
0
26
750 1050 1350
16510
1950 2250 2550
理论迁移
例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
第九章 第二节 用样本估计总体

4.(2010·安徽高考 某市 . 安徽高考)某市 安徽高考 某市2010年4月1日~4月30日对空气污 年 月 日 月 日对空气污 染指数的监测数据如下(主要污染物为可吸入颗粒物 : 染指数的监测数据如下 主要污染物为可吸入颗粒物): 主要污染物为可吸入颗粒物 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86, 81,83,82,82,64,79,86,85,75,71,49,45.
本题条件不变, 本题条件不变,由频率分布表与频率分布直方图能否判 断本月对空气污染指数的监测的数据众数和中位数落在 哪个小组内? 哪个小组内? 解:由频率分布表及直方图可判断众数和中位数均在 [81,91]这一组内,证明该市空气质量基本良好. 这一组内,证明该市空气质量基本良好. 这一组内
[归纳领悟 归纳领悟] 归纳领悟 1.频率分布表和频率分布直方图是一组数据频率分布的两 . 种形式,前者准确,后者直观. 种形式,前者准确,后者直观. 频率 2.频率分布直方图中横坐标表示组距,纵坐标表示 .频率分布直方图中横坐标表示组距, , 组距 频率 频率=组距× . 频率=组距× 组距 3.频率分布直方图中各小长方形的面积之和为 .频率分布直方图中各小长方形的面积之和为1.
[究 疑 点] 究 1.在频率分布直方图中,中位数、众数与平均数如何确定? .在频率分布直方图中,中位数、众数与平均数如何确定? 提示:在频率分布直方图中, 提示:在频率分布直方图中,中位数左边和右边的直 方图的面积相等,由此可以估计中位数的值, 方图的面积相等,由此可以估计中位数的值,而平均 数的估计值等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和. 乘以小矩形底边中点的横坐标之和.众数是最高的矩 形的中点的横坐标. 形的中点的横坐标. 2.频率分布直方图中纵轴的含义是频率吗? .频率分布直方图中纵轴的含义是频率吗? 提示:不是.表示的是频率 组距 组距. 提示:不是.表示的是频率/组距.
2.2用样本估计总体2课件人教新课标

例 (2015·广东)某城市100户居民的月平均用电量(单位: 度 ) , 以 [160,180) , [180,200) , [200,220) , [220,240) , [240,260) , [260,280) , [280,300] 分 组 的 频 率 散 布 直 方 图 如 图.
. . . . . . . . . 0.04
0
0.5
1
1.5
2
2.5
3
0.04 0.02
3.5
4
4.5
0.5 0.75 1.25 1.75 2.25 2.75 3.25 3.75 4.25
2.02
月均用水量/t
频率 组距
0.6
频率分布直方图 提示:中位数左边的 数据个数与右边的数 据个数是相等的。
0.5
0.4
0.25
0.3 0.22
0.2 0.15
0.1
0.08
0.04
0
0.5
1
1.5
2
0.14
0.06 0.04 0.02
2.5
3
3.5
4
4.5
月均用水量/t
频率
频率分布直方图
组距
0.6 前四个小矩形的 面积和=0.49
.22
0.2 0.15
0.1
0.08
0.04
成绩 频数 频率 频率/组距
[7.5,8.5) 2 0.2
0.2
[8.5,9.5) 5 0.5
0.5
[9.5,10.5] 3 0.3
0.3
合计 10 1
频率/组距
0.5
高二数学下第四讲 用样本估计总体2(正稿)

第四讲 用样本估计总体一.高考大纲要求1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、 茎叶图,理解它们各自的特点/理解样本数据标准差的意义和作用,会计算数据标 准差及方差/能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合 理的解释/会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体 的基本数字特征,理解用样本估计总体的思想/会用随机抽样的基本方法和样本估 计总体的思想,解决一些简单的实际问题.2.会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系/了解最小 二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程/了解独立 性检验(只要求2×2列联表)的基本思想、方法简单应用/了解假设检验的基本思 想、方法简单应用/了解聚类分析的基本思想、方法简单应用.二.知识梳理1.频率分布直方图:(1)通常我们对总体作出的估计一般分成两种,一种是用 体的分布.另一种是用 .(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用形的面积表示.各小长方形的面积总和 .(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 随着 的增加,作图时所分的 增加,相应的频率分布折线图就会越 来越接近于一条光滑的曲线,统计中称之为 ,它能够更加精细的 反映出 .(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以 , 而且 ,给数据的 和 都带来方便. 2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数:众数:在一组数据中,出现次数 的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个 数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数.即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该 . (2)样本方差、标准差:标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] ,其中x n 是 ,n 是 ,x 是 .标准差是反映总体波动大小的特征数,样本方差是标准差的 .通常用样本方差估 计总体方差,当 时,样本方差很接近总体方差.3.两个变量的线性相关:(1)正相关:在散点图中,点散布在从 到 的区域内,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:点散布在从 到 的区域内,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.4.回归方程 (1)最小二乘法:求回归直线使得样本数据的点到它的 的方法叫做最小二乘法.(2)回归方程:方程^y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b =∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y∑i =1n x 2i-n x 2a =y -b x其中x =1n ∑i =1n x i ,y =1n ∑i =1nx i ,(x ,y )称为样本中心点.5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 ,像这类变量称为分 类变量.(2)列联表:列出两个分类变量的 ,称为列联表,假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:2×2列联表构造一个随机变量K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n = 为样本容量.(3)独立性检验:利用随机变量 来确定是否能以一定把握认为“两个分类变量 ”的方法称为两个分类变量的独立性检验.三.思考提问1.总体平均数与总体方差分别反映了总体的什么特征,有哪些区别?提示:总体平均数即总体期望值,是反映总体平均水平的一个值;而总体方差是反映总体的波动情况的一个量,二者反映的角度不同,不可相互比较,但有些问题在总体期望值差距不大时,可考虑用总体方差进一步区分.2.在独立性检验中经常由K2得到观测值k,则k=K2吗?提示:K2与k的关系并不是k=K2,k是K2的观测值,或者说K2是一个随机变量,它在a,b,c,d取不同值时,K2可能不同,而k是取定一组数a,b,c,d后的一个确定的值.四.典例剖析题型一频率分布直方图【例1】为了解某校初中毕业男生的体能状况.从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1米)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.(1)请将频率分布直方图补充完整;(2)该校参加这次铅球测试的男生有多少人?(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球测试的成绩的合格率;(4)在这次测试中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗?反思感悟:用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距.(2)频率分布直方图中各长方形高的比也就是其频率之比.(3)直方图中第一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.迁移发散1.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6至5.0之间的学生数为b,则a、b的值分别为A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83题型二茎叶图【例2】某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430, 434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407, 410,412,415,416,422,430(1)作出数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.反思感悟:茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.迁移发散2.下图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()A.304.6 B.303.6 C.302.6 D.301.6题型三样本的特征数【例3】某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:反思感悟:善于总结,养成习惯:平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定.迁移发散3.在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”,根据过去10天,甲乙丙丁四地新增疑似病例数据,一定符合该标志的是() A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3题型四 相关关系的判断【例4】 山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x 对产量y 影响的试验,得到如下表所示的一组数据(单反思感悟:善于总结,养成习惯:判断两个变量正相关还是负相关,有三种方法:(1)利用散点图;(2)利用相关系数r 的符号.当r >0时,正相关;r <0时,负相关;(3)在已知两变量线性相关时,也可以利用回归方程y ^=a +bx .当b >0时,y ^=a +bx 是增函数,两变量是正相关,当b <0时,y ^=a +bx 是减函数,两变量是负相关.迁移发散4.某市居民2005~2009年家庭平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与 平均支出有________线性相关关系.题型五线性回归方程【例5】一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?反思感悟:善于总结,养成习惯:对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相关性检验,在确认具有线性相关关系后,再求其回归直线.迁移发散5.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:(1)y与x间是否有线性相关关系?若有,求出线性回归方程;(2)估计使用年限为10年时的维修费用.题型六独立性检验【例6】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),反思感悟:善于总结,养成习惯:所谓独立性检验,就是根据采集样本的数据,先作2×2列联表,再利用公式计算K2的值,比较它与临界值的大小关系,来判断事件X与Y是否有关的问题.迁移发散6.(2010·辽宁理,18)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(2)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)(ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(ⅱ)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)五.课后小结1.应了解简单随机抽样、系统抽样和分层抽样的操作方法和理论依据,分层抽样即按比例抽样.2.频率分布直方图:频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.(1)估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)(2)估计中位数:中位数把频率分布直方图分成左右两边面积相等.(3)估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.了解利用样本估计总体平均值和方差的基本思想方法.4.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b ,常数项为a ,这与一次函数的习惯表示不同).5.回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间是 否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察值, 预测变量的取值及判断变量取值的变化趋势;③求出回归直线方程.6.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随 机变量,对假设的正确性进行判断.六 家庭作业(高考回顾)一、选择题 1.(2011年四川高考)有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 1l [31.5,35.5) 12 [35.5.39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是A .16 B .13C .12D .23 2.(2011年陕西高考)设(1x ,1y ),(2x ,2y ),…,(n x ,n y )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以 下结论中正确的是 A .x 和y 的相关系数为直线l 的斜率 B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(,)x y3.5 根据上表可得回归方程ˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 4.(2011年江西高考)变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则A .210r r <<B .210r r <<C .210r r <<D .21r r= 5.(2011年湖南高考)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下由()()()()()22n ad bc K a b c d a c b d -=++++算得,()22110403020207.860506050K ⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是 A .再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B .再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C .有99%以上的把握认为“爱好该项运动与性别有关” D .有99%以上的把握认为“爱好该项运动与性别无关” 二、填空题6.(2011年天津高考)一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为___________7.(2011年辽宁高考)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:321.0254.0ˆ+=x y .由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加____________万元.8.(2011年江苏高考)某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差___2=s9.(2011年广东高考)某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_____cm . 三、解答题10.(2011年北京高考)以下茎叶图记录了甲、乙两组个四名同学的植树棵树。
必修三2.2.用样本估计总体(教案)

必修三2.2.用样本估计总体(教案)必修三2.2.用样本估计总体(教案)导语:本文为必修三2.2.用样本估计总体(教案)的教学指南,旨在引导学生了解和应用样本估计总体的方法。
通过学习本课,学生将能够理解抽样和样本的基本概念,并能够运用点估计和区间估计的方法进行总体参数的估计。
为了达到良好的教学效果,本教案采用了多样的教学方法,例如引导讨论、示例演示和小组合作等。
一、教学目标:1. 理解样本与总体的概念和关系;2. 掌握点估计的方法;3. 了解区间估计的原理和应用;4. 能够进行样本估计总体的实际问题分析。
二、教学过程:1. 导入(5分钟)引导学生思考以下问题:什么是样本?什么是总体?样本和总体之间有什么关系?为什么需要用样本来估计总体?2. 点估计的方法(15分钟)a. 讲解点估计的基本原理,即通过样本数据来估计总体参数的值。
b. 示例演示:设计一个问题,如某班级数学考试成绩的平均分。
用班级中的五位同学的成绩作为样本,通过计算样本的平均分来估计全班的平均分。
c. 引导学生讨论点估计的优点和缺点。
3. 区间估计的方法(15分钟)a. 讲解区间估计的概念和原理,即通过样本数据构造一个置信区间来估计总体参数的范围。
b. 示例演示:使用同样的例子,构造一个置信水平为95%的置信区间,来估计全班的平均分。
c. 引导学生讨论区间估计的优点和缺点。
4. 实际问题分析(25分钟)a. 设计一个实际问题,例如某个城市的人均收入。
要求学生提出估计该城市人均收入的方法和步骤,并结合点估计和区间估计的方法进行分析。
b. 小组合作:分组讨论,每个小组根据实际问题设计一个解决方案,并准备向全班汇报。
c. 汇报与讨论:每个小组轮流汇报他们的解决方案,并进行讨论。
5. 总结与延伸(10分钟)a. 概括本课内容,强调样本估计总体的方法和应用。
b. 提出延伸问题,鼓励学生进一步探索样本估计总体的其他应用领域。
三、教学反思:本节课通过引导讨论、示例演示和小组合作等多种教学方法,促使学生自主思考和应用样本估计总体的方法。
必修三2.2.用样本估计总体(教案)

2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
高中数学必修3《用样本的数字特征估计总体的数字特征(二)》导学案

数学(高二上)导学案必修三第二章第二节课题:用样本估计总体二、合作探究归纳展示任务1 标准差问题平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677如果你是教练,你应当如何对这次射击作出评价?思考1甲、乙两人本次射击的平均成绩分别为多少环?答经计算得:x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.思考2观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示 . 思考5 所谓“平均距离”,其含义如何理解?答 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是S =|x 1-x |+|x 2-x |+…+|x n -x |n .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 任务2 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n ·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么? 答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[(7-7)2+(8-7)2+…+(4-7)2]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案 6.8任务3标准差及方差的应用例2画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.解四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.跟踪训练2从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.44的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.四、作业布置 1、基础知识:1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13B .2,1C .4,13D .4,3答案 D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频率分布直方图如下:
频率 组距
0.50 0.40 0.30 0.20 0.10
0.5
平均数 1.973
1 1.5 2 2.5 3 3.5 4
月均用水量 /t
4.5
问题:
有两位射击运动员在一次射击测试中 各射靶十次,每次命中的环数如下: 甲 7 8 7 9 5 4 9 10 7 4 乙9578768 6 77
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t
4.5
2、在样本中,有50%的个体小于或等于中 位数,也有50%的个体大于或等于中位数.
频率分布直方图如下:
频率 组距
0.50 0.40 0.30 0.20 0.10
0.5
中位数 2.03
1 1.5 2 2.5 3 3.5 4
月均用水量 /t
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横
坐标为样本数据尺寸,纵坐标为频率/组距.)
茎叶图、频率分布表与频率分布直方图的比较
(1)都是用来描述样本数据的分布情况的。
(2)茎叶图由所有的样本数据构成,没有损失任何样本 信息;同时,茎叶图中的数据可以随时记录,随时添加, 方便记录与表示(这对于教练员发现运动员现场状态特 别有用).但当样本的数据较多时,枝叶就会很长,茎 叶图就显得不太方便;
经理 管理人员 高级技工 工人 学徒 合计
2200 250
220
200 100
16
5
10 1 23
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中位数、 平均数
(2)这个问题中,工资的平均数能客观地反映 该厂的工资水平吗?为什么?
(加权平均数)
分析:众数为200,中位数为220,平均数为300。
上面表里的17个数据可看成是按从小到大的顺序 排列的,其中第9个数据1.70是最中间的一个数据,即 这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米).
例1 某工厂人员及工资构成如下:
人员 周工资 人数 合计
因平均数为300,由表格中所列出的数据可见,只 有经理的周工资在平均数以上,其余的人都在平均数以 下,故用平均数不能客观真实地反映该工厂的工资水平。 用这些特征数据对总体进行估计的优缺点是什么?
平均数、中位数、众数都是描述数据的“集中趋势” 的“特征数”,它们各自特点如下:
用平均数作为一组数据的代表,比较可靠和稳定,它 与这组数据中的每一个数都有关系.对这些数据所包 含的信息的反映最为充分,因而应用最为广泛,特别 是在进行统计推断时有重要作用,但计算较繁琐,并 且易受极端数据的影响.
如果你是教练,你应当如何对这次射击情 况作出评价?如果这是一次选拔性考核,你应 当如何作出选择?
两人射击 的平均成绩是一样的. 那么两个 人的水平就没有什么差异吗?
频率 0.3
0.2
0.1 频率
4 5 6 7 8 9 10
(甲)
0.4 0.3 0.2 0.1
4 5 6 7 8 9 10 (乙)
(3)频率分布表与频率分布直方图则损失了样本的一些 信息,必须在完成抽样后才能制作。
2.2.2 用样本估计总体(2)
1、用样本频率分布估计总体分布 2、用样本数字特征分布估计总体数字特征
问题:
高二某班同学在老师的布置下,用单摆进行测试, 以检验重力加速度.全班同学两人一组,在相同条件 下进行测试,得到下列实验数据(单位:m/s2): 9.62 9.5 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
4.5
说明:
2.03这个中位数的估计值,与样本的 中位数值2.0不一样,这是因为样本数据 的频率分布直方图,只是直观地表明分 布的形状,但是值往往与样本的实 际中位数值不一致.
3、平均数是频率分布直方图的“重 心”,是直方图的平衡点.
用众数作为一组数据的代表,可靠性较差,但众数不 受极端数据的影响,并且求法简便,当一组数据中个 别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”.
用中位数作为一组数据的代表,可靠性也较差,但中 位数也不受极端数据的影响,也可选择中位数来表示 这组数据的“集中趋势”.
二 、众数、中位数、平均数与频率分布直方图 的关系
怎样用这些数据对重力加速度进行估计?
一、众数、中位数、平均数的概念
一般地,n个数据按大小顺序排列,处于最中间 位置的一个数据(或最中间两个数据的平均数)叫做 这组数的中位数(median).
一组数据中出现次数最多的那个数据叫做这组数 的众数(mode).
平均数(算术平均数)是指资料中各观测值的 总和除以观测值个数所得的商,简称平均数或均数.
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(最高的矩形的中点)2.25
0.50 0.40 0.30 0.20 0.10
绘制频率分布直方图步骤?
第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (取整)
组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组数=
极差 组距
4.1 0.5
8.2
第三步: 将数据分组 ( 给出组边界)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
练习: 在一次中学生田径运动会上,参加 男子跳高的17名运动员的成绩如下表所示:
成绩 (单位:米)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最 多,即这组数据的众数是1.75.