必修三221用样本的频率分布估计总体分布课件共35张PPT

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合计
频数累计
频数
4

8
正正正
15
正 正 正 正 22
正 正 正 正 正 25
正正
14
正一
6
4
2
100
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
知识探究(二):频率分布直方图
5 画频率分布直方图 为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用 下面的图形表示:
题.
解 (1)样本频率分布表如下:
分组
[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158)
合计
频数 频率
5
0.04
8
0.07
10
0.08
22
0.18
33
0.28
20
0.17
11
总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是 研究总体分布的工具.
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无 限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范 围内取值百分比。
思考
1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以 被非常准确地画出来?
频率 组距
2.图中阴影部分的面积表示什么?
0
a
b
月均用水量/t
2.总体在范围(a,b)内取值的百分比
频率 组距
0
a
b
月均用水量/t
引例
NBA某赛季甲、乙两名篮球运动员每场比赛的得分 的原始纪录如下: 甲运动员得分:13,51,23,8,26,38,16,33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
假如增至10000呢?
(2)样本容量越大,这种估计越精确。
总体密度曲线
当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线—— 总体密度曲线.
频率 组距
总体密度曲线
月均用水量 /t
a
b
(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。
总体密度曲线
频率分布的表示形式有:①样本频率分布表 ②样本频率分布图
样本频率分布直方图 ③样本频率分布折线图
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活 用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过 a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民的月均用水量如 下表(单位:t):
频率 组距
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距
0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长 方形的宽度和高度在数量上有何特点?
率分布表(5)画频率分布直方图
1.极差:样本数据中的最大值和最小值的差称为极差
0.2~4.3 2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少 组?
(4.3-0.2)÷0.5=8.2 8.2取过剩整数值,分为9组
3 将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如 何设定?
[0,0.5),[0.5,1),[1,1.5), …,[4,4.5].
4 画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这 些数据用表格反映出来吗?
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
问题一:请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较.
分组
[0,10) [10,20) [20,30) [30,40) [40,50) [50,60)
频率分布表
频数


甲(11)
1
0
0.09
3
2
0.27
3
2
0.27
3
6
0.27
0
2
0.00
1
1
0.09
频率 乙(13) 0.00 0.15 0.15 0.46 0.15 0.08
2+4+17+15+9+3
频率分布直方图如下:
频率 组距
连接频率分布直方图中各小长方形上端的 中点,得到频率分布折线图
0.5 0.4 0.3 0.2
月均用水量/t 0.10
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估计 (1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?
①如果希望大部分居民的日常生活不受影响,那么标准 a 定为多少比较合理呢? ②为了较合理地确定这个标准,你认为需要做哪些工作?
显然:这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有: 频率分布表和频率分布直方图
画频率分布表和频率分布直方图其一般步骤为: (1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频
各小组内的频率大小,因此第二小组的频率为:
4
第二小组频数
=0.08;又因为频率=

2+4+17+15+9+3
样本容量
所以样本容量=第 第二 二小 小组 组频 频数 率=01.028=150.
(2) 由 图 可 估 计 该 学 校 高 一 学 生 的 达 标 率 约 为 17+15+9+3 ×100%=88%.
0.09
6
0.05
5
0.04
120
1
探要点、究所然
(2)其频率分布直方图如下:
(3)由样本频率分布表可知身高小于 134 cm 的男孩出现的频 率为 0.04+0.07+0.08=0.19,所以我们估计身高小于 134 cm 的人数占总人数的 19%.
探要点、究所然
跟踪训练 2 为了了解高一学生的体能情况,某校抽取部分 学生进行一分钟跳绳次数测试,将所得数据整理后,画出
0.03 0.025
0.02 0.015
0.01 0.005
0
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
0.05 0.04 0.03 0.02 0.01
0
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
问题二:用上次课所学的制作样本的频率分布直方图来分析好吗? 甲:13,51,23,8,26,38,16,33,14,28,39; 乙:49,24,12,31,50,31,44,36,15,37,25,36,39.
频率分布
根据随机抽取样本的大小,分别计算某 一事件出现的频率,频率的分布规律 (取值状况),就叫做样本的频率分布。
思考:样本频率分布与总体频率分 布有什么关系?
通过样本的频数分布、频率分布可 以估计总体的频率分布.
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。
所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。
3 3.5
4 4.5
频率分布直方图
频率 组距
月均用水量最多的在哪 几个区间?
0.50 0.40 0.30 0.20 0.10
0.5
月均用水量/t
1 1.5 2 2.5
3 3.5
4 4.5
3 分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太 清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一 些数据特点吗?
频率分布直方图
频率 组距
各个小长方形的面积=?
0.50 0.40 0.30 0.20 0.10
0.5
频率
月均用水量/t
1 1.5 2 2.5
3 3.5
4 4.5
频率分布直方图
频率 组距
小长方形的面积总和=?
0.50 0.40 0.30 0.20 0.10
0.5
1
月均用水量/t
1 1.5 2 2.5
频率分布直方图(如图),图中从左到右各小长方形面积之 比为 2∶4∶17∶15∶9∶3,第二小组频数为 12. (1)第二小组的频率是多少?样本容量是多少? (2)若次数在 110 以上(含 110 次)为达标,试估 计该学校全体高一学生的达标率是多少?
探要点、究所然
解 (1)由于频率分布直方图以面积的形式反映了数据落在
频率 组距
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;
必修三221用样本的频率 分布估计总体分布课件共
35张PPT
统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况 去估计总体的相应情况. 统计的核心问题:
如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:
一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、分析, 对总体的情况作出推断.
(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
探要点、究所然
跟踪训练 1 下表给出了某校 500 名 12 岁男孩中用随机抽样 得出的 120 人的身高(单位:cm).
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)
人数
5
8
10
22
33
区间界限 [142,146) [146,150) [150,154) [154,158)
人数
20
11
6
5
(1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计身高小于 134 cm 的人数占总人数的百分比.
探要点、究所然
分析 根据样本频率分布表、频率分布直方图的一般步骤解
当数据比较少时,应用列分布直方图反而不方便
简化制图格式和步骤,得到新的统计制图方法:
甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;
乙运动员得分:49,24Leabharlann Baidu12,31,50,31,44, 36,15,37,25,36,39.
茎叶图 (一种被用来表示数据的图)
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数, 即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这
实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我 们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。
由于样本是随机的,不同的样本得到的频率分布折线图不同;即使是同一样本,不同的分组得 到的频率分布折线图也不同。
也就是说:频率分布折线图是随着样本的容量和分组情况的变化而变化的,因此不能由样本的 频率分布折线图得到准确的总体密度曲线。
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
整体介绍:
用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计 总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。
复习 频数与频率 将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。 每组数据的个数除以全体数据个数的商叫做该组的频率。
相关文档
最新文档