2.2.1(1)用样本的频率分布估计总体分布

合集下载

人教高中数学必修三2.2.1用样本的频率分布估计总体分布课件

人教高中数学必修三2.2.1用样本的频率分布估计总体分布课件

频率散布直方图以面积的情势反应了数据落在 各个小组的频率的大小.
作业
1、课时训练 P73 2、探究咱班学生的身高
散布情况 3、探究频率散布折线图和
总密度曲线
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
画频率散布直方图
频率/组距
注意:
① 这里的纵坐标不是频率, 而是频率/组距;
0.50 0.40
0.50 ② 某个区间上的频率用
0.44
这个区间矩形的面积表示;
2.2.1用样本的频率散布 估计总体散布
学习目标
1、理解并学会画频率散布表; 2、掌握频率散布直方图的画法,
并能理解在频率散布直方图 中用面积表示频率。
一、复习回顾
1.我们已经学习了哪些抽样的方法?
简单随机抽样
系统抽样
分层抽样
随机抽样是收集数据的方法,如何通过 样本数据所包含的信息,估计总体的基 本特征,即用样本估计总体,是我们需 要进一步学习的内容.
二、样本估计总体的方法
一般分成两种: ①用样本的频率散布估计总体的散布. ②用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
• 我国是世界上严重缺水的国家之一。
如何划在本市试
行居民生活用水定额管理,即确定一个居民月用 水量标准a , 用水量不超过a的部分按平价收费,超 过a的部分按议价收费。
思考:由上表,大家可以得到什么信息?
三、样本分析
一般通过表、图、计算来分析 数据,帮助我们找出样本数据中的 规律,使数据所包含的信息转化成 直观的容易理解的情势。

课件5:2.2.1 用样本的频率分布估计总体分布

课件5:2.2.1 用样本的频率分布估计总体分布
(2)由于每个品种的数据都只有 25 个,样本不大,画茎叶图很 方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便 于比较,没有任何信息损失,而且还可以随时记录新的数据.
(1)数形结合思想是中学数学很重要的思想方法,是高考的重点 考查内容之一,是根据数据的结构特征,构造出与之相应的几 何图形,并利用图形的特性和规律,解决问题. (2)画茎叶图时,用中间的数表示数据的十位和百位数,两边的 数分别表示两组数据的个位数.要先确定中间的数取数据的哪 几位,填写数据时边读边填.比较数据时从数据分布的对称性、 稳定性等几方面来比较.
9
0.225
14
0.35
3
0.075
[173.5,177.5)
3
0.075
[177.5,181.5]
1
0.025
合计
40
1
(2)频率分布直方图如图所示.
本例中,画出相应的频率分布折线图. 解:连接频率分布直方图中各小长方形上端的中点,就得到频 率分布折线图如下:
(1)在列频率分布表时,极差、组距、组数有如下关系 ①若极 组差 距为整数,则极 组差 距=组数; ②若极 组差 距不为整数,则极 组差 距的整数部分+1=组数.
合计
频数 3 9 13 16 26 20 7 4 2 100
频率 0.03 0.09 0.13 0.16 0.26 0.20 0.07 0.04 0.02 1.00
(2)频率分布直方图及频率分布折线图,如图.
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为 1- (0.03 + 0.09) - (0.07 + 0.04 + 0.02) = 0.75 = 75% , 即 数 据 落 在 [10.95,11.35)范围内的可能性是 75%. (4)数据小于 11.20 的可能性即数据小于 11.20 的频率,设为 x, 则(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15), 所以 x-0.41=0.13,即 x=0.54, 从而估计数据小于 11.20 的可能性是 54%.

2.2.1用样本的频率分布估计总体分布课件人教新课标

2.2.1用样本的频率分布估计总体分布课件人教新课标

4. 茎叶图的概念 茎是指 中间的一列数 ,叶就是从茎的旁边生长出 来的数.茎叶图可用来分析单组数据,也可以对两组数 据进行比较.茎叶图不仅能够保留原始数据,而且能够 展示数据的散布情况.
【常考题型】
列频率散布表、画频率散布直方图 [例 1] 考察某校高二年级男生的身高,随机抽取 40 名 高二男生,实测身高数据(单位:cm)如下: 171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161 (1)作出频率分布表; (2)画出频率分布直方图和频率分布折线图.
(2)频率分布直方图和频率分布折线图如图所示:
(3)样本数据不足 0 的频率为: 0.035+0.055+0.075+0.2=0.365.
频率散布直方图的应用
[例 2] (1)某班 50 名学生在一次百米跑 测试中,成绩全部介于 13 s 与 19 s 之间,将 测试结果按如下方式分成六组:第一组,成 绩大于等于 13 s 且小于 14 s;第二组,成绩 大于等于 14 s 且小于 15 s;…;第六组,成 绩大于等于 18 s 且小于等于 19 s,如图所示是按上述分组方法 得到的频率分布直方图.设成绩小于 17 s 的学生人数占全班 总人数的百分比为 x,成绩大于等于 15 s 且小于 17 s 的学生人 数为 y,则从频率分布直方图(如图所示)中分析出 x 和 y 分别 为( )
3.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90 分以上)是________,最低分是________.

2.2.1 用样本的频率分布估计总体分布(1)

2.2.1 用样本的频率分布估计总体分布(1)

0.020 0.053 0.060 0.073 0.067 0.033 0.027
频率分布直方图如下:
频率 组距 0.070 0.060 0.050
0.040
0.030 0.020 0.010
12.5 15.5
练习
1. 已知一组数据如下: 25 21 23 25 27 29 25 28 30 29 26 24 25 27 26 22 24 25 26 28 填写下面的频率分布表,绘出频率分布直方图. 组别 频数累计 频数 频率
率,你能用公式表示出样本容量、频数 和频率之间的关系吗?各组的频数和等 于几?各组的频率和呢?
(1) f i
ti n
(2)t1 t 2 ... t n n
(3) f 1 f 2 ... f n 1
小结
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 4.1 8.2 3、 将数据分组(8.2取整,分为9组)
例2 有一个容量为50的样本数据的分组的频数
如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9
[24.5, 27.5) [27.5, 30.5)
10 5
[30.5, 33.5)
4
[21.5, 24.5) 11
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?

2.2.1用样本的频率分布估计总体分布

2.2.1用样本的频率分布估计总体分布

分 组 [0,0.5) [0,0.5) [0.5, [0.5,1) [1,1.5) [1,1.5) [1.5, [1.5,2) [2,2.5) [2,2.5) [2.5, [2.5,3) [3,3.5) [3,3.5) [3.5, [3.5,4) [4, [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1 上述100个数据中的最大值和最 思考1:上述100个数据中的最大值和最 100 小值分别是什么? 小值分别是什么?由此说明样本数据的 变化范围是什么? 变化范围是什么? 0.2~ 0.2~4.3 思考2:样本数据中的最大值和最小值 思考2 的差称为极差 如果将上述100 极差. 100个数据 的差称为极差.如果将上述100个数据 组距为0.5进行分组 进行分组, 按组距为0.5进行分组,那么这些数据 共分为多少组? 共分为多少组? 4.3-0.2) (4.3-0.2)÷0.5=8.2
上图称为频率分布直方图, 上图称为频率分布直方图,其中横轴 频率分布直方图 表示月均用水量,纵轴表示频率/组距. 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点? 度在数量上有何特点?
思考2 思考2:频率分布直方图中各小长方形的 面积表示什么? 面积表示什么?各小长方形的面积之和 为多少? 为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5

2.2.1用样本的频率分布估计总体分布

2.2.1用样本的频率分布估计总体分布
(2012,江西)
2018/3/9
5、观察新生婴儿的体重,其频率分布直方图
如图所示,则新生婴儿体重(2700,3000)的频
率为: 0.3 y ;
0.001
2400 2700 3000 3300 3600 3900
2018/3/9
X
体重
6.为了了解某地区高三学生的身体发育情况,抽 查了该地区100名年龄为17.5岁-18岁的男生体重 (kg) ,得到频率分布直方图如下:
7.5~9.5 9.5~11.5
11.5~13.5 合计来自6 84 20
0.3 0.4
0.2 1.0
4、一个容量为20的样本数据.分组后.各组与频 数如下:(0,20] 2;(20,30] 3, (30,40] 4; (40,50] 5; (50,60] 4; (60,70] 2 。则样 7/10 , 本在(0,50]上的频率为:
频率分布表、频率分布直方图和折线图 的主要作用是表示样本数据的分布情况,此 外,我们还可以用茎叶图来表示样本数据的 分布情况.
2018/3/9
一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为“茎”(高位)和“叶” (低位)两部分;
第二步, 将最小的茎和最大的茎之间的数按大 小次序排成一列,写在左(右)侧;
频率/组距
0.07
0.05
0.03
体重(kg)
54.5 58.5 62.5 66.5 70.5 74.5
根据上图可得这100名学生中体重在[56.5,64.5] 的学生人数是( C ) A. 20 B. 30 C. 40 D. 50
2018/3/9
7.一个容量为100的样本,数据的分组和各组的相 关信息如下表,试完成表中每一行的两个空格.

用样本估计总体2.2.1用样本的频率分布估计总体分布说课讲解

用样本估计总体2.2.1用样本的频率分布估计总体分布说课讲解
[15.5, 18.5) 8 [18.5, 21.5) 9
[24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4
[21.5, 24.5) 11
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
2.决定组距与组数:组数= 极差 = 组距
4.1 0.5
=
8.2
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
100位居民月平均用水量的频率分布表
5.画频率分布直方图
频率/组距
0.50 0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点 稍微再小一点.
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
总体密度曲线
频率 组距
用样本估计总体
2.2.1用样本的频率分布估计总体分布
统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体, 而是通过从总体中抽取一个样本,根据样本的 情况去估计总体的相应情况.
具体步骤
一是如何从总体中抽取样本?
二是如何根据对样本的整理、计算、分析, 对总体的情况作出推断.(1、用样本频率分布 估计总体分布,2、用样本的某种数字特征 (例如平均数、方差等)去估计总体的相应数 字特征。)

课件6:2.2.1 用样本的频率分布估计总体的分布

课件6:2.2.1 用样本的频率分布估计总体的分布

[思路探索] 根据画频率分布直方图的步骤先画频率分布直方图,再 画折线图.
解 (1)频率分布表如下:
分组
频数 频率
[10.75,10.85)
3Байду номын сангаас
0.03
[10.85,10.95)
9
0.09
[10.95,11.05) [11.05,11.15) [11.15,11.25) [11.25,11.35) [11.35,11.45) [11.45,11.55) [11.55,11.65]
题型二 频率的分布直方图的应用 例2.(1)为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出 了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24, 23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主 任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图 时先计算最大值与最小值的差是________.若取组距为2,则应分成 ________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为 ________. (2)将容量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79, 而剩下的三组中频率依次相差0.05,则剩下的三组中频率最大的一组的 频率为________.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x, 则(x-0.41)÷(11.20-11.15) =(0.67-0.41)÷(11.25-11.15), 所以x-0.41=0.13,即x=0.54, 从而估计数据小于11.20的可能性是54%.
变式3.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年 就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就 任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥 巴马,共44任)给出了历届美国总统就任时的年龄: 57,61,57,57,58,57,61,54,68,51,49,64,50,48, 65,52,56,46,54,49,51,47,55,55,54,42,51,56, 55,51,54,51,60,62,43,55,56,61,52,69,64,46, 54,48 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率 分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5 ] 4
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
频率/ 组距
0.020 0.053 0.060 0.073 0.067 0.033 0.027
0.070 0.060 0.050 0.040 0.030 0.020 0.010
组距
数据落在[15.5,
的百分比是56%
12.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5
24.5)
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估 计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
(2)样本容量越大,这种估计越精确。
(3)当样本容量无限增大,组距无限缩小, 那么频率分布折线图就会无限接近于一条光滑
解 (1)频率分布直方图是以面积的形式反映了数据落在各小组内 的频率大小的,因此第二小组的频率为2+4+17+4 15+9+3=0.08.
第二小组的频数 又因为第二小组的频率= 样本容量 , 所以样本容量=第第二二小小组组的的频频数率=01.028=150. (2) 由 直 方 图 可 估 计 该 校 高 一 年 级 学 生 的 达 标 率 为 2+147++117+5+195++39+3×100%=88%.
创新设计 P42
【变式3】(2012·盐城高一检测)为了了解高一年级学生的体能
情况,某校抽取部分学生进行一分钟跳绳次数测试,将所
得数据整理后,画出频率分布直方图(如图所示),图中从
左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第
二小组的频数为12.
创新设计 P42
(1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,则该校全体高一年 级学生的达标率是多少?
100 1.00
5. 画频率分布直方图:
频率/组距
0.50
注意 纵坐标是 频率/组距
0.40
0.30
0.20
0.10
用水量
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
请所小计有矩算小每形矩个形的小的面矩面积形积=的的组面和距积是×,多它频少代?表率什=1 么频?率为什么? 组距
频率/组距
寿命(h) ( 4 ) 电 子 元 件 寿 命 在
0 100 200300400 500 600
400h以上的频率为0.35
小结
步骤 频率分布直方图
1.求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图
检测
1. 右图是容量为100的
频率
样本的频率分布直方图, 0.09 组距 试根据图中的数据填空: 0.08
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?
通过抽样,我们获得了100位居民某年的月平均用水量 (单位:t) ,如下表:
这些数字告诉我们什么信息?
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
曲线,统计中称这条光滑曲线为总体密度曲 线。
总体密度曲线
频率 组距
月均用 水量/t
ab
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布折线图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
7
0.0875
7/(80×0.19)
5
0.0625
4
0.05
80 1.00
5/(80×0.19) 4/(80×0.19)
5. 画频率分布直方图:
频率/组距
注意 纵坐标是 频率/组距
4/(80× 0.19)
尺寸/cm
O 362.7 362.51
362.89 363.08 363.27 363.46 363.65 363.84 364.02 364.22 364.41
频率分布折线图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
(1)样本数据落在范围
[6,10)内的频率为0__.3_2_;
0.03
(2)样本数据落在范围 0.02
[10,14)内的频数为_3_6__;
O
样本 数据
2 6 10 14 18
(3)总体在范围[2,6)内的
概率约为__0_._0_8__;
2.一个容量为35的样本,分组后,组距与频数如下: [5,10)5,[10,15)12,[15,20)7,[20,25)5,[25,30)4,
(1Байду номын сангаас分)
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,
则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%.
(12分)
【题后反思】 (1)用样本的频率分布估计总体的分布,是 列频率分布表和画频率分布直方图的主要目的,频率分布 表比较准确地反映样本的频率分布,而频率分布直方图则 能直观地反映样本的频率分布. (2)频率分布直方图反映了样本在各个范围内取值的可能 性,由抽样的代表性利用样本在某一范围内的频率,可近 似地估计总体在这一范围内的可能性.
组”,“频数累计”
(可省),“频数”,
“频率”, “频率/组
距””五列,最后一行
是频合率计=
频数 样本容量
注意频数的合计应 是样本容量,频率 合计应是1
频率/组距
4 0.04 0.08
8 0.08 0.16 15 0.15 0.30 22 0.22 0.44 25 0.25 0.50 14 0.14 0.28 6 0.06 0.12 4 0.04 0.08 2 0.02 0.04
P71 第1题
P71 第1题
1.求极差(即一组数据中最大值与最小值的差)
364.41 – 362.51 = 1.9
2.决定组距与组数
组数=
极差 =
组距
1.9 0.19
=
10
组距=0.19
3.将数据分组(左闭右开)
[362.51,362.7 ),[362.7,362.89 ),…, [364.22,364.41]
现在随机抽取其中的
200辆汽车进行车速分 0.04
析,则估计在这一时段
内通过该站的汽车中速 0.02
度不小于90km/h的约
有( C)
0.01
O
车速
60 70 80 90 100 110
A100辆
B200辆
C300辆
D400辆
5.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
2.决定组距与组数
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
组数=
极差 =
组距
4.1 0.5
=
8.2
组距:0.5 组数:9
3.将数据分组(左闭右开)
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分
优点:从频率分布直方图可以清楚地看出数据分布的总体趋势
缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直 方图后,原有的具体数据就被抹掉了
0.04 0.12
0.27 0.49
0.74 0.88
0.94 0.98
1.00
频率/组距
0.50 0.40 0.30
0.20 0.10
用水量
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 /t
解:组距为3
分组
频数
[12.5, 15.5) 3 [15.5, 18.5) 8
[18.5, 21.5) 9 [21.5, 24.5) 11
[24.5, 27.5) 10
[27.5, 30.5) 5 [30.5, 33.5] 4
合计
频率
50
频率
0.06 0.16 0.18 0.22 0.20 0.10 0.08 1
如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗?
88%的居民月用水量在3t以下,可建议取a=3.
思考:在实际中,取a=3t一定能保证85%以上 的居民用水不超标吗?哪些环节可能会导致 结论出现偏差?
相关文档
最新文档