用样本估计总体课件(绝对经典)

合集下载

9.2用样本估计总体课件(人教版)

9.2用样本估计总体课件(人教版)

2.1 3.6 4.9 5.5 6.4 7.8 10.1 13.3 16.8 25.6
2.2 2.3 3.6 3.7 4.9 4.9 5.5 5.5
6.4 6.8 7.8 7.9 10.2 10.2 13.6 13.6 17.0 17.9 24.5 28
我们选择用频率分布表和频率分布直方图来整理和表示数据
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
例如,取区间为 [1.2 ,.2) ,[4.2 , 7.2) , , [25.2 , 28.2]
4.列频率分布表 计算各小组的频率,作出频率分布表
例如第一小组的频率是 第一组频数
f1 样本容量 23 0.23
100
[5.2, 6.2)内最为集中. 从总体上看,随着月均用水量的增加,居民用户数的频率呈现下降趋势,但存在个别区间频
率变大或者缺失的现象
从上述分析可见,当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布 特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息; 当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多, 有时图形会变得非常不规则,不容易从中看出总体数据的分布特点
例1.已知某市2015年全年空气质量等级如表所示
2016年5月和6月的空气质量指数如下: 5月:240 80 56 53 92 126 45 87 56 60

用样本估计总体课件(61张)

用样本估计总体课件(61张)
栏目导航
[解] (1)计算极差:30-21=9. 决定组距和组数:取组距为 2. ∵92=421,∴共分 5 组. 决定分点,使分点比数据多一位小数. 并把第 1 小组的分点减小 0.5,即分成如下 5 组: [20.5,22.5),[22.5,24.5),[24.5,26.5), [26.5,28.5),[28.5,30.5].
170
158
174
172
166
172
167
172
175
161
173
167
170
172
165
157
172
173
166
177
179
181
列出频率分布表,画出频率分布直方图及频率折线图.
栏目导航
23
[解] 在这个样本中,最大值为 181,最小值为 157,它们的极
差为 24,可以取组距为 4,根据题意列出样本的频率分布表如下表:
栏目导航
20
绘制频率分布直方图的具体步骤 1.求极差 一组数据的最大值与最小值的差称为极差. 2.决定组距与组数 数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当 样本容量不超过 120 时,按照数据的多少,常分成 5~12 组.为方便起见, 组距的选择应力求“取整”. 3.将数据分组 通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
栏目导航
7
设样本的元素为 x1,x2,…,xn,样本的平均数为 x ,则样本的
方差 s2= 1n[(x1- x )2+(x2- x )2+…+(xn- x )2] .
样本方差的算术平方根即为样本的标准差,即 s=
1nx1-
x
2+x2-

用样本估计总体ppt课件

用样本估计总体ppt课件
1+2+3
样本容量为n,则 10=0.25,即 n=40.
n
17
4.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示, 则这组数据的中位数和平均数分别是( )
897 9316402 (A)91.5和91.5 (B)91.5和92 (C)91和91.5 (D)92和92
18
【解析】选A.中位数为 1×(91+92)=91.5.平均数为
(i=1,2,3,…,n)是_样__本__数__据__,n是_样__本__容__量___,x 是 _样__本__平__均__数__.
9
判断下面结论是否正确(请在括号中打“√”或“×”). (1)平均数、众数与中位数从不同的角度描述了一组数据的集 中趋势.( ) (2)一组数据的平均数一定大于这组数据中的每个数据.( ) (3)一组数据的方差越大,说明这组数据的波动越大.( ) (4)一组数据的众数可以是一个或几个,那么中位数也具有相 同的结论.( )
优点与缺点
众数通常用于描述变量的 值出现次数最多的数.但显 然它对其他数据信息的忽 视使得无法客观地反映总 体特征
6
数字 特征
中位数
定义与求法
把一组数据按_大__小__顺__ _序__排列,处在_最__中__ _间__位置的一个数据 (或两个数据的平均 数)
优点与缺点
中位数等分样本数据所占 频率,它不受少数几个极 端值的影响,这在某些情 况下是优点,但它对极端 值的不敏感有时也会成为 缺点
5.09>3.72,所以乙同学发挥得更稳定.
15
3.如图是某学校抽取的学生体重的频率分布直方图,已知图中 从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数 为10,则抽取的学生人数为( )
(A)20 (B)30 (C)40 (D)50

随机抽样用样本估计总体正态分布.ppt

随机抽样用样本估计总体正态分布.ppt

各自特点
从总体中逐个 抽取
将总体分成几 层进行抽取
将总体均分成 几部分,按事 先确定的规则 在各部分抽取
相互联 系
最基本 的抽样 方法
各层抽 样时采 用简单 随机抽

在起始 部分抽 样时采 用简单 随机抽

23
适用范 围
总体中 的个体 数较少
总体由 差异明 显的几 部分组

总体中 的个体 数较多
2.频率分布直方图会使样本的一些数字特征更明显,
9
(2)依题意,ξ 的可能取值为 0,1,2,3,则 P(ξ=0)=CC31382=1545,P(ξ=1)=CC14C31228=2585, P(ξ=2)=CC24C31218=1525,P(ξ=3)=CC31342=515. 因此,ξ 的分布列如下:
所以 Eξ=0×1545+1×2585+2×1525+3×515=1.
体的方差最小,0
21
1.统计的基本思想方法是用样本估计总体,即用局 部推断整体,这就要求样本应具有很好的代表性, 而样本良好客观的代表性,完全依赖抽样方法. 三种抽样方法的比较:
22
类别 简单随机抽样
分层抽样
系统抽样
共同点
①抽样过程中 每个个体被抽 取的概率是相 等的;②均属 于不放回抽样
在区间(68,75)中的概率.
7
素材1
设矩形的长为 a,宽为 b,其比满足 b∶a=
5-1 2
≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩
形常应用于工艺品设计中.下面是某工艺品厂随机抽取
两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639

用样本估计总体优秀课件

用样本估计总体优秀课件
• (1)确定X,y,p,q的值,并补全频率分布直方图;
• (2)试根据频率分布直方图估算这60名网友当日在该网店网购金额 的平均数和中位数;若平均数和中位数至少有一个不低于2千元,则 该网店当日被评为“皇冠店”,试判断该网店当日能否被评为“皇冠 店”.
试题解析:(1)由频数之和为60,“网购达人”与“网购探者” 人数的比例为2:3,列出关于x,y的方程组,由此能求出x,y,p,q的 值,并补全频率分布直方图;(2)根据频率分布直方图分别计 算平均数和中位数,再与题设条件做比较,即可判断.
互动探究(二) 用频率分布直方图能求众数、中位数、平均数
• [例2] (广东)某校100名学生期中考试语文成绩的频率分布直方图如图 所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90), [90,100].
• (1)求图中a的值; • (2)根据频率分布直方图,估计这100名学生语文成绩的平均数、中位
用样本估计总体
用样本频率分布估计 总体分布
用样本数字特征估计 总体数字特征
频率分布图
茎叶图
中心位置特征
离散程度特征
频率折线图 总体密度曲线
均值
中位数
众数
标准差 方差
学习目标:
1.回顾频率分布表和频率分布直方图的绘 制过程和样本的数字特征;; 2.能运用用频率分布直方图解决简单的实 际问题,能求众数、中位数、平均数,计 算标准差、方差,体会样本的数字特征, 会画茎叶图,能说出茎叶图的意义,并能 在实际问题中用茎叶图进行数据统计.
中点的横坐标
中位数
将一组数据按大小依次排列,把处在 中间 位置的一个 数据(或最中间两个数据的 平均数 )叫做这组数据的中位 数,在频率分布直方图中,中位数左边和右边的直方图的 面积 相等 .

30.2.3用样本估计总体ppt课件

30.2.3用样本估计总体ppt课件

怎样进行简单的随机抽样调查?
具体的方法步骤: (1)将每个个体编号; (2)将写有这些编号的纸条或乒乓球全部放入一个盒子,搅拌均匀 (3)用抽签的办法抽出一个编号,那个编号的个体就被选入样本(样本容量 是几就是从中抽出几张纸条或几个乒乓球)。也可以用计算器产生随机数来模 拟实验(如果产生的随机数相同,就只算一次)。
1.简单的随机抽样
要使样本具有代表性,不偏向总体中的某些个体, 有一个对每个个体都公平的办法,那就是用抽签的办法 决定哪些个体进入样本。统计学家们称这种理想的抽样 方法为简单随机抽样(simple random sampling).
具体来说,先将每个个体编号,然后将写有这些编号 的纸条或者乒乓球全部放入一个盒子,搅拌均匀,再用抽 签的办法,抽出一个编号,那个编号的个体就被选入样本。 当然,为了节省时间,也可以像以前做过的那样,让计算 器来产生随机数,现实中,我们一般不会对同一个人调查 两次,所以,如果计算器产生的随机数有重复,那么就只 算一次。
然后,他这样计算这20个学生的平均身高:
小华这样计算平均数可以吗?为什么?
问题2:假设你们年级共有四个班级, 各班的男同学人数和平均身高如表所示.
小强这样计算全年级男同学的平均身高:
小强这样计算平均数可以吗?为什么?
(小强的计算方法是错误的,因为他没有考虑到各班男生
161 .2+162 .3+160 .8+160 .7 4
例4某校生物兴趣小组的同学们想探求人的各种血型(A、B、AB、O型四种)在 人群中的比例,于是他们就在医院中心血库采血室门前调查了从上午8:00到 9:00这一小时内参加献血的人员。 1、本问题中的总体、样本分别是什么? 2、他们的抽样是简单的随机抽样吗? 3、你想出了什么样的调查方案? 分析:抽样是否是随机抽样取决于该抽样是否符合随机抽样的规则,是否具有 随机性,只要对每一个个体都公平的抽样,才是随机抽样。 解:1、总体是人的各种血型,样本是一小时内参加献血的人员的血型; 2、他们的抽样不是简单的随机抽样,因为他们的做法不符合随机抽样的规则; 3、如在大街上随机询问经过此地的人员的血型等方法,只要抽样的样本是具有 随机性即可。

23.4 用样本估计总体课件(共19张PPT)

序号
1
2
3
4
5
6
7
8
9
10
质量/千克
14
21
27
17
18
20
19
23
19
22
根据调查,市场上今年樱桃的批发价格为15元/千克,用所学的统计知识估计今年此果园樱桃按批发价格销售所得的总收入为 元.
30 000
王强几年前承包了甲、乙两座荒山,各载500棵杨梅树,成活率为98%,现已挂果,经济效益初步显现.为了分析收成情况,他分别从两山上随机采摘了4棵树上的杨梅,每棵树的产量如折线统计图所示.(1)分别计算甲、乙两山样本的平均数,并用样本平均数估计甲、乙两山杨梅的产量总和;(2)试通过计算说明,哪座山上的杨梅产量较稳定.
C
2.有甲、乙两种水稻,测得每种水稻各10穴的分孽数后,计算出样本方差分别为S2甲=11,S2乙=3.4,由此可以估计( )A.甲比乙种水稻分蘖整齐 B.乙种水稻分蘖比甲种水稻整齐C.分蘖整齐程度相同 D.甲、乙两种水稻分孽整齐程度不能比
B
3.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期.收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
例1
例题解读
知识点2 用样本方差估计总体方差
例2
一个苹果园,共有2 000棵树龄相同的苹果树.为了估计今年苹果的总产量,任意选择了6棵苹果树,数出它们挂果的数量(单位:个)分别为: 260,340,280,420,360,380根据往年的经验,平均每个苹果的质量约为250 g.试估计今年苹果园苹果的总产量.
160.0
160.9
160.4
159.0
159.5

用样本估计总体一ppt课件


(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表:
分组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67)
合计
频数 3 3 9 16 7 5 4 3 50
频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
0.4
0.3
0.3
0.3
小月长均方用形水的量面居 民积人积总数=和最?=多? 的 在哪个区间?
0.2
0.16
0.1 0.08
0.1 0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同.不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断.分 别以1和0.1为组距重新作图,然后谈谈你对图的印象.
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:

用样本估计总体PPT演示课件


WENKU DESIGN
误差来源
01
02
03
抽样误差
由于样本的随机性导致的 误差,与样本量大小和样 本代表性有关。
非抽样误差
由于调查设计和实施过程 中的人为因素导致的误差, 如样本选择偏差、测量误 差等。
系统误差
由于调查方案设计或实施 过程中的系统性偏差导致 的误差,如调查工具的缺 陷、调查人员的偏见等。
利用样本数据建立的回归方程来估计 总体参数的方法称为回归估计。
优点是可以考虑多个因素的影响,预测 精度较高;缺点是建立回归方程需要满 足一定的假设条件,且计算较为复杂。
回归估计的步骤
首先,根据自变量和因变量的关系建 立回归方程;其次,利用回归方程计 算因变量的估计值。
区间估计
区间估计的定义
根据样本数据推断总体参数可能 落在某一区间内的概率的方法称
随机抽样
简单随机抽样
每个样本被选中的概率相等,适合样本量小的情况。
分层随机抽样
将总体分成若干层,从各层中随机抽取样本,适合各层间差异较大的情况。
系统抽样
等距抽样
将总体按一定顺序排列,每隔一定距离抽取一个样本。
多阶段等距抽样
将总体分成若干个小的总体,再从每个小的总体中进行等距抽样。
分层抽样
分类分层抽样
为区间估计。
区间估计的步骤
首先,根据样本数据计算出总体 参数的可能取值区间;其次,给 出该区间内包含总体参数的概率
值。
区间估计的优缺点
优点是能够给出参数的取值范围 和概率值,适用于小样本数据; 缺点是计算较为复杂,需要满足
一定的统计分布假设条件。
PART 05
样本估计总体的误差控制
REPORTING

配套课件114用样本估计总体共53张PPT


课时作业
高考调研
新课标版 ·高三数学(理)
s
2


1 10
[(2×(27

31)2

3×(16

31)2

3×(40

31)2

2×(44-31)2)-10×312]=110×1 288=128.8,
∴s甲2 <s2乙,即甲种玉米苗长得整齐.
【答案】 (1)乙种玉米苗长得高 (2)甲种玉米苗长得整齐
课前自助餐
授人以渔
自助餐
课时作业
高考调研
新课标版 ·高三数学(理)
3.标准差和方差 (1)标准差是样本数据到平均数的一种 平均距离. (2)s= 1n[x1- x 2+x2- x 2+…+xn- x 2] .
(3)方差:s2=1n[(x1- x )2+(x2- x )2+…+(xn- x )2] 本数据,n 是样本容量, x 是样本平均数).
课前自助餐
授人以渔
自助餐
课时作业
高考调研
新课标版 ·高三数学(理)
请注意!
1.本节是用样本估计总体,是统计学的基础.以考查频率分布直 方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估 计总体的思想的理解. 2.本节在高考题中主要是以选择题和填空题为主,属于中低档题 目.
课前自助餐
授人以渔
自助餐
课前自助餐
授人以渔
自助餐
课时作业
高考调研
新课标版 ·高三数学(理)
【思路】 看哪种玉米苗长得高,只要比较甲、乙两件玉米
苗的平均高度即可;要比较哪种玉米苗长得整齐,只要比较两种
玉米苗高的方差即可,因为方差是体现一组数据波动大小的特征
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)求总人数N和分数在120~125的人数n; (2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?
解 (1)分数在110~120内的学生的频率为P1=(0.04+0.03)×5=0.35, 所以该班总人数 N=01.345=40. 分数在120~125内的学生的频率为
P2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10, 分数在120~125内的人数n=40×0.10=4. (2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标, 即为105+2 110=107.5.
样本容量为200,故“超速”被罚的汽车约有200×0.2=40(辆).
答案 B
5.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
解析 易求-x=15(4.7+4.8+5.1+5.4+5.5)=5.1, ∴方差 s2=15[(-0.4)2+(-0.3)2+02+0.32+0.42]=0.1. 答案 0.1
[常用结论与微点提醒]
1.频率分布直方图中各小矩形的面积之和为1.
2.平均数、方差的公式推广

(1)若数据x1,x2,…,xn的平均数为 x ,那么mx1+a,mx2+a,mx3+a,…,mxn -
+a的平均数是mx +a.
(2)数据x1,x2,…,xn的方差为s2. ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
考点一 茎叶图及其应用 【例1】 (1)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:
件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5
B.5,5
C.3,7
D.5,7
(2)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次 诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分 的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称 号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成就按照称号的不同进行 分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( )
3.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg) 分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定 程度的是( ) A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数 解析 刻画评估这种农作物亩产量稳定程度的指标是标准差. 答案 B
A.9
B.4
C.3
D.2
(2)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情 况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将 数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布 直方图.
①求直方图中a的值; ②设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; ③估计居民月均用水量的中位数.
(1)解析 由茎叶图得该组数据的平均数-x=15(87+89+90+91+93)=90. ∴方差为15[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4. 答案 B (2)解 ①由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=
第2节 用样本估计总体
最新考纲 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率 折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会 计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并 作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征 估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方 法和样本估计总体的思想解决一些简单的实际问题.
频率 . 2.茎叶图
统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎 的旁边生长出来的数.
3.样本的数字特征 (1)众数:一组数据中 出现次数最多 的那个数据,叫做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于 最中间 位置的一个数据(或最中间
两个数据的平均数)叫做这组数据的中位数.
解析 (1)∵甲组学生成绩的平均数是88,
∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,
∵乙组学生成绩的中位数是89,∴n=9,
∴m+n=12. (2)该样本中 AQI 大于 100 的频数是 4,频率为25, 由此估计该地全年 AQI 大于 100 的频率为25, 估计此地该年 AQI 大于 100 的天数约为 365×25=146. 答案 (1)C (2)146
知识梳理
1.频率分布直方图
(1)频率分布表的画法:
极差
第一步:求 极差 ,决定组数和组距,组距= 组数 ;
第二步: 分组 ,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
频率 横轴表示样本数据,纵轴表示 组距 ,每个小矩形的面积表示样本落在该组内的
比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
规律方法 1.频率、频数、样本容量的计算方法
(1)频组率距×组距=频率.
频数
频数
(2)样本容量=频率,频率=样本容量,样本容量×频率=频数.
2.例题中抓住频率分布直方图中各小长方形的面积之和为 1,这是解题的关键,并
利用频率分布直方图可以估计总体分布.
易错警示 1.频率分布直方图的纵坐标是频组率距,而不是频率,切莫与条形图混淆.
2.制作好频率分布表后,可以利用各组的频率之和是否为 1 来检验该表是否正确.
【训练2】 某校2018届高三文(1)班在一次数学测验中,全班N名学生的数学成绩的 频率分布直方图如下,已知分数在110~120的学生有14人.
2.(必修3P70改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这 组数据的中位数和平均数分别是( )
A.91.5和91.5 C.91和91.5
B.91.5和92 D.92和92
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,
∴中位数是91+2 92=91.5, 平均数-x=87+89+90+91+8 92+93+94+96=91.5. 答案 A
a1+a2+…+an
(3)平均数:把
n
称为 a1,a2,…,an 这 n 个数的平均数.

(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均数为x,则这组数据的标准 差和方差分别是
s= 1n[(x1--x)2+(x2--x)2+…+(xn--x)2] s2=1n[(x1--x)2+(x2--x)2+…+(xn--x)2]
(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为 400×1500=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于 70 的男生人数为 60×12=30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的
诊断自测
1.思考辨析(在括号内打“√”或“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大.( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相 同的数据可以只记一次.( )
9810
2 0
5 1
6 2
8 4
5
7
8
70 2 2 3 3 3 4 5 5 6 9
60 2 2 3 4 4 4 5 7 7 8 9
56 6 8 9
A.2
B.4
C.5
D.6
解析 (1)由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,
所以y=5.
由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均
4.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚. 如图是某路段的一个检测点对200辆汽车的车速进行检测后所作的频率分布直方 图,则从图中可以看出被处罚的汽车大约有( )
A.30辆
B.40辆
C.60辆D.80辆解析 从频率分布直方图知,车速大于或等于70 km/h的频率为0.02×10=0.2.由于
值也为66, 从而有56+62+655+74+70+x=66,解得 x=3. (2)由茎叶图可得,获“诗词达人”称号的有 8 人,据该次比赛的成就按照称号的不同 进行分层抽样抽选 10 名学生,则抽选的学生中获得“诗词达人”称号的人数为 8×1400= 2(人). 答案 (1)A (2)A
规律方法 1.茎叶图的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心” 下移者平均数较大,数据集中者方差较小. 2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.
相关文档
最新文档