抽样方法、用样本估计总体及正态分布.pptx

合集下载

抽样方法、正态分布

抽样方法、正态分布

抽样方法、正态分布本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March抽样方法、正态分布重点、难点讲解:1.抽样的三种方法:简单随机抽样、系统抽样、分层抽样。

后两种方法是建立在第一种方法基础上的。

2.了解如何用样本估计总体: 用样本估计总体的主要方法是用样本的频率分布来估计总体分布,主要有总体中的个体取不同数值很少和较多甚至无限两种情况。

3.正态曲线及其性质:N(),其正态分布函数:f(x)=, x∈(-∞,+∞)。

把N(0,1)称为标准正态分布,相应的函数表达式:f(x)=, x∈(-∞,+∞)。

正态图象的性质:①曲线在x轴的上方,与x轴不相交。

②曲线关于直线x=μ对称。

③曲线在x=μ时位于最高点。

④当x<μ时,曲线上升;当x>μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。

⑤当μ一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中。

4.一般正态分布与标准正态分布的转化对于标准正态分布,用表示总体取值小于x0的概率,即=p(x<x0),其几何意义是由正态曲线N(0,1),x轴,直线x=x0所围成的面积。

又根据N(0,1)曲线关于y轴的对称性知,,并且标准正态总体在任一区间(a,b)内取值概率。

任一正态总体N(),其取值小于x的概率F(x)=。

5.了解“小概率事件”和假设检验的思想。

知识应用举例:例1.从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样思路分析:因为总体的个数503,样本的容量50,不能整除,故可采用随机抽样的方法从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,再用系统抽样方法。

解:第一步:将503名学生随机编号1,2,3,……,503第二步:用抽签法或随机数表法,剔除3个个体,剩下500名学生,然后对这500名学生重新编号。

第53讲 抽样方法、用样本估计总体与正态分布

第53讲 抽样方法、用样本估计总体与正态分布

第53讲 抽样方法、用样品估计总体与正态分布【考点解读】1.了解抽样方法、用样品估计总体的意义。

2.了解正态分布的意义及主要性质.【知识扫描】1.利用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样的方法.(1)一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

(2)一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

(3)当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫“层”.2.(1)用样本的频率分布估计总体的分布:频率分布表、频率分布直方图、频率折线图、茎叶图 (2)用样本的数字特征估计总体的特征:平均数、中位数、众数、极差、方差、标准差 3.正态分布(1)如果随机变量ξ的概率密度为 φμ,σ(xx ∈(-∞,+∞)其中μ、σ分别表示总体的平均数与标准差,称ξ服从参数为μ、σ的正态分布,记作ξ~N (μ,σ2),函数图象称为正态密度曲线,简称正态曲线.φμ,σ(x )dx ,则称ξ的分一般的,如果对于任何实数a <b ,随机变量ξ满足P (a <ξ≤b )= 布为正态分布(2)标准正态分布在正态分布中,当μ=0,σ=1时,正态总体称为标准正态总体,正态分布N (0,1),称为标准正态分布,记作ξ~N (0,1).(3)正态曲线的性质(ⅰ)曲线在x 轴的上方,与x 轴不相交; (ⅱ)曲线关于直线x =μ对称; (ⅲ)曲线在x =μ时位于最高点;(ⅳ)当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x 轴为渐近线向它无限靠近;(ⅴ)当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.(4)若ξ~N (μ,σ2),则E ξ=μ,D ξ=σ2.(5)若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.6826, P (μ-2σ<X ≤μ+2σ)=0.9544, P (μ-3σ<X ≤μ+3σ)=0.9974.(6)通常认为服从正态分布N (μ,σ2)的随机变量X 只取(μ-3σ,μ+3σ)之间的值 ,并简称之为3σ原则.22()2x μσ--ba⎰【考计点拔】牛刀小试:1.从编号为150 的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )()5,10,15,20,25A ()3,13,23,33B ()1,2,3,4,C ()2,4,6,16,32D 【答案】B2.设随机变量ξ服从正态分布N (2,9),若P (ξ>c +1)=P (ξ<c -1),则c =( )A .1B .2C .3D .4【解析】:选B.∵μ=2,由正态分布的定义知其函数图象关于x =2对称,于是c +1+c -12=2,∴c =2.故选B.3.(2011四川高考)有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 1l [31.5,35.5) 12 [35.5.39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是 (A)16 (B)13 (C)12 (D )23答案:B解析:从31.5到43.5共有22,所以221663P ==。

教学课件:第2课时-用样本方差估计总体方差

教学课件:第2课时-用样本方差估计总体方差

05 总结与思考
本节课的重点回顾
01
02
03
04
样本方差的定义和计算方法
总体方差的估计方法
样本方差与总体方差的关系
样本方差在统计学中的应用
对实际应用的启示
在数据分析中,样本方差是衡量数据 分散程度的重要指标,可以帮助我们 了解数据的波动情况。
样本方差的应用范围很广,包括但不 限于质量控制、市场调研、医学研究 等领域。
THANKS FOR WATCHING
感谢您的观看
在实际应用中,我们通常无法获得总 体中的所有数据,因此需要用样本方 差来估计总体方差,从而对总体进行 推断和分析。
下节课预告
01
下节课我们将学习如何用样本均 值来估计总体均值,以及如何通 过样本比例来估计总体比例。
02
通过学习这些内容,我们将进一 步了解如何通过样本数据来推断 总体特征,为后续的学习打下基 础。
差。
用样本方差估计总体方差的原理
03
通过抽样方法从总体中抽取样本,计算样本方差,并使用样本
方差来估计总体方差。
课程目标
掌握样本方差的计算方法
学生将学习如何计算样本方差,包括计算平均数、计算离差平方和、计算样本方差等步骤 。
理解用样本方差估计总体方差的原理
学生将理解样本方差是总体方差的估计值,并了解如何使用样本方差来估计总体方差。
近似性的程度取决于样本量和 总体分布的性质。在一般情况 下,样本量越大,近似程度越 高。
在实践中,通常认为样本量达 到30以上时,用样本方差估计 总体方差的近似性较好。
04 实例分析
实例一:数据分布的离散程度分析
总结词
通过实例一,学生将了解如何使用样本方差来估计总体方差 ,进而分析数据分布的离散程度。

第一节 抽样方法、用样本估计总体

第一节  抽样方法、用样本估计总体

6.样本的数字特征
返回
(1)众数、中位数、平均数
数字特征
概念
优点与缺点
众数 中位数 平均数
众数通常用于描述变量的值出现
一组数据中重复出 次数最多的数.但显然它对其他
现次数 最多 的数 数据信息的忽视使它无法客观地
反映总体特征
把一组数据按 从小 中位数等分样本数据所占频率,
到大的 顺序排列, 它不受少数几个极端值的影响,
返回
[小题纠偏] 1.已知某商场新进 3 000 袋奶粉,为检查其三聚氰胺是否超标,
现采用系统抽样的方法从中抽取 150 袋检查,若第一组抽出 的号码是 11,则第六十一组抽出的号码为________. 解析:每组袋数:d=3105000=20, 由题意知这些号码是以 11 为首项,20 为公差的等差数列. a61=11+60×20=1 211. 答案:1 211
返回
[由题悟法] 1.茎叶图中的 3 个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字 位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字 由小到大排列,一般“重心”下移者平均数较大,数据集中 者方差较小.
返回
2.由频率分布直方图进行相关计算时,需掌握的 2 个关 系式
答案:8
返回
2.(2018·海安质量测试)某校高一年级共有 800 名学生,根据 他们参加某项体育测试的成绩得到了如图所示的频率分 布直方图,则成绩不低于 80 分的学生人数为________.
解析:由题设中提供的频率分布直方图可以看出:不低于 80 分的学生人数为(0.02+0.01)×10×800=240. 答案:240
返回

随机抽样用样本估计总体正态分布.ppt

随机抽样用样本估计总体正态分布.ppt

各自特点
从总体中逐个 抽取
将总体分成几 层进行抽取
将总体均分成 几部分,按事 先确定的规则 在各部分抽取
相互联 系
最基本 的抽样 方法
各层抽 样时采 用简单 随机抽

在起始 部分抽 样时采 用简单 随机抽

23
适用范 围
总体中 的个体 数较少
总体由 差异明 显的几 部分组

总体中 的个体 数较多
2.频率分布直方图会使样本的一些数字特征更明显,
9
(2)依题意,ξ 的可能取值为 0,1,2,3,则 P(ξ=0)=CC31382=1545,P(ξ=1)=CC14C31228=2585, P(ξ=2)=CC24C31218=1525,P(ξ=3)=CC31342=515. 因此,ξ 的分布列如下:
所以 Eξ=0×1545+1×2585+2×1525+3×515=1.
体的方差最小,0
21
1.统计的基本思想方法是用样本估计总体,即用局 部推断整体,这就要求样本应具有很好的代表性, 而样本良好客观的代表性,完全依赖抽样方法. 三种抽样方法的比较:
22
类别 简单随机抽样
分层抽样
系统抽样
共同点
①抽样过程中 每个个体被抽 取的概率是相 等的;②均属 于不放回抽样
在区间(68,75)中的概率.
7
素材1
设矩形的长为 a,宽为 b,其比满足 b∶a=
5-1 2
≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩
形常应用于工艺品设计中.下面是某工艺品厂随机抽取
两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639

☆☆用样本估计总体

☆☆用样本估计总体

组距
0.5
4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
1、抛掷硬币的大量重复试验的结果: 频率分布表: 样本容量为72 088
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100

高考数学一轮总复习课件:随机抽样、用样本估计总体

高考数学一轮总复习课件:随机抽样、用样本估计总体

6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )

用样本分布估计总体分布

用样本分布估计总体分布

106
1
思考:一般地,列出一组样本数据的频 率分布表可以分哪几个步骤进行?
开始 计算极差(最大值-最小值) 确定组距和组数(设k=极差÷组距,若k为 整数,则组数=k,否则,组数=k+1) 确定分点,将数据分组 绘表,(统计各组频数,计算各组频率) 结束
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中的分布情 况,我们将上述频率分布表中的有关信息用下面 的图形表示: 频率分布表
从上面的数据很难直接估计出总体的分布情况,为此, 我们可以先将以上数据按每个数据出现的频数和频率。 汇成下表:
宽度/mm 频 数 头盖骨的宽度主要在 频 率 宽度/mm 142 143 频 7 10 数 频 率
136~149mm之间, 121 1 0.009 135mm以下以及150mm 129 1 0.009 以上所占比例相对较小
fi / x
0.0018 0.0018 0.0114 0.0416 0.0868 0.0472 0.0076
0.10
0.08 0.06 0.04 0.02 0
0.0472 6
140~145mm
145~150mm 150~155mm
46
25 4 1
0.434
0.236 0.038 0.009
142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)平均数与方差
如果这n个数据是x1,x2,…,xn,那

x
1 n
n i 1
xi
,叫做这n个数据的平均数;
如果这n个数据是x1,x2,…,xn,那

s2
1 n
n
(xi
i 1
x,)2 叫做这n个数据的方差;同时
s
1
n
n i 1
( xi
x)2
,叫做这n个数据的标准差.
5.频率分布直方图与茎叶图 样本中所有数据(或数据组)的频数和样本容量 的比,就是该数据的 频率 .所有数据(或数据组) 的频率的分布变化规律叫做频率分布,可以用频
第52讲 抽样方法、用样本估 计总体及正态分布
【学习目标】
1.了解简单随机抽样,系统抽样和分层抽样的方法, 会画频率分布直方图和茎叶图.
2.了解用样本估计总体的思想,会用样本的频率分布 估计总体分布,会用样本的基本数字特征估计总体的 基本数字特征;初步体会样本频率分布和数字特征的 随机性.
3.了解正态分布曲线的特点及曲线表示的意义.
率分布直方图、茎叶图来表示. (1)频率分布直方图: 具体做法如下: ①求极差(即一组数据中最大值与最小值的
差); ②决定组距与组数(当样本容量不超过100时,
常分成5~12组);
③将数据分组; ④列频率分布表; ⑤画频率分布直方图. 注:频率分布直方图中小长方形的面积=
频率 组距× 组距 =频率.各组频率的和等于1, 因此各小矩形的面积的和等于1. (2)茎叶图:与频率分布直方图比较,茎叶图 不仅清晰地展示了数据的分布情况,而且保留了 所有原始数据,没有任何信息损失,还可以随时 记录新的数据.
A.①②③
B.①③④
C.②③④
D.①②③④
3.为了了解学校学生的身体发育情况,抽查了该 校100名高中男生的体重情况,根据所得数据画出 样本的频率分布直方图如下图所示,根据此图, 估计该校2000名高中男生中体重大于70.5千克的人 数为( B )
A.300 B.360
C.420 D.450
【解析】由频率分布直方图可知,体重大于
【解析】甲班的方差较小,数据的平均值为7, 故方差s2=6-72+02+052+8-72+02=25.
【知识要点】 1.简单随机抽样 设一个总体的个数为 N.如果通过逐个抽取的 方法从中抽取一个样本,且每次抽取时各个个体被 抽到的 概率 相等,就称这样的抽样为简单随机抽 样.实现简单随机抽样,常用 抽签 法和 随机数表 法.
抽到的概率为
1 N
;在整个抽样过程中各个个体被抽
n
到的概率为 N .
2.系统抽样 当总体中的个数较多时,可将总体分成 均衡
的几个部分,然后按照预先定出的规则,从每一
部分抽取1个个体,得到所需要的样本,这种抽样 叫做系统抽样(也称为机械抽样).
系统抽样的步骤可概括为:
(1)将总体中的个体编号. (2)将整个的编号进行分段. (3)确定起始的个体编号.在第1段用简单随机 抽样确定起始的个体编号l. (4)抽取样本.按照先确定的规则(常将l加上间 隔k)抽取样本:l,l+k,l+2k,…,l+(n-1)k.
【基础检测】
1.某公司在甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查 产品销售的情况,需从这600个销售点中抽取一个 容量为100的样本,记这项调查为①;在丙地区中 有20个特大型销售点,要从中抽取7个调查其销售 收入和售后服务情况,记这项调查为②.则完成 ①、②这两项调查宜采用的抽样方法依次是( B )
【解析】
89+89+92+93+92+91+90+x 7
=91⇒
x=1.
5.某校甲、乙两个班级各有5名编号为1,2,3,4,5的 学生进行投篮练习,每人投10次,投中的次数如 下表:
学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班 6 7 6 7 9
2 则以上两组数据的方差中较小的一个为s2= 5 .
(2)分层抽样是建立在简单随机抽样或系统 抽样的基础上的,由于它充分利用了已知信息, 因此利用它获取的样本更具有代表性,在实际的 应用中更为广泛.
4.用样本的数字特征估计总体的数字特征 (1)众数、中位数 在一组数据中出现次数 最多 的数据叫做这 组数据的众数; 将一组数据按照从大到小(或从小到大)排列, 处在 中间位置 上的一个数据(或中间两位数据的 平均数)叫做这组数据的中位数.
A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
【解析】此题为抽样方法的选取问题.当总 体中个体较多时宜采用系统抽样;当总体中的个 体差异较大时,宜采用分层抽样;当总体中个体 较少时,宜采用随机抽样.
依据题意,第①项调查应采用分层抽样法、 第②项调查应采用简单随机抽样法.故选B.
3.分层抽样 当已知总体由 差异明显 的几部分组成时,常 将总体分成几部分,然后按照各部分所占的比进 行抽样,这种抽样叫做分层抽样,其中所分成的 各部分叫做层. (1)分层抽样是等概率抽样.用分层抽样从个 体数为N的总体中抽取一个容量为n的样本时,在 整个抽样过程中每个个体被抽到的概率相等,都
等于Nn ;
(1)抽签法 ①制签 ②抽签:抽签法简便易行,当总体的个体数 不多时,适宜采用这种方法. (2)随机数表法 ①编号 ②数数 ③成样
(3)简单随机抽样的特点:它是 不放回 抽样;它是 逐个地进行抽取;它是一种 等概率 抽样.一般
地,从含有N个个体的总体中抽取一个容量为n的
样本时,每次抽取一个个体时,任何一个个体被
0.75千克的频率为
(0.04+0.03+0.02)×2=0.18
故人数为2000×0.18=360.
4.某校开展“爱我中华、爱我家乡”摄影比赛, 9位评委为参赛作品A给出的分数如茎叶图所 示.记分员在去掉一个最高分和一个最低分后, 算的平均分为91,复核员在复核时,发现有一个 数字(茎叶图中的x)无法看清.若记分员计算无 误,则数字直线x=μ对称,整条曲线在x轴上方;
②曲线对应的正态总体概率密度函数是偶函数;
③曲线在x=μ处处于最高点,由这一点向左右两
边延伸时,曲线逐渐降低;
④曲线的对称位置由μ确定,曲线的形状由σ确
定,σ越大曲线越“矮胖”,反之曲线越“高
瘦”.
上述对正态曲线的叙述正确的是( B )
相关文档
最新文档