浙大概率论与数理统计课件第六章样本及抽样分布
概率论与数理统计(06)第6章 统计量及其抽样分布

σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
第6章抽样与抽样分布

服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2
概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。
在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。
1、随机样本总体:试验的全部可能的观察值。
=样本空间个体:每⼀个可能观察值。
=样本点容量:总体中所包含的个体的个数。
有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。
所以将不区分总体与相应的随机变量,统称为总体X。
样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。
对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。
则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。
n称为样本的容量。
进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。
2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。
统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。
统计量也是⼀个随机变量。
g(x1,x2,...,xn)是统计量的观测值。
常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。
总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。
第六章 样本及抽样分布1精品PPT课件

二.样本
1.抽样: 从总体中抽取若干个体的过程。
2.样本: 从总体中抽取若干个体, 观察得随机变量的一组试验 数据(观测值), 样本中所含个体的数量称为样本容量。
从总体中抽取样本, 一般假设满足下述条件: (1) 随机性: 使总体中的每一个个体有同等机会被抽取到; (2) 独立性: 每次抽样的结果既不影响其他各次抽样的结果,
1
f
xn
b
1n
0
a xi b 其他
测试题B答案:
一.填空题。
1. 1)满足X1, X2 , … X n独立且同分布
2. 21) 2 n
n
2.
Xi p i1
n
1 p
n Xi
i1
,
E X p,
p 1 p DX
n
3. 5/8
二.计算题。
解: 因为X1, X2 , … X n来自均匀分布总体 N , 2 ,则X1, X2 , …
3. 简单随机样也本不:受由其随他机各的次, 独结立果的的抽影样响方;法得到的样本, 这 种随机的, 独立的抽样方法称为简单随机抽样。
注: 今后凡是提到抽样与样本, 都是简单随机抽样与简单随 机样本。
由于从总体中抽取容量为n的样本, 即是对代表总体的随 机变量X随机的,独立的进行n次试验, 每次试验结果可以看作 一个随机变量, n 次试验结果就是n个随机变量 X1, X2 , … X n , 它们相互独立且与总体X同分布。
则的联合概率密度为 。
二. 计算题。
1. 设X1, X2 , … X n是来自均匀分布总体U (a , b)的样本, 求样本 (X1, X2 , … X n)的联合概率密度。
概率论与数理统计第六章{样本及抽样分布}第四节抽样分布

(1)已知
0,求概率P
10
Xi2
4;
i1
数理统计
(2)未知,求概率P
10
(Xi
X )2
2.85 .
i1
解: (1) 由 0,有Xi
0.5
~
N (0,1),则:U
10 i 1
Xi 0.5
2
~
2(10).
P
10 i 1
Xi2
4
P
1 0.52
10 i 1
Xi2
4 0.52
F 分布的性质:
1)
F分布的数学期望为:
E(F )
n2 n2
2 , 若n2>2.
即它的数学期望并不依赖于第一自由度n1.
2) F分布的分位点:
对于给定的,0 1,称满足条件:
P
F F (n1 , n2 )
( y)dy
F ( n1 ,n2 )
的点F (n1 , n2 )为F(n1 , n2 )分布的上分位点.
10
(Xi
i 1
X )2
2.85
0.52
PV 11.4
查表得02.25(9) 11.4,由此可求得
P
10
(Xi
X )2
2.85
0.25.
i1
例3: 设总体服从泊松分布 ( ),X1,
,
X
是一个样本:
n
(1)写出X 1 ,
,
X
的概率分布;
n
(2)计算E( X ), D( X )和E(S 2 ).
所服从的分布为自由度为 n 的2分布.
记为: 2 ~ 2(n)
2分布的密度函数为:
1
《概率论与数理统计》第六章

既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
概率论与数理统计基本概念及抽样分布PPT课件

~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,
则
2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α
即
( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2
则
E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)
概率第6章 样本及抽样分布PPT课件

Xi
i 1, 2,
,n
显然Y1,Y2, ,Yn相互独立,且Yi N 0,1 i 1, 2,
于是
2
n i 1
(
X
i
)2
n
Yi 2
i 1
2
n
(2)
X1
X2
~
N
(0,
2
2
),
(
X1 X
2 2
2
)2
~
2 (1)
2X3
X4
X5
~
N(0, 6
2 ), (2X3
X4
6 2
X 5 )2
~
[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体X 具有概率密度f(x),
则样本(X1,X2,…,Xn)具有联合密度函数:
n
fn x1, x2, xn f xi
i1
3
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X的样本
1.
样本均值
定理6.4:t n分布的概率密度为:f t, n
n1 2
n
n 2
1
t2 n
n1 2
,
t
对给定的 ,
0
1, 称满足条件
t n
f
t, n dt
的点t
n
为t n分布的上分位数。t分布的上分位数可查t分布表
f (x)
n 10
f x
t1 (n) t (n)
n4
n 1
3 2 1 0 1 2 3
Y1 g1 X1, , X n1 ,Y2 g2 X n11, , X n2 , ,Yk gk X , n1 nk11 , X n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 随机样本
总体和样本 小结
一、总体与样本
1、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体,总体中每个成员称为个体
总体中所包含的个体的个数称为总体的容量.
总体
…
研究某批灯泡的质量
有限总体 总体
无限总体
我们关心的是总体中的个体的某项指标(如人的身 高、灯泡的寿命,汽车的耗油量…) .
f*(x,x2, ,xn)=f(x1) f(x2) … f(xn)
简单随机样本是应用中最常见的情形,今后, 当说到“X1,X2,…,Xn是取自某总体的样本”时,若
不特别说明,就指简单随机样本.
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
如何对样本进行加工? ——统计量及其分布
第二节 抽样分布
统计量与经验分布函数 统计三大抽样分布 几个重要的抽样分布定理 小结
一、统计量与经验分布函数
1. 统计量
不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.
设X1,X2,,Xn是来自总 X的 体一个样本 g(X1,X2,,Xn)是X1,X2,,Xn的函数, g 若 中不含未知参数 g(X, 1,X则 2,,Xn)称是一 个统计. 量
统计中,总体这个概念的要旨是: 总体就是一个随机变量(向量)或一个概 率分布.
2、样本
总体中抽出若干个体而成的集体,称为样பைடு நூலகம்。 样本中所含个体的个数,称为样本容量。
从国产轿车中抽5辆 进行耗油量试验 样本容量为5
抽到哪5辆是随机的
注1:所谓样本就是n个与总体同分布的随机变量。
对总 X在 体相同的条n 件 次下 重, 复进 、行 独 观察,其结X 果 1, X 依 2, 次 , Xn记 . 为
请注意 :
(1)统计量是一个随机变量。
(2)设 X1,X2, Xn是来自 X的 总一 体个 ,x1,样 x2, xn是一个样本 ,则 f(的 x1,x观 2, x察 n)也值 是统 计f量 (X1,X2, Xn)的观.察值
例如:
某公路上行驶车辆的速度服从什么分布是未知的;
电视机的使用寿命服从什么分布是未知的; 产品是否合格服从两点分布,但参数——合格率p是 未知的;
数理统计的任务则是以概率论为基础,根据试验 所得到的数据,对研究对象的客观统计规律性做出合 理的推断。
学习的基本内容
从第本章开始,我们学习数理统计的基础知识。 主要有参数估计、假设检验、方差分析、回归分析等 内容.本章主要介绍数理统计的一些基本术语、基本概 念、重要的统计量及其分布,它们是后面各章的基础。
定义: 设X是具有分布函F数的随机变量,X若1, X2, , Xn是具有同一分布函F的 数、相互独立的随机 变量,则称 X1, X2,, Xn为从分布函F数(或总体 F、 或 总 体X) 得 到 的 容 量n为的 简 单 随 机 样 本 , 简称样本,它们的观值察 x1, x2,, xn称为样本值, 又 称 为X的n个 独 立 的 观 察.值
由简单随机抽样得到的样本称为简单随机样本, 它可以用与总体独立同分布的n个相互独立的随机变
量X1,X2,…,Xn表示.
若总体的分布函数为F(x)、概率密度函数为 f(x),则其简单随机样本的联合分布函数为
F*(x,x2, ,xn) =F(x1) F(x2) … F(xn) 其简单随机样本的联合概率密度函数为
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
由样本值去推断总体情况,需要对样本值进行 “加工”,这就要构造一些样本的函数,它把样 本中所含的(某一方面)的信息集中起来.
由于每个个体的出现是随机的,所以相应的数量指 标的出现也带有随机性 . 从而可以把这种数量指标看 作一个随机变量X ,因此随机变量X的分布就是该数 量指标在总体中的分布.
总体就可以用一个随机变量及其分布来描述.
因此在理论上可以把总体与概率分布等同起来.
例如:研究某批灯泡的寿命时,关心的数量指标 就是寿命,那么,此总体就可以用随机变量X表示, 或用其分布函数F(x)表示.
总体
寿命 X 可用一概率 (指数)分布来刻划
某批 灯泡的寿命
寿命总体是指数分布总 体
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数 F(x,y)来表示.
第六章、样本及抽样分布
第一节:随机样本 第二节:抽样分布
引言
随机变量及其所伴随的概率分布全面描述了随机 现象的统计性规律。
概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都 是在这已知是基础上得出来的。
但实际中,情况往往并非如此,一个随机现象所 服从的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些参数是未知的。
例2、设总 X服 体从两点b(1分 ,p), 布其p中 是未知参 数, X1,,X5是来X自 的简单随机 .试样 指X 本 出 1X2 ,m 1i5aXxi,X5 2p,(X5 X1)2之 中 哪 些 是,哪 统些 计 量 不是统计量,为什么?
解:
X1X2,m 1i5aXxi,(X5X1)2都是统计量, X52p不是统计量p是 (未 因知 为 . 数)
这 样 得 到 的 1,X随 2, X 机 n是变 来 总 量 自 来 X自 的 一 个 样随 一机 个 体随 随 变 机 机 随 机 变 分量 布具
一旦取定一组样本X1,… ,Xn ,得到n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
注2 最常用的一种抽样叫作“简单随机抽样”,其特点: 1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变量.