样本及其分布
概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n
X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )
F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]
z
(1)标准正态分布分位点
(x)
( x)dx 1 ( x)dx
z
z1
( x)
Pr[ X z ]
样本及其分布

S
2S 2 2 2
S12与 S22 的加权平均, 即
Sw2
n1
n1 1 n2
2
S12
n2 1 n1 n2
2
S22 ,
双正态总体的抽样分布
Sw2
n1
n1 1 n2
2
S12
n2 1 n1 n2
2
S22 ,
则 (1) (2)
U ( X Y ) (1 2 ) ~ N (0,1);
2 1
n1
2 2
t1 (n) t (n),
F1
(n1
,
n2
)
F
1 (n2
,
n1
)
.
9用总体的样本构
造出合适的统计量, 并使其服从或渐近地服从已知
总体分布. 统计量是进行统计推断的工具,
样本均值
X
1 n
n i 1
Xi
与样本方差
S 2
1 n1
n i 1
(Xi
X
)2
是两个最重要的统计量, 统计量的分布称为抽样分布.
~
.
2X
4
X
2
~
N (0,1).
4
例2 设总体 X ~ N (0, 2 ), X1, X2 ,, Xn 是取
自 X 的一个样本,
n
则有
X
2 i
i2
(n
1)
X
2 1
~
.
U
1
2
n i2
X
2 i
~
2 (n
1).
V
1
2
X
2 1
~
2 (1).
n
第六章样本及样本函数的分布

∼ t(n −1). .
Sn
177
概率论与数理统计全程学习指导
∑ = ∑ 【评注】 10
1 统计量 σ 2
n
(X i
−
μ)2
和
i =1
(n −1)S2 σ2
1 σ2
n
(X i
−
X )2
的分布在自由度上是
i =1
∑ ∑ 1
有差别的,这是因为在 σ2
n
(X i
−
X )2
中有一个约束条件
X
i =1
=1 n
x(1) ≤ x(2) ≤
≤x (k)
,并假设
x( i )
出现的频数为
ni
,那么
x( i )
出现的频率为
i = 1, 2, , k, k ≤ n . 函数
fi
=
ni n
,
⎧ 0,
⎪
∑ Fn (x)
=
⎪ ⎨
i
fj,
⎪ j=1
⎪⎩ 1,
x < x(1),
x(i) ≤ x < x(i+1), i = 1, 2, , k −1, x ≥ x(k).
③ χ2 分布的性质
10 若 χ2 ∼ χ2 (n) ,则 E(χ2 ) = n , D(χ2 ) = 2n ;
20
(可加性)若
χ
2
1
∼
χ2 (n1) ,
χ
2
2
∼
χ2 (n2 )
,且
χ
2
1
和
χ
2
2
相互独立,则
χ
2
1
+
χ
2
概率论 第六章 样本及抽样分布

一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
第三节抽样分布定理

0 2 2Байду номын сангаас
5 3 7
5. 求向量组:1 (1, 2,0,3),2 (2, 5, 3,6),3 (0,1,3,0),
3 (2, 1,4, 7),5 (5, 8,1,2)的秩与一个最大无关组(8分)
6.
求齐次方程组的一个基础
解系:32xx1153xx2242xx332xx44
0 0(10分)
(3) Z X 2 Y 2的概率分布.
1. 设随机变量X和Y的数学期望都是 2, 方差分别为 1和4而相关 系数为0.5, 则根据契比雪夫不等式求P{ X Y 6}
2. 设X服从参数为的指数分布,求(1)P( X EX ),
(2)P( X DX ). 3. 设随机变量X与Y的联合分布是以点(0,1),(1,0)(1,1)为顶点的 三角形区域上服从均匀分布,试求随机变量U X Y的方差.
9. 设随机变量X在区间[0,4]上服从均匀分布,求方程 t 2 2Xt 1 0
有实根的概率(8分)
10. 有一盒彩票20张,其中有2张中奖,现从中抽 3张,每抽一张
不放回,求第三次才中奖的概率( 8分)
11.已知随机变量X的概率密度为 f ( x)
kx 1,1 x 0, 其它
2,
8 x1 7 x2 6 x3 3 x4 0
7. 设向量组a1,a2,a3线性无关,证明向量组 b1 a1 2a2 3a3, b2 2a1 3a2 4a3,b3 4a3也线性无关(6分) 8. 一宿舍随机住有4位同学,求此 4位同学中至少有2位同学的生
日在星期几是相同的概率(8分)
服从均匀分布,记
U
10,,若若XX
Y, Y.
V
10,,若若XX
样本及其抽样分布基本概念

第六章
样本及抽样分布
第1,2节 基本概念
一、总体、个体 二、随机样本、直方图 三、样本函数与统计量 四、小结
一、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体
总体 …
研究某批灯泡的心每个 个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有 的数量指标的全体就是总体.
直方图
5
8
4.5
7
4 6
3.5 5
3
2.5
4
2
3
1.5 2
1
1 0.5
0
0
140
150
160
170
180
190
200
147
157
167
177
187
197
三、统计量
由样本推断总体特征,需要对样本进行 “加工”,“提炼”.这就需要构造一些样本的 函数,它把样本中所含的信息集中起来.
1. 代表性: X1,X2,…, Xn中每一个与所考察的 总体X有相同的分布. 2. 独立性: X1,X2,…, Xn是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本. 获得简单随机样本的抽样方法称为简单随机抽样.
为了使大家对总体和样本有一个明确的 概念,我们给出如下定义:
定义 一个随机变量X或其相应的分布 函数F(x)称为一个总体.
4. 直方图 4.1 频数--频率分布表
样本数据的整理是统计研究的基础,整理数据的最 常用方法之一是给出其频数分布表或频率分布表。
例3 为研究某厂工人生产某种产品的能力, 我们随机调查了20位工人某天生产的该种产品 的数量,数据如下
样本及抽样分布

样本及抽样分布§6.1 基本概念一、总体:在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。
我们只研究感兴趣的某个或者几个指标(记为X),因此把这些指标的分布称为总体的分布,记为X~F(x)。
二、样本:设总体X具有分布函数F(x),若X1, X2,…,Xn是具有分布函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本,它们的观察值x1,x2, …, xn称为样本观察值, 又称为X 的n 个独立的观察值。
三、统计量:设X 1, X 2, …, X n 是来自总体X 的一个样本, g (X 1, X 2, …, X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,…,X n )为统计量。
统计量是样本的函数,它是一个随机变量,如果x 1, x 2, …, x n 是样本观察值, 则g (x 1, x 2, …, x n )是统计量g (X 1, X 2, …, X n )的一个观察值.四、 常用的统计量:, ,)(x 11s ,,x 1x 1. n12i2n1i 称为样本方差均值仍称为样本它们的观察值为∑∑==--==i i x n n .B ,,1,2,X A ,1k 2.22221S S nn B k ≈-====当样本容量很大时时当时当3.kkkk若总体X 的k 阶矩E(X )存在,则当n时, A .P注:ni i 111. X X ;n ==∑样本均值2n 2i i 112. S (X );n-1X ==-∑样本方差n kk i 113. k A X , k 1, 2,;n i ===∑样本阶原点矩nk i i 114. k B (X ) , k 2, 3,.n k X ==-=∑样本阶中心矩4.样本的联合分布:2) 若总体X 是离散型随机变量,其分布律为 p x =P (X=x ) , x=x 1,x 2,… 则样本X 1, X 2, …, X n 的联合分布:11112(,,)(),,;(1,2,,)nn n i i i i P X y X y P X y y x x i n =======∏其中12n *12i 13)(), ,X , (, ,)()n n i X f x X X f x x x f x ==∏若具有概率密度则的联合概率密度为12121211)(),,,,, ,,,:()()n n n*n i i X ~F x X X X F X X X F x , x ,x F x ==∏若为的一个样本则的联合分布函数为例1:X~U (0,θ),X 1, X 2, …, X n 是来自X 的样本,求(X 1, X 2, …, X n )的联合密度函数。
随机样本及其累积分布函数

随机样本及其累积分布函数
随机样本是统计学中常用的概念,用于描述从一个总体中抽取的一组观测值。
随机样本的累积分布函数是对随机样本的概率分布进行描述的重要工具。
随机样本的定义
随机样本是指从一个总体中以随机方式选取的一组观测值。
在统计学中,为了对总体进行推断和研究,我们通常无法直接获得总体的全部观测值,而只能通过抽取一部分样本来进行研究。
随机样本是通过随机抽样方法获得的,具有代表性并且能够反映总体的特征。
累积分布函数的定义
累积分布函数是对随机样本的概率分布进行描述的一种函数形式。
在数学上,累积分布函数是一个实值函数,其定义域为实数集合,值域为[0,1]。
对于一个给定的随机变量x,其累积分布函数
F(x)定义为:F(x) = P(X ≤ x),其中X表示随机变量。
累积分布函数可以用来描述随机变量小于或等于某个特定值的
概率。
在统计学中,我们经常使用累积分布函数来计算样本的概率,并进行概率统计推断。
总结
随机样本和累积分布函数是统计学中常用的概念和工具。
随机
样本用于描述从一个总体中抽取的一组观测值,而累积分布函数则
是对随机样本的概率分布进行描述的函数形式。
了解和应用随机样
本和累积分布函数对于进行有效的统计分析和推断非常重要。
以上是关于随机样本及其累积分布函数的简要介绍。
(Word count: 187)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并称他们相应的观统测称值为x
样n1
本n xi
i 1
,矩
s2n11in1(xi x)2,
s n11 in1(xi x)2,
a
k
1 n
n i 1
xik
,
bk n1in1(xi x)k, k=1,2,…
仍分别为: 样本均值、样本方差、样本标准差、样本 k 阶原点矩、 样本 k 阶中心矩.
统ex计3.量的重要性质 设 X1, X2, …, Xn 是来自总体 X 的容量为 n 的样本,
1、估计这批合金材料的强度均值是多少? (参数的点估计问题) 2、强度均值在什么范围内? (参数的区间估计问题) 3、若规定强度均值不小于某个定值为合格,那么这 批材料是否合格? (参数的假设检验问题) 4、这批合金的强度是否服从正态分布? (分布检验问题) 5、若这批材料是由两种不同工艺生产的,那么不同 的工艺对合金强度有否影响?若有影响,那一种工艺 生产的强度较好? (方差分析问题)
当个体个数很大时通常把有限总体看作无限总体。
从另一方面看: 统计的任务,是根据从总体中抽取的样本, 去推断总体的性质. 由于我们关心的是总体中的个体的某项指标(如人的身高、体重, 灯泡的寿命,汽车的耗油量…), 所谓总体的性质,无非就是这 些指标值集体的性质. 概率分布是刻划这种集体性质最适当的工具. 因此在理论上可 以把总体与概率分布等同起来. 如研究某批灯泡的寿命时, 关心的数量指标就是寿命, 那么, 此 总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示.
6、若这批合金 由几种原料用不同的比例合成,那么 如何表达这批合金的强度与原料比例之间的关系?
(回归分析问题) 我们依次讨论参数的点估计、区间估计、假设检验等 内容。 首先我们讨论数理统计中的一些基本概念。
第5章 样本及其分布
在数理统计中,我们所研究的随机变量 的分布往往是未知的,通过对随机变量进行 多次独立重复的试验和观测,获取数据,利 用实际观测数据研究随机变量的分布,对其 分布函数、数字特征等进行估计和推断.
数理统计
Tel: Email:
数理统计的基本概念
在概率论中,我们所研究的随机变量,它的分布 都是假设已知的,在这一前提下去研究它的性质、 特点和规律性,例如求出它的数字特征,讨论随机 变量函数的分布等。但是对一个实际问题,随机变 量的概率分布往往是不知道的,如何确定随机变量 的概率分布或数字特征就是数理统计要解决的问题。
简单随机样本是应用中最常见的情形, 今后, 说到 “X1, …, Xn 是取自某总体的样本”时, 若不特别说明, 就指简单随机样本.
若总体 X的分布函数为F(x), 则其简单随机样本的联合分布函数为 n F(x1, x2, …, xn )= F(x1)F(x2)…F(xn) F ( xi ).
若总体 X 的概率密度为 f (x), 则其简单随机样本的i1联合概率密度为 n f(x1,,xn)f(xi). i1
在数理统计中总体X的分布永远是未知的,即使 有足够的理由可以认为总体X服从某种类型的分布, 但这个分布的参数还是未知的。
例如本市家庭的月收入X是个随机变量,X服从什么
分布事先是不清楚的,根据资料可确信 X~N ,2.
但 , 2 究竟取什么值还是未知的,
由于总体X的分布是未知的,因此X的数字特征如 均值、方差等往往也是一个未知的值。对于这些未知
× 3
i1
(
X
i
)2
我们主要研究两种基本的统计量: 样本矩 和 顺序统计量
10 样本矩 ——
样本均值
X
1 n
n
i 1
反映了总体均值的信息
几个常见的统计量
它反映了总体标准差的信息
Xi
样本标准差 S n11 in1(Xi
X)2
它样它反本反样映映了本k了阶总方总体原体差k点方阶S差矩矩2的的A信n信k1息息1n1 in1in(1XXiikX)2n 样反1 映1 本(了 iSn kn总1阶X 体i2n1中 iknn 212(阶心nXX X Xi中2 矩 i 2n ) X心1)X 2矩nBSiXk的 n22n 信)X n1n1息2in)in11((XXiki=1X,X2)k,)…2
总体(理论分布)?
样本值
样本
统计是从手中已有的资料 — 样本值, 去推断总体的情况 —总体
分布F(x)的性质. ? ?样?本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是样本取到样本值
的规律, 因而可以由样本值去推断总体.
分散、复杂
是总体的代表, 含有总体的信息
§2 统计量
1. 统计量
由样本值去推断总体情况, 需要对样本值进行“加工一个有效
若 X 有期望 EX= 和方差 DX = 2, 则
(1)
EX
1
n
n i1
EXi
=DX,
1 n2
n
DXi
i1
= 2/n ;
(2) E(S2) =? 2 ,
E(Sn2)
?n
n
1
2
;
n
11n1
n
E[(Xi X)2] i1
n
E(Xi2)nE(X2) i1
in 1(DXiE2Xi)n(DXE2X)n(22)n(n22)
再如, 若研究某地区中学生的营养状况时, 关心的数量指标是身 高和体重, 我们用X和Y分别表示身高和体重,那么此总体就可用二 维随机变量(X,Y)或其联合分布函数 F(x, y)来表示.
总体概念的要旨: 总体就是一个概率分布
当X为离散型时,称X的概率函数(分布列)为 总体概率函数。 当X为连续型时,称X的概率密度为总体密度函数。 当总体分布为指数分布时, 称为指数分布总体; 当总体分布为正态分布时,称为正态分布总体或 简称正态总体等等.
计 推断统— 计学—
的
对已取得的观测值进行整理、
分
分析,作出推断、决策,从而
类
找出所研究的对象的规律性
推断 统计学
参数估计 (第6章) 假设检验 (第7章) 方差分析 (第8章) 回归分析 (第8章)
例如 某厂生产一型号的合金材料,用随机的方法选取 100个样品进行强度测试,于是面临下列几个问题:
的方”法, 就是构造一些样本的函数, 通过样本函数把样本中所含的
(某一方面)的信息集中起来.
样本的函数
这种不含任何未知参数、完全由样本决定的量称为统计量
定义 设X1, X2, …, Xn 是来自总体 X 的容量为 n 的样本, 若样本函数 g(x1, …, xn)中不含任何未知参数, 则称 g(x1, …, xn)是
数理统计是一个内容十分丰富的数学分支。 它既有严格的理论,更有极其广泛的应用。而且 随着科技的发展其研究内容还在不断地充实提高。
数理统计学是一门应用性很强的学科. 它 是研究怎样以有效的方式收集、 整理和分析带 有随机性的数据,以便对所考察的问题作出推 断和预测,直至为采取一定的决策和行动提供
依据和建议.
(n1)2,
DCXC2X
DXEX2EX2
2 顺序统计量与极差
设 (X1,X2,,Xn) 为样本, (x1,x2,,xn)为样本值,且 x1 *x2 *xn * 当 (X1,X2,,Xn)取值为(x1,x2,,xn)时, 定义 r.v. X(k) xk*,k1,2,,n 则称统计量X(1),X(2),,X(n) 为顺序统计量.
另一类是研究如何分析所获得的随机数据,对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论. 这部分的内容称为推断统计学,如:参数估计、假设 检验等。
我们主要讨论有关推断统计学中几个最基本的 问题。
描述统—计—学
数
对随机现象进行观测、试验,
理 统
以取得有代表性的观测值
体进行观察试验以获得有关总体的信息. 这一抽取过程称为抽样,
所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容
量.
从国产轿车中抽5辆 进行耗油量试验
样本容量为 5
抽到哪 5 辆是随机的!
样本是随机变量
容量为 n 的样本可以看作一 n 维随机变量(X1, X2, …, Xn). 但是,一旦取定一组样本,得到的是 n 个具体的数 x1, x2, …, xn , 称为样本(X1, X2, …, Xn)的一组观测值,简称样本值 .
本章作为数理统计基础,学习总体、样 本、统计量与抽样分布等有关概念,以及有 关正态总体的重要的抽样分布定理.
5.1 简单随机样本
一.总体和样本 二.统计量
§1 总体和样本
1.总体 一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体),总体中每个对象称为个体.
总体 研究某批灯泡的质量
该批灯泡寿命的全体就是总体
总体
每公里的耗油量
灯泡的寿命
考察国产 轿车的质量
所有国产轿车每公里耗油量的全体就是总体
不过在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布
情况. 这时,每个个体具有的数量指标的全体就是总体.
称总体中所含个体的数目为总体容量, 总体容量有限的称为有 限总体, 总体容量无限的称为无限总体.
样本的值域称为样本空间。
抽样的目的是为了对总体进行统计推断,为了使抽取的样本能 很好地反映总体的信息,必须考虑抽样方法.
最常用的一种抽样方法叫作简单随机抽样, 它要求抽取的样本 X1, X2, …, Xn 满足下面两点:
1.独立性: X1, X2, …, Xn 是相互独立的随机变量 ; 2.代表性: Xi (i =1,2,…,n) 与所考察的总体 X 同分布. 由简单随机抽样得到的样本称为简单随机样本,它可以用与总体 同分布的 n 个相互独立的随机变量 X1, X2, …, Xn 表示.