第十一讲 第六章 样本和抽样分布(2016)

合集下载

概率论与数理统计 第六章 样本及抽样分布

概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]

第六章样本及抽样分布

第六章样本及抽样分布
中科大软件学院
20 June 2011
第六章 样本及抽样分布
第5页
例6.1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则 总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数} 若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个0-1分布表示:
X P
20 June 2011
中科大软件学院
第六章 样本及抽样分布
第3页
• p 的大小如何; • p 大概落在什么范围内; • 能否认为 p 满足设定要求
(如 p ≤ 0.05)。
20 June 2011
中科大软件学院
第六章 样本及抽样分布
第4页
§6.1
6.1.1 总体与个体:
随机样本
• 总体:试验全部可能的观察值; :试验全部可能的观察值; • 个体:每一个可能观察值; :每一个可能观察值; • 容量:总体中所包含的个体个数; :总体中所包含的个体个数;
表6.1.1中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
20 June 2011
中科大软件学院
第六章 样本及抽样分布
第11页 11页
样本的要求:简单随机样本
要使得推断可靠,使样本能很好地代表总体。通 常有如下两个要求:
随机性: 总体中每一个个体都有同等机会
被选入样本 -- xi 与总体X有相同的分布。
F( x1 ,..., xn ) =
20 June 2011
∏F(x ).
i i =1
n
中科大软件学院
第六章 样本及抽样分布
第13页 13页
总体分为有限总体与 总体分为有限总体与无限总体

第六章 样本和抽样分布

第六章 样本和抽样分布
− z 2 n −1 2 z
∫x n
0
z
m −1 2
(z − x )
n −1 2
dx
m 2 Γ Γ 0 2 2 x dx 作积分变换 t = ,dt = z z
=
e z
m+n 2
∫x n
m −1 2
x 1 − z
n −1 2
dx
当 x = 0 时 , t = 0 ; 当 x = z 时, t = 1 .
( X 1 , L , X n )的联合概率密度 .
解: 总体 X 的概率密度为
f ( x) = 1 2π σ e
− ( x − µ )2 2σ 2
,−∞ < x < ∞ .
所以( X 1 , L , X n)的联合概率密度为 所以(
f ( x1 ,L , x n ) = ∏ f ( x i )
=∏
i =1
n
第六章 样本及抽样分布
§1 随机样本
若设X的概率密度为 若设 的概率密度为 f (x) ,则 ( X 1 , L , X n ) 的联合概 率密度为: 率密度为:
f ( x1 ,L , x n ) = ∏ f ( x i )
*
i =1
n
若设X的分布率为 P { X 若设 的分布率为 的联合分布率为: 的联合分布率为:
简称为样本,其观察值 x 1 , L x n 称为样本值。 简称为样本, 称为样本值。 由定义知: 的一个样本, 由定义知:若 X 1 , L , X n 为X的一个样本,则 ( X 1 ,L , X n ) 的一个样本 的联合分布函数为: 的联合分布函数为:
F * ( x1 ,L , x n ) = ∏ F ( x i )

第6章抽样与抽样分布

第6章抽样与抽样分布
随机变量的分布的可加性 设相互独立的随机变量X ,Y均
服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2

第六章 样本及抽样分布1精品PPT课件

第六章  样本及抽样分布1精品PPT课件
一般, 代表总体的指标(如显象管寿命)是一个随机变量 X, 所以总体就是指某个随机变量X 可能取值的全体。
二.样本
1.抽样: 从总体中抽取若干个体的过程。
2.样本: 从总体中抽取若干个体, 观察得随机变量的一组试验 数据(观测值), 样本中所含个体的数量称为样本容量。
从总体中抽取样本, 一般假设满足下述条件: (1) 随机性: 使总体中的每一个个体有同等机会被抽取到; (2) 独立性: 每次抽样的结果既不影响其他各次抽样的结果,
1
f
xn
b
1n
0
a xi b 其他
测试题B答案:
一.填空题。
1. 1)满足X1, X2 , … X n独立且同分布
2. 21) 2 n
n
2.
Xi p i1
n
1 p
n Xi
i1
,
E X p,
p 1 p DX
n
3. 5/8
二.计算题。
解: 因为X1, X2 , … X n来自均匀分布总体 N , 2 ,则X1, X2 , …
3. 简单随机样也本不:受由其随他机各的次, 独结立果的的抽影样响方;法得到的样本, 这 种随机的, 独立的抽样方法称为简单随机抽样。
注: 今后凡是提到抽样与样本, 都是简单随机抽样与简单随 机样本。
由于从总体中抽取容量为n的样本, 即是对代表总体的随 机变量X随机的,独立的进行n次试验, 每次试验结果可以看作 一个随机变量, n 次试验结果就是n个随机变量 X1, X2 , … X n , 它们相互独立且与总体X同分布。
则的联合概率密度为 。
二. 计算题。
1. 设X1, X2 , … X n是来自均匀分布总体U (a , b)的样本, 求样本 (X1, X2 , … X n)的联合概率密度。

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

《样本及其抽样分布》课件

《样本及其抽样分布》课件
阶段可采用不同的抽样方法。
特点
第一阶段采用简单随机抽样,后 一阶段采用系统抽样或分层抽样

适用范围
适用于大规模、多阶段的复杂调 查。
03
抽样分布
抽样分布的定义
抽样分布
描述样本统计量(如均值、中位数、众数等)如 何分散和变化的分布。
样本统计量
从样本中计算得出的数值,用于估计总体参数。
总体参数
描述总体特性的数值,如总体均值、总体比例等 。
中心极限定理的应用
中心极限定理表明,无论总体分布是什么,只要样本容量足够大,样本均值的分布 就会趋近于正态分布。
在实际应用中,中心极限定理用于推断总体参数,通过样本均值来推断总体均值和 总体标准差。
中心极限定理是统计分析中重要的理论基础之一,它为样本均值的分布提供了理论 支持。
样本均值的分布近似正态分布
有效性
如果样本统计量的方差最小,则该统计量是有效 的。
3
一致性
随着样本量的增加,样本统计量逐渐接近总体参 数。
04
样本统计量
样本均值
定义
样本均值的计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 是样本容量 ,$x_i$ 是每个样本观测值。
意义
样本均值代表了样本数据的集中趋势和平均水平。
应用
在统计分析中,样本均值常用于推断总体均值,是描述数据分布特性的重要统计量之一。
样本方差和标准差
定义
01
样本方差的计算公式为 $s^2 = frac{1}{n}sum_{i=1}^{n} (x_i -
bar{x})^2$,标准差的计算公式为 $s = sqrt{s^2}$。

概率论与数理统计第六章样本与抽样分布精品PPT课件

概率论与数理统计第六章样本与抽样分布精品PPT课件

100.9 99.6 103.1 98.1 99.2 101.4 100.4 99.1 100.2 97.5 99.7
99.8 102.9 98.2 96.0 101.5 100.3 96.9 101.2 98.1 99.4 100.6
102.7 97.7 95.8 99.0 100.2 97.8 99.5 100.2 97.4 101.8 102.1
第六章 样本与抽样分布
• 本章主要内容
§1 总体与个体 §2 直方图与经验分布函数 §3 统计量及其分布
2021年1月20日星期三
1
§6.1 总体与个体
一.总体与个体
1.定义1:一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体

研究某批灯泡的质量
2021年1月20日星期三
从国产轿车中抽5辆 进行耗油量试验
样本容量为5
2021年1月20日星期三
9
§6.1 总体与个体
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量.
但是,一旦取定一组样本,得到的是 n个具体的数 (x1,x2,…,xn),称为样本的一 次观察值,简称样本值 .
2021年1月20日星期三
某批 灯泡的寿命
鉴于此,常用随机变量的记号
或用其分布函数表示总体. 如 说总体X或总体F(x) .
2021年1月20日星期三
7
§6.1 总体与个体
类似地,在研究某地区中学生的营养状 况时,若关心的数量指标是身高和体重,我 们用X和Y分别表示身高和体重,那么此总体 就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 n 2 2 2 [ ( ) n( 2 )] 2 . n 1 i 1 n
n 1 n 1 2 2 2 E ( B2 ) E ( X i nX ) . n i 1 n
6、三大分布如何构造? 7、上 位点和上 1 分位点关系? 8、如何理解
(2)X中每一个个体被抽到的机会相等(与总体X同
分布). 满足这两个条件的样本就是简单随机样本.
3、样本是总体的反映,又是进行统计推断的依据, 但样本反映的信息是凌乱的,无序的和分散的, 所以要针对不同的问题构造不同的函数,将信息
集中起来,便于进行统计推断和研究分析,使之
更易揭示问题的本质。 若不含未知参数,则统计量与样本有关,而与总 体无关;若含有未知参数,则无法依靠样本观测 值来求未知参数的估计值;因而失去了利用统计 量估计未知参数的作用。
4.2 5 X 5 5.8 5 ( 1)P{4.2 X 5.8} P{ } 2 / 25 2 / 25 2 / 25 (2) (2) 2 (2) 1 0.908
2 (25 1) S (25 1) 6.07 2 (2)P{S 6.07} P{ } 4 4 24 S 2 P{ 36.42} 0.5 4 (查 2分布的分位点得)
18 0.2 19 0.5 20 0.3
总体可以理解为18岁占的比例为0.2,而随机抽取一 个同学是18岁的可能性为0.2。
2、要了解一个总体,最好是了解每一个个体,但这
样太费时间,代价太高,因此,用抽取样本的方式 来了解是最好的选择.为了使样本 X1 , X 2 , , X n 具有充 分的代表性: (1)X 1 , X 2 , , X n 相互独立;
1 ( X 1 X 2 ) ~ N (0,1) 2
又因为 X X X ~ (3) 且与 故由t分布的构造可知:
3 Y 2 2 2 2 (X3 X4 X5 ) / 3
3 6 所以C 2 2
1 ( X1 X 2 ) 2
相互独立
( X1 X 2 ) / 2
X1 X 2 X X X
二 思考题
1、为什么可以把总体看成是一个随机变量?如何理 解个体与总体具有一样的分布?
2、简单随机样本有什么特点?有什么意义?
3、统计量有什么意义?为什么统计量中不能 含有未 知参数? 4、样本均值的期望与方差? 5、如何定义样本方差 S 2?与样本2阶中心矩 B2 的区 别?若总体方差存在,试求 E ( S 2 ), E ( B2 ).
i 1 n
1、解:E ( X )=E (X) =n; D( X ) D( X ) 2n n ;
10 10 5
E ( S 2 ) D( X ) 2n.
2、解: X i ~ b(n, p)
i 1 n
D( X ) p(1 p) E ( X )=E (X) =p; D( X ) ; n n
正独立的量只有n-1个,所以自由度是n-1.
9、单个正态总体下:
X U ~ N (0, 1) / n
X T ~ t (n 1) . S/ n
两个正态总体下:
U ( X Y ) ( 1 2 )
2 12 / n1 2 / n2
~ N (0,1)
T
(X Y ) (1 2) ~ t (n1 n2 2) 1 1 S 2 n1 n2 (n1 1) S12 (n2 1) S2 2 其中 S
n1 n2 2
10、单个正态总体下:
(n 1) S 2 ~ 2 (n 1) X 与 S 2 相互独立。
2
两个正态总体下:
S12 F 2 S2
12 ~ F (n1 1, n2 1) . 2 2
三 填空题
1、从标准正态总体N(0,1)中抽取样本 X 1 , X 2 ,
n 1 n 1 n 1 2 2 2 2 B2 ( X i X ) X i nX S n i 1 n i 1 n
n 1 1 n 2 2 E (S ) E ( X i nX ) [ E ( X i2 ) nE ( X 2 )] n 1 i 1 n 1 i 1 2
, X6,
使统计量 Y C[( X 1 X 2 ) 2 ( X 3 X 4 ) 2 ( X 5 X 6 ) 2 ]
服从 2 分布.则C
.
2、 从标准正态总体N(0,1)中抽取样本 X 1 , X 2 , X1 X 2 若统计量 Y C 2 X 32 X 4 X 52 服从 t 分布,则常数C= .
X X
2 2 1 2 2
X ~ ( n) .
2 n
2
(2) 设 X ~ N (0,1) , Y ~ 2 (n) ,且 X,Y 相互独立,
X T ~ t ( n) . Y n
2 2 (3) 设 X ~ (m) , Y ~ (n) ,且 X,Y 相互独立,
X /m F ~ F (m, n) . Y /n
2 (n) ( z 2n 1) 2
1 2
当n充分大时 (n 45),t (n) z .
(了解)
2 8、 ( i 1
n
Xi

)2
n

i 1
n
(Xi )
2
2
n
n
2 ( X X ) i i 1
~ 2 ( n) .
未知,用 X 替代
2 3 2 4 2 5
~ t (3)
3、设 X 1 , X 2 ,..., X 9 和 Y1 , Y2 ,..., Y9 均来自正态总体N (0,0.32 ) 的两个独立样本,则统计量
U X 1 X 2 ... X 9 Y12 Y22 ... Y92 服从
分布。
, X5
1、由于X 1 X 2 ~ N (0, 2), X 3 X 4 ~ N (0, 2), X 5 X 6 ~ N (0,2)
U1
U2
1 ( X 1 X 2 ) ~ N (0,1) 2
1 ( X 3 X 4 ) ~ N (0,1) 2
U ~ (1)
2 1 2
2 U2 ~ 2 (1)
(n 1)
1 n 2 S ( X X ) i n 1 i 1
2
2
n 1
(n 1) S 2
2
(n 1) 1 n 2 2 ( X X ) ~ (n 1) i 2 n 1 i 1
因为有等式 X
X 1 X 2 ... X n 约束,可以理解为真 n
(3) 因为
7、若 Z ~ N (0, 1) , 则 z1 z .
若 T ~ t (n) , 则 t1 (n) t (n).
1 . 若 F ~ F (n1 , n2 ) , 则 F1 (n1 , n2 ) F (n2 , n1 )
注意:卡方分布的上 位点和上 1 分位 点没有必然关系? 当n充分大时 (n 40),近似地有
U ~ t (9)
4、易知 U1
1
2
2 ( X 12 X 2 X 32 ) ~ 2 (3)
又记
2 4 1 (4 1) S 2 2 S2 ( Y Y ) ,则 ~ (4 1) j 2 4 1 j 1
得 V1
1
2
2 2 ( Y Y ) ~ (3) j j 1
4
U1 / 3 ~ F (3,3) 又由题意知 U1 , V1相互独立,故 V1 / 3
即统计量U服从F(3,3)分布.
四 讨论题
1、设总体X 2 (n), X 1 , X 2 ,..., X 10是来自总体X 的样本, 求E ( X ), D( X ), E ( S 2 ).
2、设总体X b(1, p), X 1 , X 2 ,..., X n是来自总体X 的样本, 求:1) X i , 2) E ( X ), D( X ), E ( S 2 ).
2 (
i 1
n
Xi

)2
n

i 1
n
(Xi )
2

2
n
~ 2 ( n) .
2 9、正态总体方差已知和未知时样本均值分布有何不同?

(n 1) S 2
~ 2 (n 1)
10、正态总体样本方差的分布?
6、(1)
X1 , X 2 , , X n 相互独立,且 X i ~ N (0, 1) , 则
本节讨论课提纲



内容提要 思考题 填空题 讨论题 总结
一 内容提要
样 本 和 抽 样 分 布 统计量:X、S 2、S、Ak、Bk 2 分布 三大分布 T分布 ( 构造、性质、分位点) 方差已知 F分布 X 的分布 方差未知 单正态总体 正态总 S 2 的分布 体的样 方差已知 本均值 X Y 的分布 和方差 方差未知 双正态总体 2 的分布 S12 / S 2 的分布 基本概念 总体、个体、容量、样本

X
i 1
9
i
~ N (0,9 0.3 ) 即
2
10 9 X i ~ N (0,1) 9 i 1
又由于Yi ~ N (0, 0.32 ), 即 Yi ~ N (0,1),i 1, 2,...,9
0.3
Yi 100 9 2 2 Y ~ (9) 从而有 i 9 i 1 i 1 0.3
1、总体中的每一个个体是随机试验的一个观察值, 因此它是某一随机变量X的值。这就意味着一个总体 对应一个随机变量X,因此对总体的研究就是对一个
相关文档
最新文档