概率分布与抽样分布教学课件
合集下载
统计学课件第5-7章概率分布、抽样分布及参数估计剖析.

第5、6、7章
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有:
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7
●
常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义:从总体中,按照随机的原则,使得总体 中每个个体都有同等被选中的机会,而先后抽 出的n个个体作为一个容量为n的样本。
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有:
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7
●
常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义:从总体中,按照随机的原则,使得总体 中每个个体都有同等被选中的机会,而先后抽 出的n个个体作为一个容量为n的样本。
第5章 概率分布与统计量抽样分布优秀课件

b
P(a X b) a f (x)dx F(b) F(a)
分布函数与密度函数的图示
1. 密度函数曲线下的面积等于1 2. 分布函数是曲线下小于 x0 的面积
f(x)
F ( x0 )
x0
x
连续型随机变量的期望和方差
1. 连续型随机变量的数学期望为
E(X ) xf (x)dx
2. 方差为
第5章 概率分布与 统计量抽样分布
随机变量的概念
随机变量
(random variables)
1. 一次试验的结果的数值性描述 2. 一般用 X、Y、Z 来表示 3. 例如: 投掷两枚硬币出现正面的数量 4. 根据取值情况的不同分为离散型随机变
量和连续型随机变量
离散型随机变量
(discrete random variables)
n
E( X ) xi pi i 1
( X取有限个值)
E( X ) xi pi i 1
( X取无穷个值)
离散型随机变量的方差
(variance)
1. 随机变量X的每一个取值与期望值的离差平 方和的数学期望,记为D(X)
2. 描述离散型随机变量取值的分散程度 3. 计算公式为
D( X ) E[ X E( X )]2 若X是离散型随机变量,则
概率是曲线下的面积
b
P(a X b) a f (x)dx
f(x)
ab
x
分布函数
(distribution function)
1. 连续型随机变量的概率可以用分布函数F(x) 来表示
2. 分布函数定义为
x
F(x) P(X x) f (t)dt ( x )
3. 根据分布函数,P(a<X<b)可以写为
P(a X b) a f (x)dx F(b) F(a)
分布函数与密度函数的图示
1. 密度函数曲线下的面积等于1 2. 分布函数是曲线下小于 x0 的面积
f(x)
F ( x0 )
x0
x
连续型随机变量的期望和方差
1. 连续型随机变量的数学期望为
E(X ) xf (x)dx
2. 方差为
第5章 概率分布与 统计量抽样分布
随机变量的概念
随机变量
(random variables)
1. 一次试验的结果的数值性描述 2. 一般用 X、Y、Z 来表示 3. 例如: 投掷两枚硬币出现正面的数量 4. 根据取值情况的不同分为离散型随机变
量和连续型随机变量
离散型随机变量
(discrete random variables)
n
E( X ) xi pi i 1
( X取有限个值)
E( X ) xi pi i 1
( X取无穷个值)
离散型随机变量的方差
(variance)
1. 随机变量X的每一个取值与期望值的离差平 方和的数学期望,记为D(X)
2. 描述离散型随机变量取值的分散程度 3. 计算公式为
D( X ) E[ X E( X )]2 若X是离散型随机变量,则
概率是曲线下的面积
b
P(a X b) a f (x)dx
f(x)
ab
x
分布函数
(distribution function)
1. 连续型随机变量的概率可以用分布函数F(x) 来表示
2. 分布函数定义为
x
F(x) P(X x) f (t)dt ( x )
3. 根据分布函数,P(a<X<b)可以写为
统计学之抽样与抽样分布课件

连续型随机变量的数值特征:
期望 —
E X x f x dx
方差 — σ 2 X x E X 2 f x dx
标准差 — σX x E X 2 f x dx
2020/8/8
第四章 抽样和抽样分布
13
第四章 抽样与抽样分布
第三节 抽样分布
3.1 抽样及抽样分布的含义 3.2 重置抽样下的抽样分布 3.3 不重置抽样下的抽样分布
1
F x P3X/4 x
1
4
当
2/4
3 4 当
1/4
4 4 当
0 x1 1 x2 2 x
2020/8/8
1
2
X
第四章 抽样和抽样分布
8
2.2 连续型随机变量概率分布
连续X❖型的密 随概率机度分变函布量数函的数的概性 率分质布:
1.
f
F
xx
0;x
f x dx
2. f x dx 1 ;
X 的概率密度函数
由于连续型随机变量在某点处的概率等于零。 对于连续性随机变量:
P x1 X x2 F x2 F x1
2020/8/8
第四章 抽样和抽样分布
5
2.2 离散型随机变量概率分布
设:正面向上的次数为 X,
则 X = 0、1、2
P X 0 1 1 1
22 4
PX
1
1 2
1 2
1 2
1 2
方差:σ 2 X X i E X 2 Pi i 1
N
标准差: σ X X i E X 2 Pi i 1
2020/8/8
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望 率 论
期望 —
E X x f x dx
方差 — σ 2 X x E X 2 f x dx
标准差 — σX x E X 2 f x dx
2020/8/8
第四章 抽样和抽样分布
13
第四章 抽样与抽样分布
第三节 抽样分布
3.1 抽样及抽样分布的含义 3.2 重置抽样下的抽样分布 3.3 不重置抽样下的抽样分布
1
F x P3X/4 x
1
4
当
2/4
3 4 当
1/4
4 4 当
0 x1 1 x2 2 x
2020/8/8
1
2
X
第四章 抽样和抽样分布
8
2.2 连续型随机变量概率分布
连续X❖型的密 随概率机度分变函布量数函的数的概性 率分质布:
1.
f
F
xx
0;x
f x dx
2. f x dx 1 ;
X 的概率密度函数
由于连续型随机变量在某点处的概率等于零。 对于连续性随机变量:
P x1 X x2 F x2 F x1
2020/8/8
第四章 抽样和抽样分布
5
2.2 离散型随机变量概率分布
设:正面向上的次数为 X,
则 X = 0、1、2
P X 0 1 1 1
22 4
PX
1
1 2
1 2
1 2
1 2
方差:σ 2 X X i E X 2 Pi i 1
N
标准差: σ X X i E X 2 Pi i 1
2020/8/8
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望 率 论
04概率分布与抽样精品资料

表中所示。
2019/4/29
8
4.1.3 简单随机抽样
9745238942 1276465909 9874763642 2659305984 1676587006 0377797684 9877808423 2778006869 2133768790 8262130892 3286548900 8084634212 4332657790 7963645324 9087434329
. . .
随机数字表
1287087765 2136217721 9878764346 4890832769 2164896589 6476793243 4387005345 2164878454 2176590879 2167608965 3254776907 3243700435 2187799990 1358787008 2125749768
2019/4/29
█ 2
4.1 抽样的一般问题
4.1.1 一个例子 4.1.2 统计抽样的几个基本概念 4.1.3 简单随机抽样
2019/4/29
3
4.1.1 一个例子
[例] 某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均
每头毛重(设为 ),如果将每头肉猪过称去获取数据将是不合
第四章 概率分布与抽样
从这一章开始便进入推断统计学的内容,它会节 省人们的时间和财物最佳限度地认识研究对象。
现实世界包含的素材集合非常庞大,从中提取需 要的信息非常困难。如:
•选民人数:每个候选人的支持率是多少?
•产品:不合格率是多少?
•环境:污染程度如何?
•市场:品种、价格、质量、购买力等情况的了解。
. . .
2019/4/29
统计学04第四章抽样与抽样分布

抽样分布的计算:
1. 从总体中抽取样本容量相同的所有样 本 — 样本空间;
2. 计算每个样本的样本统计量的取值; 3. 根据样本统计量的所有取值计算相应
的概率; 4. 样本统计量的概率分布 — 抽样分布。
2020/3/2
第四章 抽样和抽样分布
18
3.2 重置抽样下的抽样分布
总体样变本量平的均分数布的:抽样分X 布 100元 2 200 某施工小组X5个员工的 1日0 2工元 资为80、X1 9X02 、X 3 1X040、X5 110、120
N
标准差: σ X X i E X 2 Pi i 1
2020/3/2
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望
率
N
论 EX X i Pi
i 1
方差
N
σ 2 X X i E X 2 Pi i 1
基本问题
❖ 抽样 ❖ 样本(样本点) ❖ 样本空间 ❖ 随机原则 ❖ 随机抽样 ❖ 重置抽样 ❖ 不重置抽样
2020/3/2
第四章 抽样和抽样分布
15
基本问题
样本点个数
设:总体单位数 N ,样本容量 n : 样本空间的样本点数为:
重置
不讲
重 顺序
置
不讲 顺序
ANn N n
PNn
N N
1
F x P X x P X X i Pi
Xi x
Xi x
概率分布函数的性质:
P x1 X x2 P X x2 P X x1
F x2 F x1
1. 从总体中抽取样本容量相同的所有样 本 — 样本空间;
2. 计算每个样本的样本统计量的取值; 3. 根据样本统计量的所有取值计算相应
的概率; 4. 样本统计量的概率分布 — 抽样分布。
2020/3/2
第四章 抽样和抽样分布
18
3.2 重置抽样下的抽样分布
总体样变本量平的均分数布的:抽样分X 布 100元 2 200 某施工小组X5个员工的 1日0 2工元 资为80、X1 9X02 、X 3 1X040、X5 110、120
N
标准差: σ X X i E X 2 Pi i 1
2020/3/2
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望
率
N
论 EX X i Pi
i 1
方差
N
σ 2 X X i E X 2 Pi i 1
基本问题
❖ 抽样 ❖ 样本(样本点) ❖ 样本空间 ❖ 随机原则 ❖ 随机抽样 ❖ 重置抽样 ❖ 不重置抽样
2020/3/2
第四章 抽样和抽样分布
15
基本问题
样本点个数
设:总体单位数 N ,样本容量 n : 样本空间的样本点数为:
重置
不讲
重 顺序
置
不讲 顺序
ANn N n
PNn
N N
1
F x P X x P X X i Pi
Xi x
Xi x
概率分布函数的性质:
P x1 X x2 P X x2 P X x1
F x2 F x1
6第六章概率与抽样分布.ppt

(2) P(X >2)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1<X 3)= P(X 3)- P(X <-1)
= (3)- (-1)= (3) – [1-(1)]
= 0.9987-(1-0.8413)=0.8354
(4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- [1-(2)]=2 (2)- 1=0.9545
三、t—分布
1.构造 若~N(0, 1), ~2(n), 与独立,则
T ~ t(n). /n
t(n)称为自由度为n的t分布。
t(n) 的图形为
2.基本性质:
(1) f(t)关于t=0(纵轴)对称。
(2) f(t)的极限为N(0,1)的密度函数,即
3.分位点limf(t)(t)
1
t2
e2,x
n
[ 例 ] 1人 00 X 的 ~ N ( 1,8 身 7 2 ) 0 P { 1 高 5 x 1 4 } 8 ?6
P { 1 5 x 1 4 } 8 P { 6 Z Z /2 2 } 9 .4 5 % 5
当 Z 1 P 0 .6; 8 当 Z 2 1 . 7 9 6 P 0 .95
第六章 概率与抽样分布
STAT
教学重点 教学过程 教学总结
第六章 概率与抽样分布
• 第一节
★• 第二节
• 第三节 • 第四节
概率基础 随机变量及其概率分布 抽样分布 大数定律与中心极限定律
一、正态分布
• 1. 描述连续型随机变量的最重要的分布 • 2. 可用于近似离散型随机变量的分布
– 例如: 二项分布
正态分布
(例题分析)
【例】设X~N(5,32),求以下概率
= (3)- (-1)= (3) – [1-(1)]
= 0.9987-(1-0.8413)=0.8354
(4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- [1-(2)]=2 (2)- 1=0.9545
三、t—分布
1.构造 若~N(0, 1), ~2(n), 与独立,则
T ~ t(n). /n
t(n)称为自由度为n的t分布。
t(n) 的图形为
2.基本性质:
(1) f(t)关于t=0(纵轴)对称。
(2) f(t)的极限为N(0,1)的密度函数,即
3.分位点limf(t)(t)
1
t2
e2,x
n
[ 例 ] 1人 00 X 的 ~ N ( 1,8 身 7 2 ) 0 P { 1 高 5 x 1 4 } 8 ?6
P { 1 5 x 1 4 } 8 P { 6 Z Z /2 2 } 9 .4 5 % 5
当 Z 1 P 0 .6; 8 当 Z 2 1 . 7 9 6 P 0 .95
第六章 概率与抽样分布
STAT
教学重点 教学过程 教学总结
第六章 概率与抽样分布
• 第一节
★• 第二节
• 第三节 • 第四节
概率基础 随机变量及其概率分布 抽样分布 大数定律与中心极限定律
一、正态分布
• 1. 描述连续型随机变量的最重要的分布 • 2. 可用于近似离散型随机变量的分布
– 例如: 二项分布
正态分布
(例题分析)
【例】设X~N(5,32),求以下概率
概率论与数理统计基本概念及抽样分布PPT课件

~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,
则
2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α
即
( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2
则
E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)
概率统计课件§6 4.1—2 抽样分布

未修正的样本方差
S02
1n
ni 1(Xi
X)2
3. 样本标准差
S
1n
n1i 1(Xi
X)2
上页
下页
返回
4. 样本的 k 阶原点矩
mk
1 n
n
i1
Xik
5. 样本的 k 阶中心矩
Mk n1i n1(Xi X)k
k1,2, k2,3,
M2 S02
n1S2 n
二. 2 分布
1. 定义
随机变量
~
1
f
(
x)
n 22
(
n)
n x
x2e 2
2
0
x0 x0
其中 ( r )是 函数,称 X 服从自由度为 n 的 2 分布
上页
下页
返回
上页
下页
返回
2. 分2 布的典型模式
定理4.3
X1,X2, ,Xn
相互独立
解: P (X 2) 0 .0 2 5 20 2 .0 2 5(1 1 )2 1 .9 2 0 P (X 1 ) 0 .0 2 5 P (X 1 ) 0 .9 7 5
10 2 .9 7 5(1 1 )3 .8 1 6
例2. 设X1,X2, ,X10为取自总体 X~N(0,0.09)的样
t0 .1 (1 5 ) 1 .7 5 3
(3)P (t)0.95 P (t)0.05
t0 .1 ( 1 5 ) 1 .7 5 3
上页
下页
返回
例4. X1,X2, ,X9来自总体X~N(,2)的样本,且
Y1
1 6
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(|X| 3)=2 (3)-1=0.9973
中央财经大学统计学院 2007
18
对于已知的概率求Z
给定概率= 0.6217 , 相应的Z值?
Z0 Z1
.6217
0
Z=?
Z .00 .01 0.2
0.0 .5000 .5040 .5080 0.1 .5398 .5438 .5478 0.2 .5793 .5832 .5871
Z .00 .01 .02
0.0 .5000 .5040 .5080
0.1 .5398 .5438 .5478
0.2 .5793 .5832 .5871 概率 0.3 .6179 .6217 .6255
中央财经大学统计学院 2007
15
例1:已知x服从N(5,100), P(X≤6.2)=?
ZX6.1 20 50.12
(1.02.5)2 (4.02.5)2
2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
中央财经大学统计学院 2007
26
样本均值的抽样分布与总体分布的比较
总体分布
.3 .2 .1 0
1
234
= 2.5
σ2 =1.25
.3 P ( x )
抽样分布
可以分为离散型随机变量和连续型随机变 量。
中央财经大学统计学院 2007
3
离散型随机变量的概率分布
把离散型随机变量的所有可能取值以及随机变量 取这些值的概率列出来,就可以得到离散型随机变 量的概率分布。
离散型随机变量的概率分布通常用下面的表格来 表示:
X = xi P(X =xi)=pi
x1 ,x2 ,… ,xn p1 ,p2 ,… ,pn
第4章 概率分布与抽样分布
二项分布、超几何分布的特征和应用 正态分布和标准正态分布的特征和概率计算 抽样分布的概念和几种常用的抽样分布
1
§4.1 离散型随机变量及其分布
随机试验:是指在一定条件下同时满足 下列四个要求的一个过程:
1. 结果可能不止一个; 2. 过程结束后有且只有一个明确的结果; 3. 在过程未结束前不知会出现哪个结果; 4. 过程可以重复。
正态分布的密度曲线是一条关于 对称的钟
形曲线。
决定了图形的中心位置;
决定了图形中峰的陡峭程度。
ቤተ መጻሕፍቲ ባይዱ
中央财经大学统计学院 2007
11
问题:试根据正态图形比较参数大小
A, B?
A, B ?
f(x)
A, C?
A,C ?
B
A
C
中央财经大学统计学院 2007
x
12
一般正态分布
标准正态分布
Z X
标准正态分布
=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
中央财经大学统计学院 2007
28
中心极限定理
中心极限定理:从均值为,方差为 2的一个任
意总体中抽取容量为n的样本,当n充分大时,样本均 值的抽样分布近似服从均值为μ、方差为σ2/n的正态 分布。
x
n
f(X)
大样本(n 30)
4
2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
中央财经大学统计学院 2007
25
所有样本均值的均值和方差
n
xi M 1xi 1.01.51 64.02.5
n
(xi x)2
2 i1 x
M
M为样本数目
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
中央财经大学统计学院 2007
24
样本均值的抽样分布
各样本的均值如下表,并给出样本均值的抽样分布
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
33
总体方差未知时估计总体均值:t分布
如前所述,在总体方差已知时,如果总体为 正态分布或者在大样本情况下都可以认为
z
(X
)
服从标准正态分布。
n
在总体方差未知时需要用样本方差估计总体
方差,这时如果总体为正态分布或者在大样 本情况下有
t (X ) s n
服从自由度为(n-1)的t 分布 。
中央财经大学统计学院 2007
0.3 .6179 .6217 .6255
Z=0.31
中央财经大学统计学院 2007
19
对于已知的概率求X 值
.6217
.6217
10
0
Z=0.31
5 X=??
Xz5 0 .3* 1 0 5 .31
中央财经大学统计学院 2007
20
在Excel 和 SPSS 中计算概率
在实际应用中,现在可以直接使用Excel或统计软 件中的有关函数进行有关概率计算。具体方法参 见配套教材。
小样本
x
中央财经大学统计学院 2007
X
29
样本均值的抽样分布:不重复抽样
从总体中抽取n=2的简单随机样本,在不重复
抽样条件下,共有12个样本。所有样本的结果如下 表
所有可能的n = 2 的样本(共12个)
第一个
第二个观察值
观察值
1
2
3
4
1
-
1,2
1,3
1,4
2
2,1
-
2,3
2,4
3
3,1
3,2
0
2 i1
1.25
1
N
234
中央财经大学统计学院 2007
23
样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表.
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
中央财经大学统计学院 2007
21
§4.3 抽样分布 Sampling Distribution
样本统计量是一个随机变量。 从总体中抽取一个随机样本,我们可以计算出
某一统计量的一个值。统计量的抽样分布就是 这一统计量所有可能值的概率分布。 根据统计量的抽样分布,我们可以对总体的参 数进行统计推断。
0 P (x i) 1 P (x i) 1
中央财经大学统计学院 2007
4
二项分布( Binomial Distribution)
进行 n 次重复试验,每次实验中“成功” 的概率为p,出现“成功”的次数的概率分 布称为二项分布。
设X为 n 次重复试验中“成功”的次数,X 取 k 的概率为
PXkCnkpkqnk
1 0
1 0
10
.5832
2 .9 7 .1
X
5
0
Z = 0.21
P(2.9≤X≤7.1)= 2 0.21 1=0.1664
中央财经大学统计学院 2007
17
经常用到的几个概率值
由标准正态分布的查表计算可以求得, 当X~N(0,1)时,
P(|X| 1)=2 (1)-1=0.6827
P(|X| 1.96)=2 (1.96)-1=0.95 P(|X| 2)=2 (2)-1=0.9545
式中 Cn k: k!(nn !k)!
(k0,1,2, ,n)
中央财经大学统计学院 2007
5
超几何分布(hyper-geometric distribution )
设有N个产品,其中M个次品。从中不重复 随机抽取n 个,则其中次品个数k服从超几 何分布。
PXk CM kC CN nN n kM
其n中 N,MN,k0,1, ,m(inn,m)
中央财经大学统计学院 2007
6
§4.2 连续型随机变量及其分布
连续型随机变量取任何一个特定的值的概率 都等于0,通常研究它取某一区间值的概率。
一般用密度函数和分布函数来描述连续型随 机变量的分布。
中央财经大学统计学院 2007
7
概率密度函数
设X为一连续型随机变量,其概率密度函数为 p(x) (x 为任意实数),则p(x) 满足以下条件:
中央财经大学统计学院 2007
9
§4.2.2 正态分布和有关概率计算
若随机变量 X 的概率密度为
f(x) 1 e2 12x2 , x
2
其中 和 都是常数,任意,>0, 则称X服从参数为 和 的正态分布.
记作 X~N(,2)
f (x)所确定的曲线叫作正态曲线。
中央财经大学统计学院 2007
10
正态曲线图形的特点
34
t 分布
标准正态分布
t (df = 13) t (df = 5)
0
不同自由度的t分布
tZ
中央财经大学统计学院 2007
35
§4.3.2 样本比例的抽样分布
1
x
Z
中央财经大学统计学院 2007
13
正态分布的概率计算
对于标准正态分布,即X~N(0,1),有 P (a X b) b a P (|X| a) 2 a 1
中央财经大学统计学院 2007
18
对于已知的概率求Z
给定概率= 0.6217 , 相应的Z值?
Z0 Z1
.6217
0
Z=?
Z .00 .01 0.2
0.0 .5000 .5040 .5080 0.1 .5398 .5438 .5478 0.2 .5793 .5832 .5871
Z .00 .01 .02
0.0 .5000 .5040 .5080
0.1 .5398 .5438 .5478
0.2 .5793 .5832 .5871 概率 0.3 .6179 .6217 .6255
中央财经大学统计学院 2007
15
例1:已知x服从N(5,100), P(X≤6.2)=?
ZX6.1 20 50.12
(1.02.5)2 (4.02.5)2
2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
中央财经大学统计学院 2007
26
样本均值的抽样分布与总体分布的比较
总体分布
.3 .2 .1 0
1
234
= 2.5
σ2 =1.25
.3 P ( x )
抽样分布
可以分为离散型随机变量和连续型随机变 量。
中央财经大学统计学院 2007
3
离散型随机变量的概率分布
把离散型随机变量的所有可能取值以及随机变量 取这些值的概率列出来,就可以得到离散型随机变 量的概率分布。
离散型随机变量的概率分布通常用下面的表格来 表示:
X = xi P(X =xi)=pi
x1 ,x2 ,… ,xn p1 ,p2 ,… ,pn
第4章 概率分布与抽样分布
二项分布、超几何分布的特征和应用 正态分布和标准正态分布的特征和概率计算 抽样分布的概念和几种常用的抽样分布
1
§4.1 离散型随机变量及其分布
随机试验:是指在一定条件下同时满足 下列四个要求的一个过程:
1. 结果可能不止一个; 2. 过程结束后有且只有一个明确的结果; 3. 在过程未结束前不知会出现哪个结果; 4. 过程可以重复。
正态分布的密度曲线是一条关于 对称的钟
形曲线。
决定了图形的中心位置;
决定了图形中峰的陡峭程度。
ቤተ መጻሕፍቲ ባይዱ
中央财经大学统计学院 2007
11
问题:试根据正态图形比较参数大小
A, B?
A, B ?
f(x)
A, C?
A,C ?
B
A
C
中央财经大学统计学院 2007
x
12
一般正态分布
标准正态分布
Z X
标准正态分布
=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
中央财经大学统计学院 2007
28
中心极限定理
中心极限定理:从均值为,方差为 2的一个任
意总体中抽取容量为n的样本,当n充分大时,样本均 值的抽样分布近似服从均值为μ、方差为σ2/n的正态 分布。
x
n
f(X)
大样本(n 30)
4
2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
中央财经大学统计学院 2007
25
所有样本均值的均值和方差
n
xi M 1xi 1.01.51 64.02.5
n
(xi x)2
2 i1 x
M
M为样本数目
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
中央财经大学统计学院 2007
24
样本均值的抽样分布
各样本的均值如下表,并给出样本均值的抽样分布
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
33
总体方差未知时估计总体均值:t分布
如前所述,在总体方差已知时,如果总体为 正态分布或者在大样本情况下都可以认为
z
(X
)
服从标准正态分布。
n
在总体方差未知时需要用样本方差估计总体
方差,这时如果总体为正态分布或者在大样 本情况下有
t (X ) s n
服从自由度为(n-1)的t 分布 。
中央财经大学统计学院 2007
0.3 .6179 .6217 .6255
Z=0.31
中央财经大学统计学院 2007
19
对于已知的概率求X 值
.6217
.6217
10
0
Z=0.31
5 X=??
Xz5 0 .3* 1 0 5 .31
中央财经大学统计学院 2007
20
在Excel 和 SPSS 中计算概率
在实际应用中,现在可以直接使用Excel或统计软 件中的有关函数进行有关概率计算。具体方法参 见配套教材。
小样本
x
中央财经大学统计学院 2007
X
29
样本均值的抽样分布:不重复抽样
从总体中抽取n=2的简单随机样本,在不重复
抽样条件下,共有12个样本。所有样本的结果如下 表
所有可能的n = 2 的样本(共12个)
第一个
第二个观察值
观察值
1
2
3
4
1
-
1,2
1,3
1,4
2
2,1
-
2,3
2,4
3
3,1
3,2
0
2 i1
1.25
1
N
234
中央财经大学统计学院 2007
23
样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表.
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
中央财经大学统计学院 2007
21
§4.3 抽样分布 Sampling Distribution
样本统计量是一个随机变量。 从总体中抽取一个随机样本,我们可以计算出
某一统计量的一个值。统计量的抽样分布就是 这一统计量所有可能值的概率分布。 根据统计量的抽样分布,我们可以对总体的参 数进行统计推断。
0 P (x i) 1 P (x i) 1
中央财经大学统计学院 2007
4
二项分布( Binomial Distribution)
进行 n 次重复试验,每次实验中“成功” 的概率为p,出现“成功”的次数的概率分 布称为二项分布。
设X为 n 次重复试验中“成功”的次数,X 取 k 的概率为
PXkCnkpkqnk
1 0
1 0
10
.5832
2 .9 7 .1
X
5
0
Z = 0.21
P(2.9≤X≤7.1)= 2 0.21 1=0.1664
中央财经大学统计学院 2007
17
经常用到的几个概率值
由标准正态分布的查表计算可以求得, 当X~N(0,1)时,
P(|X| 1)=2 (1)-1=0.6827
P(|X| 1.96)=2 (1.96)-1=0.95 P(|X| 2)=2 (2)-1=0.9545
式中 Cn k: k!(nn !k)!
(k0,1,2, ,n)
中央财经大学统计学院 2007
5
超几何分布(hyper-geometric distribution )
设有N个产品,其中M个次品。从中不重复 随机抽取n 个,则其中次品个数k服从超几 何分布。
PXk CM kC CN nN n kM
其n中 N,MN,k0,1, ,m(inn,m)
中央财经大学统计学院 2007
6
§4.2 连续型随机变量及其分布
连续型随机变量取任何一个特定的值的概率 都等于0,通常研究它取某一区间值的概率。
一般用密度函数和分布函数来描述连续型随 机变量的分布。
中央财经大学统计学院 2007
7
概率密度函数
设X为一连续型随机变量,其概率密度函数为 p(x) (x 为任意实数),则p(x) 满足以下条件:
中央财经大学统计学院 2007
9
§4.2.2 正态分布和有关概率计算
若随机变量 X 的概率密度为
f(x) 1 e2 12x2 , x
2
其中 和 都是常数,任意,>0, 则称X服从参数为 和 的正态分布.
记作 X~N(,2)
f (x)所确定的曲线叫作正态曲线。
中央财经大学统计学院 2007
10
正态曲线图形的特点
34
t 分布
标准正态分布
t (df = 13) t (df = 5)
0
不同自由度的t分布
tZ
中央财经大学统计学院 2007
35
§4.3.2 样本比例的抽样分布
1
x
Z
中央财经大学统计学院 2007
13
正态分布的概率计算
对于标准正态分布,即X~N(0,1),有 P (a X b) b a P (|X| a) 2 a 1