第四章 概率、概率分布与抽样分布

合集下载

理论分布和抽样分布的概念

理论分布和抽样分布的概念

抽样分布与理论分布一、抽样分布总体分布:总体中所有个体关于某个变量的取值所形成的分布。

样本分布:样本中所有个体关于某个变量大的取值所形成的分布。

抽样分布:样品统计量的概率分布,由样本统计量的所有可能取值和相应的概率组成。

即从容量为N 的总体中抽取容量为n 的样本最多可抽取m 个样本,m 个样本统计值形成的频率分布,即为抽样分布。

样本平均数的抽样分布:设变量X 是一个研究总体,具有平均数μ和方差σ2。

那么可以从中抽取样本而得到样本平均数x ,样本平均数是一个随机变量,其概率分布叫做样本平均数的抽样分布。

由样本平均数x 所构成的总体称为样本平均数的抽样总体。

它具有参数μx 和σ2x ,其中μx 为样本平均数抽样总体的平均数,σ2x 为样本平均数抽样总体的方差,σx 为样本平均数的标准差,简称标准误。

统计学上可以证明x 总体的两个参数 μx 和σ2x 与X 总体的两个参数μ和σ2有如下关系:μx = μ σ2x = σ2 /n由中心极限定理可以证明,无论总体是什么分布,如果总体的平均值μ和σ2都存在,当样本足够大时(n>30),样本平均值x 分布总是趋近于N (μ,n2)分布。

但在实际工作中,总体标准差σ往往是未知的,此时可用样本标准差S 估计σ。

于是,以nS估计σx ,记为X S ,称为样本标准误或均数标准误。

样本平均数差数的抽样分布:二、正态分布2.1 正态分布的定义:若连续型随机变量X 的概率密度函数是⎪⎭⎫ ⎝⎛--=σμπσx ex f 22121)( (-∞<x <+∞)则称随机变量X 服从平均数为μ、方差为σ2的正态分布,记作X~N (μ,σ2)。

相应的随机变量X 概率分布函数为 F (x )=⎰∞-x dx x f )(它反映了随机变量X 取值落在区间(-∞,x )的概率。

2.2 标准正态分布当正态分布的参数μ=0,σ2=1时,称随机变量X 服从标准正态分布,记作X~N (0,1)。

第四章抽样分布

第四章抽样分布
解:设X=10分钟内航空公司预订票处接到的电话次数
10 42 7 60 7 6 e 7 P X 6 0.149 6!
4.2 随机变量的概率分布
4.2.3 连续型概率分布
连续型随机变量的概率分布
1. 连续型随机变量可以取某一区间或整个实 数轴上的任意一个值 2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用概率密度函数的形式和分布函数的形式 来描述
二项分布
(Binomial distribution)
1. 重复进行 n 次试验,出现“成功”的次数 的概率分布称为二项分布,记为X~B(n, p) 2. 设X为 n 次重复试验中出现成功的次数,X 取 x 的概率为 x x n x
P X x Cn p q
n!
( x 0,1,2,, n)
(4) P(X2)=0.35+0.30=0.65
二项试验
(Bernoulli试验) 1. 二项分布建立在Bernoulli试验基础上
2. 贝努里试验满足下列条件

一次试验只有两个可能结果,即“成功”和“ 失败”

“成功”是指我们感兴趣的某种特征


一次试验“成功”的概率为p ,失败的概率为q =1- p,且概率p对每次试验都是相同的 试验是相互独立的,并可以重复进行n次 在n次试验中,“成功”的次数对应一个离散型 随机变量X
x 式中: Cn
x! ( n x )!
二项分布
(例题分析)
【例】已知一批产品的次品率为4%,从中任意有放回地抽
取5个。求5个产品中
(1) 没有次品的概率是多少? (2) 恰好有1个次品的概率是多少?

第四章 (概率论基础与抽样分布)

第四章 (概率论基础与抽样分布)

4 - 25
第四章 概率论与抽样分布
第二节 概率分布
分布函数与密度函数的图示
1. 密度函数曲线下的面积等于1 2. 分布函数是曲线下小于 x0 的面积
f(x)
4 - 26
F ( x0 )
x0
x
第四章 概率论与抽样分布
第二节 概率分布
连续型随机变量的期望和方差
1. 连续型随机变量的数学期望为
E(X ) xf (x)dx
4 - 41
第四章 概率论与抽样分布
第二节 概率分布
4 - 42
第四章 概率论与抽样分布
第二节 概率分布
【例】已知x~N(12.86,1.332),若 P(x<l1)=0.03,P(x≥l2)=0.03,求l1,l2
概率的性质
1. 非负性 对任意事件A,有 0 P 1
2. 规范性 必然事件的概率为1;不可能事件的概率为0。即
P ( ) = 1; P ( ) = 0
3. 可加性 若A与B互斥,则P ( A∪B ) = P ( A ) + P ( B ) 推广到多个两两互斥事件A1,A2,…,An,有 P ( A1∪A2 ∪… ∪An) = P ( A1 ) + P (A2 ) + …+ P (An )
标准正态分布
=1
0.1664
2.9 5 7.1 X
.0832 .0832
-.21 0 .21 Z
4 - 37
第四章 概率论与抽样分布
第二节 概率分布
【例】已知x~N(30.26,5.12), 求P(|x-30.26|<5.1); P(20.06≤x<40.46)
P(| X 30.26 | 5.1) P 5.1 X 30.26 5.1

第四章 抽样和抽样分布

第四章 抽样和抽样分布
E p P P1 P N n n N 1 P1 P n 1 n N
p
例子:
例:要估计某地区10000名适龄儿童的入学 率,用不重置抽样方法从这个地区抽取400 名儿童,检查有320名儿童入学,求样本入 学率的平均误差。 已知条件:
样本日工资平均数
单位:元
样本变量 34 34
38 42 46 50
38 36
38 40 42 44
42 38
40 42 44 46
46 40
42 44 46 48
50 42
44 46 48 50
34
36 38 40 42
抽样分布为:
Ex

x f
i 1 9
9
i i
样本日平均工资分布
样本日平均工资
三、抽样分布定理
样本平均数的抽样分布定理
(1)正态分布再生定理
X ~ N ( X , 2 ) ,则从这个总体中抽取样本容 总体变量
量为n的样本平均数 x 也服从正态分布,其平均数E ( x ) 仍为 X ,其标准差 ( x ) 。即样本平均数 x 服从正态分布 x ~ N ( X , 2 ) 。
不论总体是何种分布,只要样本的单位数量增 多,则样本平均数就趋于正态分布。
一般认为样本单位数不少于30的是大样本,样 本平均数的抽样分布就接近于正态分布。
总体未 知参数
1. 是一种理论概率分布
2. 样本统计量是随机变量
– 样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远我们稳定的信息, 是进行推断的理论基础,也是抽样推断科 学性的重要依据

(04)第4章+抽样与抽样分布

(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大

第四章 抽样分布

第四章   抽样分布
2 1 2 2
从两个正态总体中抽取的样本统计量的分布 二、标准差σ i未知但相等时两个平均数的和与差的 分布
t2 n 2
( y1 y2 ) ( 1 2 ) s s n
2 1 2 2
从两个正态总体中抽取的样本统计量的分布 三、两个样本方差比的分布——F分布
Fdf1 ,df2
t0.05(0.01)=? -t0.05(0.01)=? t0.05/2(0.01/2)=?
二、样本方差的分布
2 df
dfs 2

2

(n 1) s 2

2
2
2
2 K ( ) 2 e f df ( ) 2 0 , 0
df 1 2
,
2
0 K
y , y n
即 y 服从正态分布 N(μ,σ 2/n)。
标准差未知时平均数的分布——t分布
y t 具n-1自由度 s n 样本标准误
t分布的特征数:
t 0
(df>1) (df>2)
1:t 0
(df>3)
df t df 2
2:t
6 (df>4) df 4Biblioteka t分布曲线下总的面积等于1。
f=∞
f=5 f=1
图3-6 t分布曲线
t分布的累积分布函数为:
Ft ( df ) P(t t1 )
t1

f (t )dt
P(t ta ) P(t ta ) a
P( t t a ) a
2
- t (n)
t (n)
u
( y1 y2 ) ( 1 2 )

统计学概论04

统计学概论04
4-4
(二)概率 1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率, 概率就是指随机事件发生的可能性,或称为机率, 是对随机事件发生可能性的度量. 进行n次重复试 是对随机事件发生可能性的度量. 进行 次重复试 随机事件A发生的次数是 发生的次数是m次 验,随机事件 发生的次数是 次,发生的频率是 m/n,当试验的次数 很大时,如果频率在某一数值 很大时, ,当试验的次数n很大时 p附近摆动,而且随着试验次数 的不断增加,频率 附近摆动, 的不断增加, 附近摆动 而且随着试验次数n的不断增加 的摆动幅度越来越小,则称p为事件 发生的概率, 为事件A发生的概率 的摆动幅度越来越小,则称 为事件 发生的概率, 记为: 记为:P(A)=p.在古典概型场合 即基本事件发生的 .在古典概型场合, 概率都一样的场合: 概率都一样的场合 m A包含的样本点个数 A的有利场合数 = P( A) = = 样本点总数 n 样本点总数
4-8
只黑球和1只白球 例:袋中装有4只黑球和 只白球,每次从袋中随机 袋中装有 只黑球和 只白球, 地摸出1只球 并换入1只黑球 连续进行, 只球, 只黑球. 地摸出 只球,并换入 只黑球.连续进行,问第三 次摸到黑球的概率是多少? 次摸到黑球的概率是多少? 解: 记A为"第三次摸到黑球",则 为"第三次 为 第三次摸到黑球" A A 摸到白球" 先计算P( ). 摸到白球".先计算 . 由于袋中只有1只白球 如果某一次摸到了白球, 只白球, 由于袋中只有 只白球,如果某一次摸到了白球,换 入了黑球,则袋中只有黑球了.所以相当于第一, 入了黑球,则袋中只有黑球了.所以相当于第一, 第二次都是摸到黑球,第三次摸到白球. 第二次都是摸到黑球,第三次摸到白球.注意这是 一种有放回的摸球,样本点总数为53, 一种有放回的摸球,样本点总数为 ,有利场合数 是42×1.故: 2 × . 4 1 16 P( A )= 5 3 = 125 , 所以 42 1 109

(抽样检验)理论分布和抽样分布

(抽样检验)理论分布和抽样分布

第四章理论分布和抽样分布在上章样本分布及其特征的基础上本章将讨论总体的分布及其特征。

首先介绍间断性变数总体的理论分布,包括二项分布和泊松分布;其次介绍连续性变数总体的理论分布,即正态分布;最后介绍从这两类理论分布中抽出的样本统计数的分布,即抽样分布。

为了说明这些理论分布,必须首先了解概率的基本概念和计算法则。

第一节事件、概率和随机变量一、事件和事件发生的概率在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件,而每一个事件出现的可能性称为该事件的概率(probability)。

例如种子可能发芽,也可能不发芽,这就是两种事件,而发芽的可能性和不发芽的可能性就是对应于两种事件的概率。

若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件(random event),例如抽取一粒种子,它可能发芽也可能不发芽,这决定于发芽与不发芽的机会(概率),发芽与不发芽这两种可能性均存在,出现的是这两种可能性中的一种。

事件发生的可能性(概率)是在大量的实验中观察得到的,例如棉田发生盲蝽象为害的情况,并不是所有的棉株都受害,随着观察的次数增多,我们对棉株受害可能性程度大小的把握越准确、越稳定。

这里将一个调查结果列于表4.1。

调查5株时,有2株受害,受害株的频率为40%,调查25株时受害频率为48%,调查100株时受害频率为33%。

可以看出三次调查结果有差异,说明受害频率有波动、不稳定。

而当进一步扩大调查的单株数时,发现频率比较稳定了,调查500株到2000株的结果是受害棉株稳定在35%左右。

表4.1 在相同条件下盲蝽象在某棉田危害程度的调查结果调查株数(n) 5 25 50 100 200 500 1000 1500 2000 受害株数(a) 2 12 15 33 72 177 351 525 704 棉株受害频率(a/n)0.40 0.48 0.30 0.33 0.36 0.354 0.351 0.350 0.352现以n代表调查株数,以a代表受害株数,那么可以计算出受害频率p=a/n。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档