第六章 两种常用的概率分布

合集下载

教育与心理统计学第六章:概率分布

教育与心理统计学第六章:概率分布
生活中有很多这样的事例
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用

第六章概率分析

第六章概率分析

T 70 65 60 56
正态分布表的应用
①将原始数据整理为次数 分布表; ②计算各组上限以下累加 次数; ③计算各组中点以下累加 次数; ④计算各组中点以下累积 比率; ⑤查正态分布表,将概率 转化为Z分数; ⑥将正态化以后的Z值进行 线性转换:T=10Z+50
140135130125-
120115110105100959085807570-
122
117 112 107 102 97 92 87 82 77 72
28
16 16 8 9 8 7 6 6 5 5
0.14
-0.17 -0.40 -0.59 -0.73 -0.90 -1.06 -1.25 -1.46 -1.70 -2.12
51
48 46 44 43 41 39 38 35 33 29

分析:包括两种情况:先抽一黑球、后抽一白球;
先抽一白球、后抽一黑球。
3 2 2 3 P 0.48 5 5 5 5
例4
一枚硬币掷3次,或三枚硬币各掷一次,问出现两
次或两次以上H的概率是多少?
解:可能出现的情况有:HHH HHT HTH THH TTH
THT HTT TTT共8种。每种情况出现的概率,为

根据随机变量的取值是否连续,可将随机变量分为
离散型随机变量与连续型随机变量。

当随机变量只取孤立的数值,这种随机变量称为离
散型随机变量。如投掷一枚硬币4次,几次正面朝上?因 取值只能为0、1、2、3、4,故为离散型随机变量。
离散分布与连续分布

离散型随机变量的概率分布称作离散分布。连续分
布是指连续型随机变量的概率分布,即测量数据的概率 分布。心理统计学中最常用的连续型分布是正态分布。

第六章 6.2 马尔可夫链的概率分布

第六章 6.2 马尔可夫链的概率分布
0 .6 5 P = 0 .1 5 0 .1 2 0 .2 8 0 .6 7 0 .3 6 0 .0 7 0 .1 8 0 .5 2
如果个体当前收入等级为3,试分析经过三代后个体收 入等级转变为2的可能性,进一步分析经过n代后个体 收入等级的概率分布,并具体计算n=10时,个体收入 等级的概率分布。
i
= ∑ P ( X 0 = i, X n = j )
i
= ∑ P( X 0 = i) ⋅ P( X n = j X 0 = i)
i
= ∑ q p (0)
(0) i (n) ij i
n ≥ 0, i, j ∈ S
对于齐次马尔可夫链,上述结论可表示为
q
(n)
=q P , n≥0
(0) n
有限维分布 定理6.2.2 马尔可夫链X的有限维分布由其初始分 布和一步转移概率所完全确定. 证明 对∀n ≥ 1, ∀0 ≤ t1 < t2 < ⋯ < tn , i1 , i2 , ⋯, in , i ∈ S
i
= ∑ P ( X 0 = i, X t1 = i1 , X t2 = i2 ,⋯ , X tn = in )
i
= ∑ P ( X 0 = i ) ⋅ P( X t1 = i1 X 0 = i ) ⋅ P ( X t2 = i2 X 0 = i, X t1 = i1 )
i
⋅⋯ ⋅ P ( X tn = in X 0 = i , X t1 = i1 ,⋯ , X tn−1 = in −1 )
(2) 其中p02 为两步转移概率,是两步转移概率
矩阵中第一行第三列元素.
(2) 而P = P2
= 5 9 3 9 1 6 3 9 7 18 5 12 1 9 5 18 5 12

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

管理统计学(李金林版教材)课后习题答案~~~第六章

管理统计学(李金林版教材)课后习题答案~~~第六章

管理统计学(李金林版教材)课后习题答案~~~第六章基础习题1. 解释总体分布、样本分布和抽样分布的含义。

答:总体分布:整体取值的概率分布规律,即随机变量X 服从的分布;样本分布:从总体中按照一定的抽样规则抽取的部分个体的分布,若从总体中简单随机抽取容量为n 的样本,则样本分布为(X 1,X 2,...,X n );抽样分布:样本统计量的分布。

2. 简述卡方分布、t 分布、F 分布及正态分布之间的关系,它们的概率密度曲线各有什么特征?答:若随机变量X 服从N(μ,σ2),则Z =X−μσ服从N(0,1);若随机变量X 服从N(0,1),则Y =∑(X i )2n i=1服从自由度为n 的χ2分布;若随机变量X~N(0,1),随机变量Y~χ2(n),且X 与Y 相互独立,则称随机变量T =√Y n⁄服从自由度为n 的t 分布;若随机变量X~χ2(n),若随机变量Y~χ2(m),且X 与Y 相互独立,则称随机变量F n,m =X n ⁄Y m ⁄服从第一自由度为n ,第二自由度为m 的F 分布,记为F n,m ~F(n,m)。

χ2分布的概率密度曲线分布在第一象限内,随着自由度n 的增大,曲线向正无穷方向延伸,并越来越低阔,越来越趋近于正态分布的曲线形态。

t 分布的概率密度曲线以0为中心,左右对称,随着自由度n 的增大,t 分布的概率密度曲线逐渐接近标准正态分布的概率密度曲线。

F 分布的概率密度曲线分布在第一象限内,当第一个自由度不变,第二个自由度增大时,曲线越来越向右聚拢,当两个自由度都增加时,F 分布概率密度曲线逐渐接近正态分布的概率密度曲线。

3. 解释中心极限定理的含义。

从均值为μ,方差为σ2的任意一个总体中抽取样本容量为n 的随机样本,则当n 充分大时,样本均值x̅的抽样分布近似服从均值为μ,方差为σ2n ⁄的正态分布,即x̅~N(μ, σ2n ⁄)。

4. 某公司有20名销售员,以下是他们每个人的销售量:3,2,2,3,4,3,2,5,3,2,7,3,4,5,3,3,2,3,3,4。

常用概率分布

常用概率分布
关于 左右对称,正态高峰位于中央 在 处取得该概率密度函数的最大值,在 x处
有拐点,表现为钟形 靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处 的概率较大,两 边逐渐减少 正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点:两个轴意义,对称、偏态、与 正态分布的关系
决定图形的两个参数:n,
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差(标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理,在n较大,n(1- )均大于5时,二项分 布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布 是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例 估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下: 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要 求除研究指标血红蛋白指标外,其他指标均 正常的对象。 2. 根据研究背景,确定血红蛋白过高或过低均 属于不正常(双侧范围)。
6. 如果受检指标血红蛋白呈偏态分布,则可 以用百分位数P2.5~P97.5确定95%参考值 范围,但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度, 指标变异大,要求样本量大;指标变异程 度小,要求样本量可以相对小一些。

第六章__概率分布

第六章__概率分布
面积的95%;正负2.58个标准差之间,包含总面积的 99%;正负3个标准差之间,包含总面积的99.74%。
二、正态分布表的编制与使用
• (一)正态分布表的编制与结构
• 正态分布表的结构一般包括三栏
• 第一栏:Z分数单位;
• 第二栏:密度函数或比率数值(y);
• 第三栏:概率值(p)。
• (二)正态分布表的使用
2
3
• 当g2=0时,正态分布的峰度;g2>0时,分布的峰度 比正态分布的峰度低阔;g2<0时,表明分布的峰度比 正态分布的峰度高狭。当N>1000时,g2值才比较可 靠。
• (三)累加次数曲线法
• 正态分布概率曲线和样本的累加频率曲线完全重
合说明样本分布为正态;若偏离,则不符合。
• 四、正态分布理论在测验中的应用
-0.84 -0.525 0 0.84 1.645 2.33
4.160 4.475 5.000 5.840 6.645 7.330
• (三)在能力分组或等级评定时确定人数
• ①将6个标准差除以分组的或等级的数目,做到Z
分数等距;
• ②查正态分布表,从Z求p,即各等级或各组在等
距的情况下应有的比率; • ③将比率乘以欲分组的人数,便得到各等级或分 组该有的人数。
• (二)二项分布
• 二项分布:试验仅有两种不同性质结果的概率分布。也称 两个对立事件的概率分布。
• 二项分布同二项定理有着密切的关系:
n 1 n1 n1 n1 n n (p+q)n =C0 p +C p q + +C pq +C n n n nq
x x n x (p +q)n = Cn pq n

心理统计学课件第六章 概率分布

心理统计学课件第六章 概率分布

(三)正态分布的特征
正态分布的形式是对称的,它的对称轴是 经过平均数点的垂线。
正态分布的中央点(即平均数点)最高, 然后逐渐向两侧下降。
正态曲线下的面积为1,平均数点的垂线 将面积划分为相等的两部分0.50。
正态分布曲线,标准差与概率有一定的数 量关系。
二、正态分布表的结构与使用
2、已知P值,求Z分数
已知从平均数开始的概率值,求Z值 已知位于两端的概率值,求该概率分界点
上的Z值 已知正态曲线中间部分的概率,特定区间的人数 求考试成绩中某一特定人数比率的分数界
限 按能力分组或等级评定时确定人数 将等级评定结果转化为测量数据
按能力分组或等级评定时确定人数
要把100人在某一能力上分成5个等级, 各等级应该有多少人?
将等级评定结果转化为测量数据
某教师评价全班50人的作文,有8人优, 17人良,20人中,5人及格,求各等级的 标准分数
求考试成绩中特定区间的人数
已知某年级200名学生考试呈正态分布, 平均分为85分,标准差为10分,学生甲 的成绩为70分,问全年级成绩比学生甲低 的学生人数是多少?
求考试成绩中某一特定人数比率的分数界限
某次招生考试,学生成绩符合正态分布, 学生成绩的平均分为80分,标准差为10 分,要择优录取25%的学生进入高一级学 校学习,问最低分数线应是多少?
第六章 概率分布 第三节 正态分布
一、正态分布特征
(一)正态分布的概念 与二项概率分布对比 变量类型 图形
正态分布:
在一个概率分布中,中间频数多,两 端频数对称地减少,成为一种“钟”形对 称的理论概率分布。
(二)正态分布曲线
标准正态分布的密度函数:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

答对5题的概 率1/32
答对3题的概 率10/32
答对4题的概 率5/32
答对0题的概 率1/32
• 5题中答对各种可能结果的概率之和为1。
所以在二项分布中,n+1项的概率之和为1。 若p=q,则概率分布呈对称性,与两端等距 的项的概率相等。若p≠q,n较小时,概率分 布不对称,当n较大时(大于等于30或50), 概率分布逐步对称。
2、已知P值,求Z值。
• 例7 利用正态分布表,求: • (1)求中央50%的面积操作的下限Z值和 上限Z值。 • (2)求正态曲线下右尾20%的面积的下限 Z值。 • (3)求正态曲线下左侧30%的面积的上限 Z值。
解:(1)由于正态曲线的对称性,中央
50%的面积为对称轴左右两侧各25%的面
积的和。所以P=0.25,查附表,表中没有
σ =1
图6-3(a)
标准差的大小决定图形的陡峭平缓程度,即决定纵线高度 的最大值。当标准差较大时,概率分布的离中趋势较大, 观测值分散在较大范围内,纵线高度的最大值较小,正态 分布曲线形状较平缓;当标准差较小时,概率分布的离中 趋势较小,观测值分散在较小范围内,纵线高度的最大值 较大,正态分布曲线形状较陡峭。如图6-3(b)
是有限的,并且每种结果发生的可能性是不变时,
则某事件发生的概率等于该事件包含的基本事件
数(K)除以试验中可能发生的基本事件总件数
(N)之商。
P A K N
6.2
• 经验概率是由计算事件发生的频率而得, 先验概率是在实践之前利用有关事实确定的。 前者给出了概率的操作性定义,后者提供了 概率的理论上的基本定义。 • 4、概率的性质
(1)对任一事件A,有0≤P(A)≤1。 (2)不可能事件的概率等于零。 (3)必然事件的概率等于1。

5、小概率事件 在统计推断中,将一次试验中发生的概 率小于0.05的事件,称为小概率事件。认为 它是一次试验中同乎不可能发生的事件。
二、概率的两个基本法则
• (一)概率的加法法则
• 两个互不相容(或互斥)事件A、B之和的概率等于 两个事件分别发生的概率,即

在每次试验中一定发生的事件,称为必
然事件;而一定不会发生的事件,称为不可
能事件。如纯水在标准大气压下零度结冰等。
• (二)事件的概率

1、频率:对于随机事件A,如果在N
次试验中出现a次,则A发生的频率记作
F
A

a N
(6.1)
频率满足不等式0≤F(A)≤1。若A是必然事
件,则F(A)=1,若A是不可能事件,则F(A)
P(20)=0.000000095
三者之和为0.000201,即凭猜测得18分以上的概 率只有万分之二,可以断定,他得18分以上不是凭猜 测得到的。
第三节 正态分布
• 一、正态分布的概念 • 正态分布是指在一个 概率分布中,中间频数多, 两端频数相对称地减少,
形成一种“钟”形对称的
理论概率分布。 •
出的为是非或选择题”意思是无论抽得两
种题中的哪一种都表示该事件发生了,因
此是求两个事件之和的概率P(A+B)。
• P(A)=2/9, P(B)=6/9
• 所以P(A+B)=P(A)+P(B)=8/9
(二)概率的乘法法则
• 两个相互独立事件A、B之积的概率等于两个事件分 别发生的概率的积,即 • P(A•B)=P(A)• P(B)

从式6.9可看出,Y的值与离差|X-µ|的绝 对值有关,它是以X=µ这一点的纵线为对称 轴的轴对称图形。它的位置和形状由平均 数µ和标准差σ 决定。在同一直角坐标系中, 平均数的大小决定图形的位置左移或右移, 当µ较小时,图形向左移;当µ较大时,图 形向右移。见图6-3(a)
µ=0
µ=5
σ =1
B
)+ P( A B )=P(A)P( B )+
P( A )P(B)
=1/4*3/4+3/4*1/4=3/8
第二节 二项分布
• (一)二项分布的概念 • 所谓分布的指随机变量的概率分布。

如果一次试验中只会发生两种结果,非A
即B,A和B就是对立事件。发生A和B的概 率分别为p和q,显然P(A)+P(B) =p+q=1。而且 重复多次试验时,各次试验
(3)查表得,Z=1.64时,P=0.44950,所以 Z=-1.64时,P=0.44950,即它与Z=0所夹面积 为P=0.44950,故所求面积为:0.5-P=0.0505. (4) 当Z=1.5时,P=0.43319,所以当Z=1.5时,P=0.43319,故所求面积为: 0.5+P=0.93319.
• (二)二项分布的平均数与标准差 • (对随机变量k进行计算) • 平均数: • µ=np
• 标准差: • σ=
npq
二、二项分布的应用
• 例4 某个学生一次测验回答20道是非
题,每题1分,他得了18分,问(1)凭猜 测得18分的概率是多少?(2)他的成绩若 在18分以上,是否是凭猜测得到的? • 解:(1)p=0.5,q=0.5,n=20,k=18,代 入公式(6.6)得
P18 C p q 190 0.5 0.5 0.000181
18 20 18 2 18 2
即凭猜测得18分的可能性只有十万分之十八。 (2)依题意应首先求该学生得18分,19分、20分三种 分数的概率之和是多少,然后从这个概率的大小判断他 是否是凭猜测得到这个分数。 同样P(19)=0.000019
σ =0.5
σ =1 σ =1.6
图6-3(b)
在无数条正态分布曲线中有一条曲线 µ=0,σ =1,这条曲线称为标准正态曲线,
见图6-3(a)中左侧的一条曲线。其方程
简化为
Y
1 2
e

1 2 Z 2
二、标准正态分布曲线的特点
1、曲线最高点为Z=0,Y=0.3989,曲 线下的总面积即概率总和为1,对称轴左右 各0.5。 2、曲线是以过Z=0的纵线为对称轴呈 钟形的轴对称图形。 3、标准正态分布的平均数、中数、众 数三点重合在Z=0这一点上。
• P(A+B)=P(A)+P(B)
• 在一次试验中不可能同时出现的事件称为互不相容 事件。 • 例1 在9道题中,有6道选择题,2道是非题,1道填 空题,随机抽出一题,求抽出的为是非或选择题的 概率是多少?
• 解:高抽出是非题为事件A,抽出选择题为 事件B,随机抽一题,只能是抽取三类题中 的一题,所以A,B为互不相容事件。“抽
4、曲线与对称轴交点处Y值最大,即
此处观测值的相对次数最大,概率最大;
曲线向两侧先快后慢地下降,在Z=±1处
有两个拐点;横轴是标准正态曲线的水平
渐近线,曲线向两侧逐渐接近横轴,但永
不相交。
三、正态分布表
• (一)正态分布表的结构(P240) • 它是通过公式(6.10)计算得到的。

表中第一列给出了从0到3.99的Z值,
• 两个相互独立事件就是指一个事件发生的概率与另
一个事件的发生无关,两个事件的积就是指两个事 件同时发生的事件。
• 例2
少?
两道四选一题,凭猜测做对一题的概率是多
• 解:设第一题做对为事件A,做错为事件 A ,第 二题做对为事件B,做错为事件 B ,做对第一题 的概率为P(A B ),做对第二题的概率为P (A B ),所以做对任意一题的概率为 P(A
第二列给出了与Z对应的过点Z的纵线的高
度Y值,第三列给出了曲线下面积P值是过
Z=0人纵线与过表中某Z点人纵线所夹图形
的面积比率,即相应区间的随机变量的概
率。
(二)正态分布表的使用

• • • •
已知Z值查出对应的P值和Y值;已知P 值查出对应的Z值和Y值。 1、已知Z值,求P值。 例5 在正态分布表中: (1)求Z=-1与Z=1之间的面积比率。 解:查表,当Z=1时,P1=0.34134,由它的 对称性,当Z=-1时,P2=0.34134,所以所 求的面积比率为:P1+P2=0.68268。
四、正态曲线下面积的应用
• (一)推求考试成绩中特定区间的人数
• 例8 已知某年级200名学生考试成绩呈正
态分布,平均分为85分,标准差为10分,
学生甲的成绩为70分,问全年级成绩比学
生甲低的学生人数是多少?
• 解:属于已知Z值求P值问题。
一般分3步完成:
a)计算甲生成绩的标准分数; b)根据Z值查表求得对称轴与过Z值纵线所夹的面积; 再计算出Z值左侧的曲线面积; c)将面积比率乘以总人数,即可得比甲生分数低的学 生的实际人数。
第六章 两种常用的概率分布
第一节 概率 第二节 二项分布 第三节 正态分布
第一节 概率
• 一、事件及其概率 • (一)随机事件 • 概率论:是从量的方面研究随机现象的 统计规律的科学。 • 随机现象:是指在相同条件下反复进行 观察或实验,其结果无法事先预定的现象。 • 如:掷硬币,其结果有两个,正面或反 面。在随机现象中出现的各种可能结果, 称为随机事件,简称事件。
图6-1 正态分布

在二项分布中,当p=q,当均数
np>=5,n>=10时,二项分布可看作正态 分布的近似形。
图6-2 平均数、标准差相同的二项分布直条图和正态分布图
(二)正态分布曲线
• 图6-1为正态分布曲线,其方程为
Y
1 2
e
X 2
2 2
(6.9)
其中,Y为正态分布曲线的高度,表示 随机变量的概率的大小或观测值出现的相 对次数,X为观测值,即随机变量的可能 取值;µ、σ 分别为X的平均数和标准差, e=2.71828,П =3.1416。
相关文档
最新文档