第六章概率分布

合集下载

教育与心理统计学第六章:概率分布

教育与心理统计学第六章:概率分布
生活中有很多这样的事例
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用

第六章概率分析

第六章概率分析

T 70 65 60 56
正态分布表的应用
①将原始数据整理为次数 分布表; ②计算各组上限以下累加 次数; ③计算各组中点以下累加 次数; ④计算各组中点以下累积 比率; ⑤查正态分布表,将概率 转化为Z分数; ⑥将正态化以后的Z值进行 线性转换:T=10Z+50
140135130125-
120115110105100959085807570-
122
117 112 107 102 97 92 87 82 77 72
28
16 16 8 9 8 7 6 6 5 5
0.14
-0.17 -0.40 -0.59 -0.73 -0.90 -1.06 -1.25 -1.46 -1.70 -2.12
51
48 46 44 43 41 39 38 35 33 29

分析:包括两种情况:先抽一黑球、后抽一白球;
先抽一白球、后抽一黑球。
3 2 2 3 P 0.48 5 5 5 5
例4
一枚硬币掷3次,或三枚硬币各掷一次,问出现两
次或两次以上H的概率是多少?
解:可能出现的情况有:HHH HHT HTH THH TTH
THT HTT TTT共8种。每种情况出现的概率,为

根据随机变量的取值是否连续,可将随机变量分为
离散型随机变量与连续型随机变量。

当随机变量只取孤立的数值,这种随机变量称为离
散型随机变量。如投掷一枚硬币4次,几次正面朝上?因 取值只能为0、1、2、3、4,故为离散型随机变量。
离散分布与连续分布

离散型随机变量的概率分布称作离散分布。连续分
布是指连续型随机变量的概率分布,即测量数据的概率 分布。心理统计学中最常用的连续型分布是正态分布。

第六章 6.2 马尔可夫链的概率分布

第六章 6.2 马尔可夫链的概率分布
0 .6 5 P = 0 .1 5 0 .1 2 0 .2 8 0 .6 7 0 .3 6 0 .0 7 0 .1 8 0 .5 2
如果个体当前收入等级为3,试分析经过三代后个体收 入等级转变为2的可能性,进一步分析经过n代后个体 收入等级的概率分布,并具体计算n=10时,个体收入 等级的概率分布。
i
= ∑ P ( X 0 = i, X n = j )
i
= ∑ P( X 0 = i) ⋅ P( X n = j X 0 = i)
i
= ∑ q p (0)
(0) i (n) ij i
n ≥ 0, i, j ∈ S
对于齐次马尔可夫链,上述结论可表示为
q
(n)
=q P , n≥0
(0) n
有限维分布 定理6.2.2 马尔可夫链X的有限维分布由其初始分 布和一步转移概率所完全确定. 证明 对∀n ≥ 1, ∀0 ≤ t1 < t2 < ⋯ < tn , i1 , i2 , ⋯, in , i ∈ S
i
= ∑ P ( X 0 = i, X t1 = i1 , X t2 = i2 ,⋯ , X tn = in )
i
= ∑ P ( X 0 = i ) ⋅ P( X t1 = i1 X 0 = i ) ⋅ P ( X t2 = i2 X 0 = i, X t1 = i1 )
i
⋅⋯ ⋅ P ( X tn = in X 0 = i , X t1 = i1 ,⋯ , X tn−1 = in −1 )
(2) 其中p02 为两步转移概率,是两步转移概率
矩阵中第一行第三列元素.
(2) 而P = P2
= 5 9 3 9 1 6 3 9 7 18 5 12 1 9 5 18 5 12

第六章 6.4 转移概率的极限与平稳分布

第六章 6.4 转移概率的极限与平稳分布

(v) (nd j r v)
ij
jj
v1
除n时,p(jjn) 0. 仅当v ld j r时,
n
f p (ld j r ) ((nl )d j )
ij
jj
l 0
l 0,1, ,n有
p(nd j r v) jj
0)
n
即 p f p (nd j r) ij
(ld j r ) ((nl )d j )
一个平稳分布,如果有
j i pij , iS
或矩阵形式为
=P
jS
其中 ={1,2, }, P ( pij )为X的转移概率矩阵。
显然 若概率分布{ j , j S}是齐次马氏链X
的平稳分布,则也有
j
p , (n) i ij
j S, n 1, 2,
iS
或矩阵形式为
=Pn
总之,:当马氏链X={X n, n 0,1, }为不可约的遍历链时,
事实上若上式对某个j成立严格不等式则两边事实上若上式对某个j成立严格不等式则两边关于j求和得证极限满足条首先反复利用可以得到ikkjikkjikkj又由于转移概率一致有界因此令n又由于转移概率一致有界因此令nlimli最后证的唯一性唯一性得证例643设在任意一天里人的情绪是快乐的一般的和忧郁的
6.4 转移概率的极限与平稳分布
(n)不存在
jj
综上,转移概率的极限有不同的情况,为此,关于转 移概率极限问题的讨论做以下假设:
总假定 j是正常返且i是非常返 或者 j和i属于同一个正常返类
又考虑到,当j为正常返周期态时,lim n
p(jjn)不存在,
但是状态转移遵从周期链原则,为此, 一般讨论以下 形式的极限
lim

概率与概率分布

概率与概率分布

第六章概率与概率分布推论统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础的。

通过概率论,可以知道在一定条件下,总体的各种抽样结果所具有的概率特性。

然后,推论统计依据这些概率特性,研究在发生了某种抽样结果的情况下总体参数是什么,或者对社会研究中提出的某种假设进行检定。

学习推论统计必须首先对概率论有所了解。

第一节概率论1.随机现象和随机事件概率是与随机现象相联系的一个概念。

所谓随机现象,是指事先不能精确预言其结果的现象。

随机现象具有非确定性,但内中也有一定的规律性。

例如,事先我们虽不能准确预言一个婴儿出生后的性别,但大量观察,我们会发现妇女生男生女的可能性几乎一样大,都是0.5,这就是概率。

随机现象具有在一定条件下呈现多种可能结果的特性。

但由于到底出现哪种结果,却又无法事先预言。

因此,人们把随机现象的结果以及这些结果的集合体称作随机事件,简称事件。

当随机事件发生的可能性能用数量大小表示出来时,我们就得到了概率。

在统计学中,我们把类似掷一枚硬币的行为(或对某一随机现象进行观察)称之为随机试验。

随机试验必须符合以下三个条件:①它可以在相同条件下重复进行;②试验的所有结果事先已知;③每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果。

随机试验的每一个可能的结果,称为基本事件(或称样本点);所有可能出现的基本事件的集合,称为样本空间,记为Ω。

随机事件(可记为A、B、C等)如果仅含样本空间中的一个样本点,该事件称为简单事件;随机事件如果含样本空间中的一个以上的样本点,该事件称为复合事件。

换言之,复合事件是样本空间Ω的某个子集。

随机事件有两种极端的情况:一种是必然会出现的结果,称为必然事件;另一种是不可能出现的结果,称为不可能事件。

从样本空间来看,必然事件是由其全部基本事件组成的,可记为S;不可能事件则不含任何基本事件,可记为Φ。

2.事件之间的关系客观事物之间总是存在着一定的关系,随机事件之间也不例外。

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

统计学习题 第六章 概率与概率分布

统计学习题 第六章  概率与概率分布

第六章 概率与概率分布第一节 概率论随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法第二节 概率的数学性质概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提第三节 概率分布、期望值与变异数概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数一、填空1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( 机会均等 )。

2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。

所不同的是,)(x F 累计的是( 概率 )。

3.如果A 和B ( 互斥 ),总合有P(A/B)=P 〔B/A 〕=0。

4.( 大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。

5.抽样推断中,判断一个样本估计量是否优良的标准是( 无偏性 )、( 一致性 )、( 有效性 )。

6.抽样设计的主要标准有( 最小抽样误差原则 )和( 最少经济费用原则 )。

7.在抽样中,遵守( 随机原则 )是计算抽样误差的先决条件。

8.抽样平均误差和总体标志变动的大小成( 正比 ),与样本容量的平方根成( 反比 )。

如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应( 增大到16倍 )。

9.若事件A 和事件B 不能同时发生,则称A 和B 是( 互斥 )事件。

10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。

二、单项选择1.古典概率的特点应为(A )A 、基本事件是有限个,并且是等可能的;B 、基本事件是无限个,并且是等可能的;C 、基本事件是有限个,但可以是具有不同的可能性;D 、基本事件是无限的,但可以是具有不同的可能性。

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章概率分布
一、单选题
1.在人格测验上的分数形成正态分布μ= 80,σ=12,一个随机样本n=16,其均值大于85的概率是()。

A. 2.52%
B. % c. % D. %
2.让64位大学生品尝A.、B两种品牌的可乐并选择一种自己比较喜欢的。

如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表):
()
A.2.28% .01% D. %
3. 某个单峰分布的众数为15,均值是10,这个分布应该是( )
A.正态分布B.正偏态分布C.负偏态分布D.无法确定
4.一个单项选择有48道题,每题有四个备选项,用α=单侧检验标准,至少应对多少题成绩显著优于单凭猜测()。

A.16题B.17题C.18题题
5. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z值等于()
A.4.05
B.2.31
C.
D.
6. 某班200人的考试成绩呈正态分布,其平均数=l2,S=4分,成绩在8分和16分之间的人数占全部人数的()。

% D. 95%
7. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-M)/S这个公式中X应为()
.10 C D.
8. 在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值()
<10 >=10 C.N>30 D. N>10
9. t分布是平均数的对称的分布,当样本n趋于∞时,t分布为()
A. 二项分布
B. 正态分布
C. F分布
D. χ2分布
10. 概率和统计学中,把随机事件发生的可能性大小称作随机事件发生的()
A.概率
B.频率
C.频数
D. 相对频数
11. 在一次实验中,若事件B的发生不受事件A的影响,则称AB两事件为()
A.不影响事件
B.相容事件
C.不相容事件
D. 独立事件
12. 正态分布由()于1733年发现的
A.高斯
B.拉普拉斯
C.莫弗
D. 高赛特
13. 在正态分布下,平均数上下个标准差,包括总面积的()
% % D. %
14. 在次数分布中,曲线的右侧部分偏长,左侧偏短,这种分布形态可能是()
A.正态分布B.正偏态分布C.负偏态分布D.常态分布
15. 一个硬币掷10次,其中5次正面向上的概率是()
A.B.0.5 C.D.
16. t分布是由()推导出来的
A.高斯
B.拉普拉斯
C.莫弗
D. 高赛特
17. 一个硬币掷3次,出现两次或两次以上正面向上的概率是()
A.1/8 B.1/2 C.1/4 D.3/8
18. 有十道正误题,答题者答对()题才能认为是真会
A.5 B.6 C.7 D.8
19. 有十道多项选择题,每题有5个答案,其中只有一个是正确的,那么答对()题才能认为是真会
A.4 B.5 C.6 D.7
20. 正态分布的对称轴是过()点垂线。

A.平均数B.众数C.中数D.无法确定
21.在正态分布下Z=1以上的概率是()
A. 0.34 B.0.16 C. D.
22. 在正态分布下Z=到Z=之间的概率为()。

A. B.0.95 C. D.
23. 从n= 200的学生样本中随机抽样,已知女生为132人,问每次抽取一人,抽到男生的概率是()
A. B.0.34 C. D.
24. 两个骰子掷一次,出现两个相同点数的概率是()
A. 0.17
B. 0.083
C.
D.
25. 如果由某一次数分布计算得SK>0,则该次数分布为()
A.高狭峰分布B.低阔峰分布C.负偏态分布D.正偏态分布
26. 在正态总体中随机抽取样本,若总体方差已知,则样本平均数的分布为()
A.t分布B.F分布C.正态分布D.χ2分布
27. 从正态分布总体中随机抽取样本,若总体方差σ2未知,则样本平均数的分布为( )
A.正态分布
B.χ2分布分布分布
28. 下面各组分布中,不因样本容量的变化而变化的分布是()
A.正态分布 分布 C. χ2分布 分布
29. t 分布是关于平均值0对称的分布,当样本容量n 趋于∞时,t 分布为( )
A.正态分布
B. t 分布
C. χ2分布
D. F 分布
30. 总体呈正态分布,方差已知时,样本平均数分布的方差与总体方差间的关系为( ) A.σx 2 =n σ2 B. σx 2=n σ2 C. σx
2=n σ
D. σx 2=n σ
31. F 分布是一个正偏态分布,其分布曲线的形式随分子、分母自由度的增加而(

A.渐近χ2分布
B.渐近二项分布
C.渐近t 分布
D. 渐近正态分布
32. 设A 、B 为两个独立事件,则P(A ·B)为( )
A. P(A)
B. P(B)
C. P(A)·P(B)
D. P(A)+P(B)
33. 样本容量均影响分布曲线形态的是( )
A. 正态分布和F 分布
B. T 分布和T 分布
C. 正态分布和T 分布
D. 正态分布和χ2分布
34. 正态曲线与x 轴所围成区域的面积为( )
A. 0.5
B. 0.99
C. 1
D.
35. 对随即现象的一次观察为一次( )
A. 随机实验
B. 随机试验
C. 教育与心理实验
D. 教育与心理试验
36. 如果由某一次数分布计算得SK=0,则该次数分布为( )
A. 对称分布
B. 正偏态分布
C. 负偏态分布
D. 低阔峰分布
37. t 分布比标准正态( )
A. 中心位置左移,但分布曲线相同
B. 中心位置右移,但分布曲线相同
C. 中心位置不变,但分布曲线峰高
D. 中心位置不变,但分布曲线峰低,两侧较伸展
38. 一批数据中各个不同数值出现次数情况是( )
A. 次数分布
B. 概率密度函数
C. 累积概率密度函数
D. 概率
参考答案
二、多选题
l、依分布函数的来源,可把概率分布划分为()
A. 离散分布B.连续分布C.经验分布 D. 理论分布
2.使用正态分布表,可以进行的计算有( )
A.根据Z分数求概率B.根据概率求Z分数
C. 根据概率求概率密度
D. 根据Z值求概率密度
3. 检验次数分布是否正态的方法有()
A. 皮尔逊偏态量数法B.累加次数曲线法C.峰度偏度检验法 D. 直方图法
4. 正态分布中,如果平均数相同,标准差不同,那么()
A. 标准差大的正态曲线形式低阔B.标准差大的正态曲线形式高狭
C. 标准差小的正态曲线形式低阔D.标准差小的正态曲线彤式高狭
5. 正态分布曲线下,标准差与概率(面积)有一定的数量关系,即(),
A. 平均数上下一个标准差包括总面积的%
B. 平均数上下个标准差包括总面积的95%
C. 平均数上下个标准差包括总面积的99%
D. 平均数上下3个标准差包括总面积的%
6. 二项实验满足的条件有()
A. 任何一个实验恰好有两个结果
B. 共有n次实验,并且n是预先给定的任一整数
C. 每次实验可以不独立
D. 每次实验之间无相互影响
7. 下列关于二列分布正确的是()
A. 当p=q时图形是对称的
B. 二项分布不是离散分布,概率直方图是越阶式的
C. 当p q时图形呈偏态
D. 二项分布的极限分布为正态分布
8. 下列条件下的样本平均数的分布为正态分布的是()
A.总体分布为正态,总体方差已知
B.总体分布非正态,总体方差已知,样本n >30
C.总体分布为正态,总体方差未知
D.总体分布非正态,总体方差未知,样本n >30
9.下列条件下的样本平均数的分布为t分布的是()
A. 总体分布为正态,总体方差已知
B. 总体分布非正态,总体方差已知,样本n>30
C.总体分布为正态,总体方差未知
D.总体分布非正态,总体方差未知,样本n> 30
10. 下列关于t分布正确的是()
A.t分布的平均数是0
B.t分布是以平均数0左右对称的分布
C.当样本容量趋于无穷大时t分布为正态分布,方差为l
D.当n-1>30以上时,t分布接近正态分布,方差小于1
11. 下列不属于χ2分布特点的是( )
A.χ2分布是一个正偏态分布,正态分布是其中的特例
B. χ2值是正值
C. χ2分布具有可加性,但χ2分布的和不一定是χ2分布
D. 如果df >2,这时χ2分布的方差为df
12. 下面是F分布特点的是()
A.F分布是一个正偏态分布
B.F分布具有可加性,F分布的和也是一个F分布
C.F总为正值
D.当组间自由度为1时,F检验与t检验的结果相同
13. 心理与教育研究中,最常用的统计分布类型有()
A. 正态分布B.t分布C.χ2分布 D. F分布
14. 以下各分布中,因样本容量的变化而变化的分布是()
A. 正态分布B.t分布C.χ2分布 D. F分布参考答案:。

相关文档
最新文档