第六章 概率分布@

合集下载

教育与心理统计学第六章:概率分布

教育与心理统计学第六章:概率分布
生活中有很多这样的事例
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用

第六章概率分析

第六章概率分析

T 70 65 60 56
正态分布表的应用
①将原始数据整理为次数 分布表; ②计算各组上限以下累加 次数; ③计算各组中点以下累加 次数; ④计算各组中点以下累积 比率; ⑤查正态分布表,将概率 转化为Z分数; ⑥将正态化以后的Z值进行 线性转换:T=10Z+50
140135130125-
120115110105100959085807570-
122
117 112 107 102 97 92 87 82 77 72
28
16 16 8 9 8 7 6 6 5 5
0.14
-0.17 -0.40 -0.59 -0.73 -0.90 -1.06 -1.25 -1.46 -1.70 -2.12
51
48 46 44 43 41 39 38 35 33 29

分析:包括两种情况:先抽一黑球、后抽一白球;
先抽一白球、后抽一黑球。
3 2 2 3 P 0.48 5 5 5 5
例4
一枚硬币掷3次,或三枚硬币各掷一次,问出现两
次或两次以上H的概率是多少?
解:可能出现的情况有:HHH HHT HTH THH TTH
THT HTT TTT共8种。每种情况出现的概率,为

根据随机变量的取值是否连续,可将随机变量分为
离散型随机变量与连续型随机变量。

当随机变量只取孤立的数值,这种随机变量称为离
散型随机变量。如投掷一枚硬币4次,几次正面朝上?因 取值只能为0、1、2、3、4,故为离散型随机变量。
离散分布与连续分布

离散型随机变量的概率分布称作离散分布。连续分
布是指连续型随机变量的概率分布,即测量数据的概率 分布。心理统计学中最常用的连续型分布是正态分布。

概率与概率分布

概率与概率分布

第六章概率与概率分布推论统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础的。

通过概率论,可以知道在一定条件下,总体的各种抽样结果所具有的概率特性。

然后,推论统计依据这些概率特性,研究在发生了某种抽样结果的情况下总体参数是什么,或者对社会研究中提出的某种假设进行检定。

学习推论统计必须首先对概率论有所了解。

第一节概率论1.随机现象和随机事件概率是与随机现象相联系的一个概念。

所谓随机现象,是指事先不能精确预言其结果的现象。

随机现象具有非确定性,但内中也有一定的规律性。

例如,事先我们虽不能准确预言一个婴儿出生后的性别,但大量观察,我们会发现妇女生男生女的可能性几乎一样大,都是0.5,这就是概率。

随机现象具有在一定条件下呈现多种可能结果的特性。

但由于到底出现哪种结果,却又无法事先预言。

因此,人们把随机现象的结果以及这些结果的集合体称作随机事件,简称事件。

当随机事件发生的可能性能用数量大小表示出来时,我们就得到了概率。

在统计学中,我们把类似掷一枚硬币的行为(或对某一随机现象进行观察)称之为随机试验。

随机试验必须符合以下三个条件:①它可以在相同条件下重复进行;②试验的所有结果事先已知;③每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果。

随机试验的每一个可能的结果,称为基本事件(或称样本点);所有可能出现的基本事件的集合,称为样本空间,记为Ω。

随机事件(可记为A、B、C等)如果仅含样本空间中的一个样本点,该事件称为简单事件;随机事件如果含样本空间中的一个以上的样本点,该事件称为复合事件。

换言之,复合事件是样本空间Ω的某个子集。

随机事件有两种极端的情况:一种是必然会出现的结果,称为必然事件;另一种是不可能出现的结果,称为不可能事件。

从样本空间来看,必然事件是由其全部基本事件组成的,可记为S;不可能事件则不含任何基本事件,可记为Φ。

2.事件之间的关系客观事物之间总是存在着一定的关系,随机事件之间也不例外。

心理统计概率分布

心理统计概率分布
5. 在正态曲线下的面积为1,且标准差与概率(面积) 有一定的数量关系。正负一个 标准差之间包含总面 积的68.26%,正负1.96个标准差之间包含总面积的 95%,正负2.58个标准差之间包含总面积的99%。
二、正态分布表的编制与使用(p164)
心理统计概率分布
心理统计概率分布
三、次数分布是否正态的检验方法 (一)皮尔逊偏态量数法(p166)
心理统计概率分布
(一)后验概率的定义(p157)
后验概率:以随机事件A在大量重复试验中出现的稳定频率值, 作为随机事件A的概率估计值,这种求得的概率叫做后验概率。
(二)先验概率的定义(p157 ) 也称之为古典概率。是通过古典概率模型加以定义的,也
称为古典概率。比满足两个条件:
试验的所有可能结果是有限的。 每一种可能结果出现的可能性(概率)相等。
偏态分布:一种正偏态;另一种负偏态 描述分布形态的偏态量公式:
心理统计概率分布
(二)峰度、偏度检验法 一般情况下,观测数据的数目要足够大,才有意义。
1. 偏度系数(只有观测数目N>200,这个公式才有意 义。)
2. 峰度系数(只有N>1000,计算才有意义)
心理统计概率分布
心理统计概率分布
四、正态分布理论在测验中的应用(p167) (一)化等级评定为测量数据 (二)确定测验题目的难易程度 (三)在能力分组或等级评定确定人数 (四)确定录取分数线 (五)测验分数正态化
三、二项分布的应用(P181)
心理统计概率分布
心理统计概率分布
第四节 抽样分布
一、抽样分布的概念 要区分以下三种不同性质的分布: 1. 总体分布:总体内每一个体数值的频数分布 2. 样本分布:样本内每一个体数值的频数分布 3. 抽样分布:某一种统计量的概率分布(一个理论的 概率分布,是统计推断的理论依据)

第六章__概率分布

第六章__概率分布
面积的95%;正负2.58个标准差之间,包含总面积的 99%;正负3个标准差之间,包含总面积的99.74%。
二、正态分布表的编制与使用
• (一)正态分布表的编制与结构
• 正态分布表的结构一般包括三栏
• 第一栏:Z分数单位;
• 第二栏:密度函数或比率数值(y);
• 第三栏:概率值(p)。
• (二)正态分布表的使用
2
3
• 当g2=0时,正态分布的峰度;g2>0时,分布的峰度 比正态分布的峰度低阔;g2<0时,表明分布的峰度比 正态分布的峰度高狭。当N>1000时,g2值才比较可 靠。
• (三)累加次数曲线法
• 正态分布概率曲线和样本的累加频率曲线完全重
合说明样本分布为正态;若偏离,则不符合。
• 四、正态分布理论在测验中的应用
-0.84 -0.525 0 0.84 1.645 2.33
4.160 4.475 5.000 5.840 6.645 7.330
• (三)在能力分组或等级评定时确定人数
• ①将6个标准差除以分组的或等级的数目,做到Z
分数等距;
• ②查正态分布表,从Z求p,即各等级或各组在等
距的情况下应有的比率; • ③将比率乘以欲分组的人数,便得到各等级或分 组该有的人数。
• (二)二项分布
• 二项分布:试验仅有两种不同性质结果的概率分布。也称 两个对立事件的概率分布。
• 二项分布同二项定理有着密切的关系:
n 1 n1 n1 n1 n n (p+q)n =C0 p +C p q + +C pq +C n n n nq
x x n x (p +q)n = Cn pq n

心理统计学课件第六章 概率分布

心理统计学课件第六章 概率分布

(三)正态分布的特征
正态分布的形式是对称的,它的对称轴是 经过平均数点的垂线。
正态分布的中央点(即平均数点)最高, 然后逐渐向两侧下降。
正态曲线下的面积为1,平均数点的垂线 将面积划分为相等的两部分0.50。
正态分布曲线,标准差与概率有一定的数 量关系。
二、正态分布表的结构与使用
2、已知P值,求Z分数
已知从平均数开始的概率值,求Z值 已知位于两端的概率值,求该概率分界点
上的Z值 已知正态曲线中间部分的概率,特定区间的人数 求考试成绩中某一特定人数比率的分数界
限 按能力分组或等级评定时确定人数 将等级评定结果转化为测量数据
按能力分组或等级评定时确定人数
要把100人在某一能力上分成5个等级, 各等级应该有多少人?
将等级评定结果转化为测量数据
某教师评价全班50人的作文,有8人优, 17人良,20人中,5人及格,求各等级的 标准分数
求考试成绩中特定区间的人数
已知某年级200名学生考试呈正态分布, 平均分为85分,标准差为10分,学生甲 的成绩为70分,问全年级成绩比学生甲低 的学生人数是多少?
求考试成绩中某一特定人数比率的分数界限
某次招生考试,学生成绩符合正态分布, 学生成绩的平均分为80分,标准差为10 分,要择优录取25%的学生进入高一级学 校学习,问最低分数线应是多少?
第六章 概率分布 第三节 正态分布
一、正态分布特征
(一)正态分布的概念 与二项概率分布对比 变量类型 图形
正态分布:
在一个概率分布中,中间频数多,两 端频数对称地减少,成为一种“钟”形对 称的理论概率分布。
(二)正态分布曲线
标准正态分布的密度函数:

06 概率分布

06   概率分布
概率分布 心理统计学
2、经验分布与理论分布

依分布函数的来源,可将概率分布分为经验
分布与理论分布。

经验分布(empirical distribution)是指根据
观察或实验所获得的数据而编制的次数分布或相 对频率分布。

理论分布(theoretical distribution)是按某
心理统计学
段Z值之间的面积,再乘以总人数,即为各
等级人数。
概率分布 心理统计学
例题
要把100人在某一能力上分成5个
等级,各等级应该有多少人,才能使
等级评定做到等距?
概率分布
心理统计学
注意事项:
最后所计算的各组人数分布,应
该与总数相等。
概率分布
心理统计学
解:
分 组 A B C
6 5 1.2
是指对随机变量取不同值时的概率的描述,一 般用概率分布函数进行描述。

依不同的标准,对概率分布可作不同的分
类。
概率分布 心理统计学
1、离散型分布与连续型分布

依随机变量的类型,可将概率
分布分为离散型概率分布与连续型 概率分布。心理与教育统计学中最
常用的离散型分布是二项分布,最
常用的连续型分布是正态分布。
上的曲线纵坐标的高度。

概率值(p),即不同Z分数点与平均数之间的
心理统计学
面积与总面积之比。
概率分布
2.正态分布表的使用
已知Z值求概率
⑴.求Z=0至某一Z值之间的概率: 直接查表 ⑵.求两个Z值之间的概率


两Z值符号相同:PZ1-Z2=PZ2-PZ1
两Z值符号相反:PZ1-Z2=PZ2+PZ1

试验统计方法第六章概率分布解析

试验统计方法第六章概率分布解析

四、农药药效的调查和计算
药效试验的目的,是要取得各种农药防治病虫害的 效果的数据,故必须在处理前后分别检查死亡虫数或残 存虫数.病株数、病叶数和病斑数等,然后根据处理前 后虫、病数的变化或增减,求得防治效果,以表示农药 的药效。
农药药效的表示方法
杀虫剂的药效常用 害虫死亡率、虫口减退率、被害 率、缺苗率、防治效果等来表示; 杀菌剂的药效常用 发病率、普遍率、病情指数、防 病效果等来表示。
(五)事件的独立性
如果事件A的发生与否不影响事件B发生的可 能性,则称事件A和事件B相互独立。
四、频率和概率
(一)频率
某种事件在多次进行同样试验中,发生该事件的次 数(a)和试验次数(n)的比率便是频率。即频率=a/n。
例6-1:如多次随机调查不同株数棉花受棉铃虫危害的 数量及计算被害频率如下:
调查株数 10 受害株数 3 被害频率 0.300 20 3 0.150 50 10 0.20 100 22 0.220 200 43 0.215 500 108 0.216 1000 215 0.215
校正虫口 = 下 降 率(%)
×100
1 - 对照区虫口下降率
蚜虫、红蜘蛛等害虫繁殖较快,使对照区虫量有增有减,其 公式改为:
处理区虫口下降率±对照区虫口下降率 校正虫口= 下降率(%) ×100
1 ± 对照区虫口下降率
(二)杀菌剂效果的计算: 1、根据防治前后发病率的计算公式 对照区发病率 - 防治区发病率 防治效果(%)= ×100 对照区发病率 2、根据防治前后病情指数增长率的计算公式 对照区病情指数 - 防治区病指 防治效果(%)= ×100 对照区病情指数
频率是事件发生之后,其发生次数占总次数的现实比 率,它不包含事件将来发生的可能性。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、二项试验
满足以下4个条件的试验称为二项试验:
1.一次试验只有两种可能的结果;
2.共有n次试验,n是事先给定的任一整数; 3.各次试验相互独立,即各次试验之间互不影响; 4.某种结果出现的概率在任何一次试验中都是固定的,即 某个事件每次出现的概率都相等。
如:抛硬币(正面/反面),判断(对/错),考试通过和不
通过,应聘录取和落聘……
二、二项分布
二项分布:是指试验仅有两种不同性质结果的概率分布。 具体定义:有n次试验,各次试验彼此独立,每次试验某事件出 现的概率都是P,某事件不出现的概率都是q(1-P),则对于某 事件出现X次(0,1,2,…n)的概率分布为:
b X .n . p C n p q
造成分数解释上的困难。
⑶科目性质不同,直接把各科原始分相加不合理。
例题:下表是两名高考学生的成绩,试分析哪一位考生 的成绩更好?
科目
语文 政治
原始成绩 甲 85 70 乙 89 62
全体考生 平均分 70 65 标准差 10 5
外语
数学 理化
68
53 72
72
40 87
69
50 75
8
6 8
Σ
348
(二)经验分布与理论分布

依分布函数的来源,可将概率分布分为经验分布与理 论分布。 经验分布(empirical distribution)是指根据观察或实 验所获得的数据而编制的次数分布或相对频率分布。


理论分布(theoretical distribution)是按某种数学模
型计算出的概率分布。
1.随机事件的频率 ——在相同条件下进行n次重复试验,如果随机事件A发生的 次数为m ,那么m/n称为随机事件A的频率; W ( A ) 2.随机事件的概率 ——当n无限增大时,随机事件A的频率会稳定在一个常数P, 这个常数就是随机事件A的概率。
P A Lim m n
m n
n
这样定义的概率称为后验概率或统计概率。
记作u~N(0,1)
6.标准差与面积之间的关系

关于标准正态分布,以下几种概率应当熟记:
P(-1≤Z ≤ 1)=0.6826 P(-2≤Z ≤ 2)=0.9545 P(-3≤Z ≤ 3)=0.9973 P(-1.96≤Z ≤ 1.96)=0.95 P (-2.58≤Z ≤ 2.58)=0.99
P( A B ) P A P B
P( A
A2 An )
1
P A
1

P A
2

P A
n

(三)概率的乘法定理

若事件A发生不影响事件B是否发生,这样的两个事件为 互相独立事件。
两个互相独立事件积的概率,等于这两个事件概率的乘积, 即

P( A B ) P A P B
(一)概率的公理系统
1.任何随机事件A的概率都是非负,即 0 ≤ P(A)≤1 2.必然事件的概率等于1,即 P(A)= 1 3.不可能事件的概率等于零,即 P(A)= 0
(二)概率的加法定理
◆若事件A发生,则事件B就一定不发生,这样的两个事件为
互不相容事件。

两互不相容事件和的概率,等于这两个事件概率之和,即

解:考试成绩服从正态分布,根据题意招生人数的 概率为P(Z≥Z0) = 150/2800 = 0.05357 P(0<Z< Z0) = 0.5-0.05357 = 0.44643 查正态分布表,得Z0 = 1.6112 X0= 75 + 1.6112×8 = 87.8894 ≈ 88
五、正态分布理论在测验中的应用 (一)化等级评定为测量数据


直接查正态分布表就能得到相应的概率密度Y值。
如果由概率P求Y值,要注意区分已知概率是位于
正态曲线的中间部分,还是两尾端部分,才能通过
查表求得正确的概率密度。

例:在某年高考的平均分数为500,标准差为100的正态总体 中,某考生得到650分。设当年高考录取率为10%,问该生成
绩能否入围?

解:该生的标准分数为
X X
n X

n! X ! n X !
p
X
q
n X
例6-4
b X . n . p :n次试验中某事件出 现X次,每次试验出现 的概率为P,不出现的 概率为q.
例:从男生占2/5的学校中随机抽取6个学生,问正 好抽到4个男生的概率是多少?最多抽到2个男生的 概率是多少? 解:将n=6,p=2/5,q=3/5,X=4代入公式,则恰好抽到4 个男生的概率为:
2 2
其中μ为平均数,σ2为方差,称随机变量x服从正态 分布 , 记为x~N(μ,σ2)。
二、 正态分布 的特征
1.正态分布是对称的曲线,对称轴为x=μ;M=Md=Mo,y(max) =0.3989 2.正态曲线的拐点为正负1个标准差处。 3.正态曲线下的面积为1,左右两边相等=0.5
4.正态分布随平均数μ与标准差σ的变化而变化。
第六章
概率分布
★为何要学习概率分布?
推测

研究的目的:样本———————总体:推论统计 需要指出推论结果的可能性大小,即概率。 概率分布理论是推论统计的基础。
第一节
概率的基本概念
一、什么是概率
——表明随机事件出现可能性大小的客观指标。
在一定条件下可能出现也可能不出现的 事件或现象。
(一)后验概率(或统计概率)

从表可看出,随着实验次数的增多, 1个人发生从
众行为这个事件的概率越来越稳定地接近0.7,我
们就把0.7作为这个事件的概率。

在一般情况下,随机事件的概率 p 是不可能 准确得到的。通常以试验次数n充分大时随机事件A 的频率作为该随机事件概率的近似值。

即 P(A)=p≈m/n
(n充分大)
(二)先验概率(古典概率)
2 5 )
b ( 4 ,6 ,
C6 p q
4 4
2
2 3 4 ! 2 ! 5 5 6!
第二节 正态分布

正态分布(normal distribution)也称为常态分 布,是连续型随机变量概率分布的一种,是在数理 统计的理论与实际应用中占有最重要地位的一种理 论分布,也称高斯分布。
一、正态分布曲线函数
正态分布曲线函数又称概率密度函数,其一般 公式为 X 1 2 Y e 2
三、概率分布类型

概率分布(probability distribution)是指对随机
变量取不同值时的概率分布情况用函数进行描述。

依不同的标准,对概率分布可作不同的分类。
(一)离散型分布与连续型分布

依随机变量的类型(是否具有连续性),可将概率分布分 为离散型概率分布与连续型概率分布。

心理与教育统计学中最常用的离散型分布是二项分布,最 常用的连续型分布是正态分布。

例2:从30个白球和20个黑球共50个球中随机抽取两 次(放回抽样),问抽出一个黑球和一个白球的概率 是多少?

抽出一个白球的概率为3/5,抽出一应包括先抽出一 个黑球、后抽出一个白球和先抽出一个白球、后 抽出一个黑球两种情况。因此:
P 3 5 2 5 2 5 3 5 0 . 48
抽,则4个学生都抽到试题1的概率是多少?
抽到第一题或第二题的概率应为抽到第一题
的概率和抽到第二题的概率之和,即
P A B P A P B 1 5 1 5 2 5
四个学生都抽到第一题即四个学生同时抽
到第一题,其概率应为抽到第一题的概率 的乘积,即
P A1 A 2 A 3 A 4 1 5 1 5 1 5 1 5 1 625
5.正态分布可以转化为标准正态分布曲线(μ=0,σ2=1)。
三、标准正态分布

对于任何一个服从正态分布N(μ,σ2)的随机变量x,都 可以通过标准化变换:z=(x-μ)/σ;将标准分数代入 正态曲线函数,并且,令σ=1,则公式变换为标准正态 分布函数:
Y

1 2
e

Z
2
2
标准正态分布的μ=0,σ2=1,


求各等级中点以上(或以下)的累积比率;
用累积比率查正态分布表; 求被评者所得评定等级的数量化值的平均值。
(二)确定测验题目的难易度P171
(三)在能力分组或等级评定时确定人数

如要将某种能力的分数分成等距的几个等级,在确定各等级 人数时,可将正态分布基线上Z=-3至Z=+3之间6个标准 差的距离分成相等的几份,然后查表求出各段Z值之间的面 积,再乘以总人数,即为各等级人数。

(例6-3)

例:今有1000人参加一项数学能力测验,欲将测验结 果评为六个等级。问各等级评定的人数应是多少?
(四)以标准分数表示考试成绩
★比较学生的考试成绩时,使用原始分数有其 不合理之处:
⑴原始分制度没有提示考生成绩在考生团体成绩中的位置。
⑵由于各科命题难度不同,导致各科原始分之间不能直接比较,
P( A A
1 2 A n )
P A P A P A
1 2
n

如,两次抽到扑克牌方块K的概率。例6-1
练习题

例1:某一学生从5个试题中任意抽取一题,
进行口试。如果抽到每一题的概率为1/5,则
抽到试题1或试题2的概率是多少? 如果前
一个学生把抽过的试题还回后,后一个学生再
如果随机试验满足两个条件:

⑴ 试验的所有可能结果是有限的; ⑵ 每一种可能结果出现的可能性相等。 含有m个基本事件,则事件A的概率为m/n,即
相关文档
最新文档