第五章概率分布及其应用

合集下载

概率第五章_大数定律与中心极限定理090505

概率第五章_大数定律与中心极限定理090505
加法法则
P ( − Eξ ε ) = ξ ≥
P(ξ ≥ Eξ + ε ) + P (ξ ≤ Eξ − ε )
k
=

k : xk ≥ E +
∑ξ ε p
k
+
k : xk ≤ E −
∑ξ ε p
pk +
k :xk ≥ E +
∑ξ ε
( x − Eξ ) 2
ε
2
k :xk ≤ E −
∑ξ ε
( x − Eξ ) 2
, 方差 Dξ n ( n = 1, 2,L),且 Dξi < l (i = 1, 2,L) 其中 l 与 i 无关的
1 Eξ = (1 + 2 + 3 + L + 6) 6
35 7 故 Eξ = Dξ = 12 2
4 2 = P (ξ = 5) + P(ξ = 6) + P (ξ = 1) + P (ξ = 2) = = 6 3 7 1 P( − 2 ) = P(ξ ≥ 5.5) + P(ξ ≤ 1.5) = P (ξ = 6) + P (ξ = 1) = ξ ≥

lim P ( − p < ε ) = 1 n →∞ n
ξ
此定理表明:当试验在不变的条件下重复进行很多次时, 随机事件的频率 频率在它的概率 概率附近摆动。 频率 概率 由贝努里大数定律可知,若事件A的概率很小很小时,则 它的频率也很小很小,即事件A很少发生或几乎不发生, 这种事件叫小概率事件。反之,若随机事件的概率很接近1, 则可认为在个别试验中这事件几乎一定发生。 同分布的两个或多个随机变量: 同分布的两个或多个随机变量 离散型: 它们的概率分布律相同. 离散型 它们的概率分布律相同 连续型: 它们的概率密度函数相同. 连续型 它们的概率密度函数相同 所以它们的期望与方差一定相同. 所以它们的期望与方差一定相同

概率论与数理统计 第五章

概率论与数理统计 第五章

Xn ⎯ ⎯→ X 2. 依概率收敛与依分布收敛的关系
依概率收敛 ⇒ 依分布收敛
L
3. 定义:中心极限定理 设随机变量 X ~ N(0,1),{Xi },i = 1, 2, … 相互独 立,且数学期望和方差都存在, 若标准化随机变量序列

n
i =1
Xi −
∑ E(X
i =1
n
i
)

n
i =1
D(X i)
所以结论成立。 由此有,若X ~ B( n, p ),对于足够大的n,有 ⎧ m1 − np X − np m2 − np ⎫ ⎪ ⎪ < ≤ P{m1 < X ≤ m2 }= P ⎨ ⎬ np(1 − p) np(1 − p) ⎪ ⎪ np(1 − p) ⎩ ⎭
⎧ Yn − np ⎫ ⎪ ⎪ ≤ x ⎬ = Φ( x ) lim P ⎨ n →∞ ⎪ np(1 − p ) ⎪ ⎩ ⎭
证明:对于任意正整数n,随机变量Yn 可表示为 证明:对于任意正整数n Yn = X1+ X2+…+ Xn X1, X2,…, Xn 相互独立,Xi ~ B( 1, p ),且有 E( Xi ) = p , D( Xi ) = p(1-p) 所以随机变量序列{ Xi }, i =1,2,…满足独立同分布 中心极限定理条件。即有
切比雪夫不等式的应用 1)估计随机变量落在某个区间内的概率 (P125例5.5.2) 2)估计ε的值, 使 P(│X - E(X)│<ε) ≥ a (0<a<1) 3)证明大数定律。
二. 大数定律 定义: 依概率收敛 设{Xn}是一个随机变量序列,X 是一个随机变量 或常数,若对于任意的ε> 0,有 lim P{| X n − X |≥ ε } = 0

概率与概率分布

概率与概率分布
第五章 概率及概率分布
掌握概率的概念、性质和法则 明确概率分布的含义,了解二项试验和分布
的基础知识。
概率与概率分布
第一节 概率的一般概念
概率论起源于17世纪,当时在人口统计、人 寿保险等工作中,要整理和研究大量的随机数据资 料,这就需要一种专门研究大量随机现象的规律性 的数学。
参赌者就想:如果同时掷两颗骰子 ,则点数 之和为9 和点数之和为10 ,哪种情况出现的可能 性较大?
概率与概率分布
一、频率和概率的定义
1. 频率 对随机现象进行观测时,若事件A在n次观测中出 现了m次,则m与n的比值,就是事件A出现的频 率(也称为相对频数)。用 W(A)表示事件A 的频率。 公式为:W(A)=m/n
概率与概率分布
2. 概率
概率是对随机事件出现可能性大小的客观量度。
事件A发生的概率记为P(A)。
概率与概率分布
二、概率的性质
1. 对于任何事件A,均有0≤P(A)≤1 2. 不可能事件的概率为零,P(V)=0 3. 必然事件的概率为1,P(U)=1
概率与概率分布
三、概率的加法和乘法
1. 概率的加法
互不相容事件:在一次试验中不可能同时出现的 事件。
事件之和:有限个互不相容事件中任意一个发生。 如:A+B=A或B发生。
假设把两枚硬币投1000次,得到的结果为下表:
正面的数量 0 1 2
总计
频数(f) 253 499 248 1000
百分比(%) 25.3 49.9 24.8 100.0
概率分布实质上是无限次抛掷的频数分布。尽 管我们永远不能观察到这个无限次抛掷的频数 分布,但我们知道这是的频数分布会无限接近 概率分布。
概率与概Байду номын сангаас分布

人大版_贾俊平_第五版_统计学_第5章_概率与概率分布

人大版_贾俊平_第五版_统计学_第5章_概率与概率分布

P ( ) = 1; P ( ) = 0
可加性
若A与B互斥,则P ( A∪B ) = P ( A ) + P ( B ) 推广到多个两两互斥事件A1,A2,…,An,有 P
( A1∪A2 ∪… ∪An) = P ( A1 ) + P (A2 ) + …+ P (An )
5.2.2 概率的加法法则 法则一
• 必然事件:每次试验一定出现的事件,用表示
例如:掷一枚骰子出现的点数小于7
• 不可能事件:每次试验一定不出现的事件,用表示
例如:掷一枚骰子出现的点数大于6
样本空间
1. 基本事件 • 一个不可能再分的随机事件 • 例如:掷一枚骰子出现的点数 2. 样本空间 • 一个试验中所有基本事件的集合,用表示 • 例如:在掷枚骰子的试验中,{1,2,3,4,5,6} • 在投掷硬币的试验中,{正面,反面}
连续型随机变量 1. 随机变量 X 取无限个值 2. 所有可能取值不可以逐个列举出来,而是 取数轴上某一区间内的任意点
试验 随机变量 可能的取值
X0 使用寿命(小时) 抽查一批电子元件 半年后工程完成的百分比 0 X 100 新建一座住宅楼 X0 测量一个产品的长度 测量误差(cm)
4800 1500 P( A B) P( A) P( B) 0.504 12500 12500
法则二 对任意两个随机事件 A 和 B ,它们和的 概率为两个事件分别概率的和减去两个事件 交的概率,即
P ( A∪ B ) = P ( A ) + P ( B ) - P ( A∩B )
事件的关系和运算(事件的包含) 若事件 A发生必然导致事件 B 发生,则称 事件 B 包含事件 A ,或事件 A 包含于事件 B ,记 作或 A B或 B A

第5章概率与概率分布

第5章概率与概率分布

第5章 概率与概率分布一、思考题、频率与概率有什么关系 、独立性与互斥性有什么关系、根据自己的经验体会举几个服从泊松分布的随机变量的实例。

、根据自己的经验体会举几个服从正态分布的随机变量的实例。

二、练习题、写出下列随机试验的样本空间:(1)记录某班一次统计学测试的平均分数。

(2)某人在公路上骑自行车,观察该骑车人在遇到第一个红灯停下来以前遇到的绿灯次数。

(3)生产产品,直到有10件正品为止,记录生产产品的总件数。

、某市有50%的住户订阅日报,有65%的住户订阅晚报,有85%的住户至少订两种报纸中的一种,求同时订这两种报纸的住户的百分比。

、设A 与B 是两个随机事件,已知A 与B 至少有个发生的概率是31,A 发生且B 不发生的概率是91,求B 发现的概率。

、设A 与B 是两个随机事件,已知P(A)=P(B)=31,P(A |B)= 61,求P(A |B ) 、有甲、乙两批种子,发芽率分别是和。

在两批种子中各随机取一粒,试求: (1)两粒都发芽的概率。

(2)至少有一粒发芽的概率。

(3)恰有一粒发芽的概率。

、某厂产品的合格率为96%,合格品中一级品率为75%,从产品中任取一件为一级品的概率是多少、某种品牌的电视机用到5000小时未坏的概率为43,用到10000小时未坏的概率为21。

现在有一台这种品牌的电视机已经用了5000小时未坏,它能用到10000小时的概率是多少、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%,25岁以下青年在小学、初中、高中及高中以上文化程度各组中的比例分别为20%,50%,70%。

从该厂随机抽取一名职工,发现年龄不到25岁,他具有小学、初中、高中及高中以上文化程度的概率各为多少、某厂有A ,B ,C ,D 四个车间生产同种产品,日产量分别占全厂产量的30%,27%,25%,18%。

已知这四个车间产品的次品率分别为,,和,从该厂任意抽取一件产品,发现为次品,且这件产品是由A ,B 车间生产的分布。

概率论与数理统计课件第5章-PPT精品文档

概率论与数理统计课件第5章-PPT精品文档

PX Q 0 . 5 2
1
第三四分位数Q3: PX Q 0 . 7 5 3
例1
为对某小麦杂交组合F2代的株高X进行研究,抽
取容量为100的样本,测试的原始数据记录如下(单位: 厘米),试根据以上数据,画出它的频率直方图,求随
机变量X的分布状况。
87 99 86 87 84 85 96 90 103 88 91 94 94 91 88 109 83 89 111 98 102 92 82 80 91 84 88 91 110 99 86 94 83 80 91 85 73 98 89 102 99 81 80 87 95 70 97 104 88 102 69 94 95 92 92 90 94 75 91 95 102 76 104 98 83 94 90 96 80 80 90 92 105 92 92 90 94 97 86 91 95 94 88 96 80 94 92 91 77 83
样本方差( X X i n 1i 1


几个常用的统计量
设 (X ,X , 1 2 是总体 X 的一个样本, ,X n) 样本均方差或标准差
2 1 n S X i X n 1i 1


它们的观测值用相应的小写字母表示.反映总 体X取值的平均,或反映总体X取值的离散程度。
几个常用的统计量
设 (X ,X , 1 2 是总体 X 的一个样本, ,X n)
子样的K阶(原点)矩
1 n k Ak X i n i 1
子样的K阶中心矩
1 B k X i X n i1
n


k
数据的简单处理
为了研究随机现象,首要的工作是收集原始数据. 一般通过抽样调查或试验得到的数据往往是杂乱无章

第五章概率与概率分布

第五章概率与概率分布

P( A)
事件A发生的次数m 重复试验次数n

m n
英语字母出现频率
space 0.2 ; I 0.055 ; C 0.023 ; G 0.011 ; Q 0.001 ; E R U B Z 0.105 ; T 0.072 ; 0.054 ; S 0.052 ; 0.0225 ; M 0.021 ; 0.0105 ; V 0.008 ; 0.001 O H P K 0.0654 ; 0.047 ; 0.0175 ; 0.003 ; A D Y X 0.063 ; 0.035 ; 0.012 ; 0.002 ; N 0.059 L 0.029 W 0.012 J 0.001
一、概率(Probability)的定义
概率:0-1之间的数,衡量事件A发生可能 性(机会)的数值度量。记P(A) •Probability: A value between 0 and 1, inclusive, describing the relative possibility (chance or likelihood) an event will occur.
P ( A) A包 含 的 可 能 结 果 (偶 数 ) 全部可能结果 3 6
实际与理论分析不符时,实际中可能作弊。
如:河北银行人员为买奖券,盗2000万并没中大奖。
西安彩票中心人员中奖率极高,结果是作弊。
例:已知有148名学生统计表
专业
性别
男 女
金融学院 工商学院 经济学院 会计学院 15 15 22 14 30 12 25 15
摘自:概率论与数理统计简明教程1988》李贤平 卞国瑞 立鹏,高等教育出版社

大量统计的结果,用于破解密码
美国正常人血型分布

数的概率分布

数的概率分布

数的概率分布概率分布是概率论中重要的概念之一,用于描述一个随机变量取值的可能性。

在数学和统计学领域里,数的概率分布研究了在特定情况下数值出现的概率。

本文将介绍数的概率分布的基本含义、常见的概率分布类型以及其在实际应用中的重要性。

一、概率分布的基本定义概率分布是随机变量的可能取值及其对应概率的描述。

随机变量可以是离散型变量或连续型变量。

离散型变量的取值有限且可数,如掷骰子的点数;连续型变量的取值为无限个且不可数,如人的身高。

概率分布描述了随机变量每个取值的概率。

二、常见的概率分布类型1. 离散型概率分布离散型概率分布用于描述随机变量为离散型的情况。

以下是几种常见的离散型概率分布:(1)伯努利分布伯努利分布是一种简单的离散型分布,常用于描述试验只有两个可能结果的情况,如硬币的正反面。

(2)二项分布二项分布是描述n次成功失败试验的离散型分布,例如n次掷硬币中正面朝上的次数。

(3)泊松分布泊松分布用于描述单位时间内随机事件发生的次数,如单位时间内电话呼叫次数、交通事故发生次数等。

2. 连续型概率分布连续型概率分布用于描述随机变量为连续型的情况。

以下是几种常见的连续型概率分布:(1)均匀分布均匀分布描述了在一个区间内随机取值时,每个取值的概率相等,如抛硬币的落点在一个平面上的坐标。

(2)正态分布正态分布是最常见的连续型概率分布之一,也称为高斯分布。

它以钟形曲线为特征,广泛应用于自然和社会科学领域,如身高、体重等。

(3)指数分布指数分布用于描述事件发生的时间间隔或等待时间,如设备故障发生的时间间隔、用户等待的响应时间等。

三、概率分布在实际应用中的重要性概率分布在实际应用中具有重要的作用,主要体现在以下几个方面:1. 预测和决策通过分析和建模某个事件或现象的概率分布,可以对未来可能的结果进行预测。

例如,在金融领域中,通过对股票收益率的概率分析,可以帮助投资者做出决策。

2. 风险评估概率分布可以用于评估风险。

在保险行业中,通过对保险索赔次数或大小的概率分析,可以估算保险公司的风险,并确定合理的保费。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小概率事件
是指在一次实验中发生的可能性极小,但在 大量重复实验中,终究会发生的事件。心理 与教育统计学中一般将概率小于0.05或 0.001的事件定为小概率事件。是统计推断 的基础。
概率的性质
公理性质:
任何一个随机事件都是非负的; 必然事件的概率为1; 不可能事件的概率为0;
加法定理
两个互不相容的事件之和的概率为两个事件 概率之和。
第五章 概率分布及其应用
第一节 概率基础 第二节 正态分布及其应用 第三节 二项分布 第四节 抽样分布
第一节 概率基础
一. 随机事件及其概率 二. 概率的性质与运算法则
事件的几个概念
事件:随机试验的每一个可能结果(任何样本点集合) 例如:掷一枚骰子出现的点数为3
随机事件:每次试验可能出现也可能不出现的事件 例如:掷一枚骰子可能出现的点数
Z1 p0.3413
Z1 p0.3413
0.3413
-1 0 1 z
求任意两个Z 值间的 p值
0.34 ~0.62
Z0.34p10.130 3 .2232 0.34655
=1
Z0.62
p 0.1331
.3655 p 0.2324
.1331 .2324
-.34 0 .62 Z
0.87~1.28
Z1.28 p 0.3997 Z0.87 p 0.3078
平均数与众数在同一点,此点y值最大。左右 相同间距的面积相等,y值也相等。
3、中央点最高,然后渐向两侧下降,曲 线的形势为先向内弯,然后向外弯,拐点 位于正负一个标准差附近,曲线两端向基 线处无限延伸,但终不与基线相交。
4、正态曲线下的面积为1,对称轴的两 边面积各为0.5
和 对正态曲线的影响
f(x) B
A
C
x
正态分布的概率
概率是曲线下的面积! f(x)
b
P(axb)a f(x)dx?
ab
x
二、标准正态分布
Z X
一般正态分布
标准正态分布
1
x
Z
标准正态分布方程及特点
概率密度函数
Y
1
X2
e2
2
特点: 1、z0为中心,双侧对称
2、曲线在z0处为最高点
3、曲线以最高点向左右两侧缓慢下降,且无 限延伸,但理论上面永远不与基线相交
▪查表法:近似结果
p0.2468 z0.67
p0.25,z17 0.68
0.25
0? z
▪内插法:精确结果
▪公式 ZXZ1P P2P P11Z2Z1
0 .2 5 0 .2486 zX Z 1 0 .25 0 1 .27 4 (0 .6 8 8 6 0 .6) 7 0 .684
2)已知位于概率两端的p,求概率分界点的Z值
必然事件:每次试验一定出现的事件 例如:掷一枚骰子出现的点数小于7
不可能事件:每次试验一定不出现的事件, 例如:掷一枚骰子出现的点数大于6
事件与样本空间
基本事件 一个不可能再分的随机事件 例如:掷一枚骰子出现的点数
样本空间 一个试验中所有基本事件的集合,用表示 例如:在掷枚骰子的试验中,{1,2,3,4,5,6} 在投掷硬币的试验中,{正面,反面}
上端0.05的概率分界点的 Z值
0.5-0.05=0.45
P0.4495p 0.4 5 0 3
z1.64z1.65
=1
0.05
f (x)
经典统计推断的基础
x
概率密度函数
Y
1
X2
e 22
Y =概率密度
2
= 总体方差
=3.14159; e = 2.71828
x = 随机变量的取值 (- < x < )
= 总体均值

正态分布函数的特征
1、一簇曲线,随平均数标准差不同,分布不同 2、 所有曲线对称,对称轴为过均数的垂线。中数、
类型
1、离散分布与连续分布
离散分布:离散随机变量的概率分布,如二 项分布;
连续分布:连续随机变量的概率分布,如正 态分布
2、经验分布与理论分布
经验分布:根据观察或实验所获得的数据而编制的 次数分布或相对频率分布;
理论分布:一指随机变量概率分布的函数—数学模 型;二指按某种数学模型计算出的总体次数分布;
后验概率
在相同条件下进行n次随机试验,事件A出现 m次,则比值 m/n 称为事件A发生的频率。N 无穷大时,它将稳定在一常数P,这一常数即 为事件A的概率,记为
pA
m n
p
先验概率
在特殊情况下直接计算的比值,是真实的,而 不是估计值。 1、实验的每种可能结果是有限的 2、每一基本事件出现的可能性相等
4、标准正态曲线只有一条
三、标准正态分布表的应用
(一)、正态曲线表
标准正态分布表:以 为测量面积的单位,用积
分法则算出 Z所对应的各个部分的面积及y值,制 成的曲线表。
正态曲线表的三个数值
面积值:p
高度值: y 刻度值: Z
(二)三个值的求解
1、Z p
求均数与某个 Z 值间的 p 值 Z0~Z1Z0~Z1 0.3413
p20.390 9 .3700 7.08919
.3078
=1
.3997
.0919
Z
0 0.87 1.28
求任意两个Z 值间的 p值
Z值符号相反,p用加法求; Z值符号相同, p用减法求。
求某个 Z值以上或以下的面积 p
Z0.85以下和 Z1.76以上的面积
Z0.85 p 0.3023.3023
p10.500.4091 0.08082
=1
.4608
Z1.76 p 0.4608
.1151
p20.500.3084 0.1915-1 .85 0 1.76 Z
求负值以下,或正值以上某个z值的 概率,要用0.5减去对应Z值的查表值
2、Z p
求均数与某个 p 值间的 z值
例已知平均数以上0.25的概率,求 p
互不相容的事件指在一次观测中不能同时发 生的事件。
p(AB) P(A)P(B)
乘法定理:
两个独立事件同时发生的概率等于这两个事件 各自出现概率的乘积。
独立事件指一个事件的出现对另一个事件的出 现不发生影响。
公式表示为:
p(AB) P(A)P(B)
概率分布
定义: 指用数学方法(函数)对随机变量取值的分 布情况加以描述。
3、基本随机变量分布与抽样分布
基本随机变量分布:理论分布中描述构成总 体的基本变量的分布
抽样分布:样本统计量的理论分布;样本统 计量是基本随机变量的函数,故抽样分布
又称为基本随机变量函数的分布。
第二节 正态分布及其应用
一、正态分布
描述连续型随机变量的最重要的分布
可用于近似离散型随机变量的分布
例如: 二项分布
相关文档
最新文档