复旦版工程数学之概率统计第2讲PPT课件

合集下载

2概率统计第二讲PPT课件

称X服从参数为(N, M, n)的超几何分布.
7. 泊松(Poisson)分布P()
X～P{X＝k}＝ k e , k＝0, 1, 2, … (0) k!
7
四、常用分布律之间的关系
1. (0－1)分布和二项分布的关系 (0－1)分布是二项分布B(n, p)中n＝1时的特款； 2. 几何分布和负二项分布的关系几何分布是负二项分布NB(r, p)中r＝1时的特款； 3. 超几何分布和二项分布的关系定理1 设在超几何分布中，n是一个取定的正整数，而 lim M ＝p, 则
N N
N l i m Ck M C Cn N n NkM＝ Ck Npk(1p)nk, k＝0, 1, 2, …, n
8
4. 二项分布和泊松分布的关系
定理2 设随机变量Xn~b(n, pn), (n＝0, 1, 2, …), 且
ln i m npn0, 为常数，则
ln i m Ck npk n(1pn)nk＝ kk !e, k＝ 0, 1, 2, …
5
三、一维离散型r.v的几个常用分布
1. 退化分布(单点分布)
X～P{X＝a}＝1，其中a为常数。
2. (0－1)分布(两点分布) X～P{X＝k}＝pk(1－p)1－k, (0<p<1) k＝0，1
3. 几何分布 X～P{X＝k}＝ (1－p)k－1 p, (0<p<1) k＝1, 2, …
4. 二项分布B(n, p)
13
七、二维离散型随机变量
1. 定义若二维随机变量(X, Y)只能取至多可列个值 (xi, yj), (i, j＝1, 2, … )，则称(X, Y)为二维离散型随机变量。
二维离散型随机变量(X, Y)的分布律，或随机变量X 与Y的联合分布律.可记为

概率论与数理统计课件(复旦版)

详细描述
一元线性回归分析通过建立线性方程来描述两个变量之间的关系，并利用最小二乘法来估计回归系数。这种方法可以用于预测因变量的值，并评估自变量对因变量的影响程度。
注意事项
在应用一元线性回归分析时，需要确保数据满足线性关系、误差项独立同分布、误差项无系统偏差等假设。
多元线性回归分析
• 总结词：多元线性回归分析是研究多个自变量与一个因变量之间线性关系的统计方法。 • 详细描述：多元线性回归分析通过建立多元线性方程来描述多个自变量与因变量之间的关系，并利用最小二乘
随机变量的定义
01
随机变量是定义在样本空间上的一个实数函数，表示一个随机
试验的结果。
离散型随机变量与连续型随机变量
02
离散型随机变量是在可数样本点上取值的随机变量，连续型随
机变量是在连续样本空间上取值的随机变量。
随机变量的分布函数
03
随机变量的分布函数是描述随机变量取值范围的函数，它满足
非负性、规范性和单调递增的性质。
中心极限定理及其应用
中心极限定理的定义
中心极限定理是指在独立同分布的随机变量的大量独立和的分布近似于正态分布。
中心极限定理的数学表达式
设随机变量X1,X2,...,Xn是独立同分布的随机变量，且期望E(Xk)=μ，方差D(Xk)=σ^2 (k=1,2,...,n)，那么当n趋于无穷时，随机变量之和∑Xk/√n近似服从正态分布。
非参数检验
不依赖于总体分布的参数进行推断，如中位数、众数等。
参数检验与非参数检验的选择
根据数据特征和实际问题需求进行选择，非参数检验在数据不符合正态分布时更为适用。
08
回归分析
一元线性回归分析

概率论第2章精品PPT课件

当X=3时，取的另外两只球只能是1和2，即只有一种可能, 故
P{X
3}
1 C53
1 10
当X=4时，取的另外两只球可以是1、2、3中的任两个，故
P{X
4}
C32 C53
3 10
当X=5时，取的另外两只球可以是1、2、3、4中的任两个，故
P{X
5}
C42 C53
6 10
2
第2章随机变量及其分布
(2) 根据概率密度的定义可得
fX
(x)
dFX (x) dx
1 / 0,
x,
1 xe 其它
13
第2章随机变量及其分布
习题22(1)
22(1) 分子运动速度的绝对值X服从麦克斯韦 (Maxwell)分布，其概率密度为
f
(
x)
Ax 2e
x2
/b
,
0,
x0 其他
其中b=m/(2kT), k为玻耳兹曼(Boltzmann)常数，T为温度，m是分子的质量，试确定常数A.
1 241
t ex / 241dx 1 et / 241
0
综合得到：
1 et /241, t 0
FT
(t)
0,
其他
利用分布函数的性质计算概率：
P{50 T 100} FT (100) FT (50)
e50/ 241 e100/ 241
17
第2章随机变量及其分布
习题23
23. 某种型号器件的寿命X(以小时计)具有概率密度
解：甲乙各自做3重伯努力实验，设甲投中次数为X, 乙投中次数为Y, 两者均遵从二项分布。故所求为
甲乙投篮相互独立
3

概率论与数理统计第2章ppt课件

1 3x
0
1
2
3X
处的离跳散跃型高随度机恰变为量P{的X=分x布i}.函数为跳跃函数，在xi
§4. 连续型随机变量的概率密度
1. 定义：对于随机变量X的分布函F(x)，如果存在非负函数f(x),使对于任意实数x有：
F(x)xf(t)dt
则称X为连续型随机变量；称f(x)为X的概率密度函数。简称密度函数。
精选课件
21
例4. 3个人抓阄数。
解：X的概率分布: P{X=1}=1/3
P{X=2}=2/3×1/2=1/3
P{X=3}=2/3×1/2×1/1=1/3
X的分布函数:
Y
0 x <1
1
1/3 1 x <2
2/ 3
F(x)=
2/3 2 x <3 1/ 3
则：P{X=k} Cnk pnkqnnk 其中：qn=1－pn
(令＝μV; pn=μ△V＝μV/n= /n)：
考虑当 n ＋时
P{X=k} =nl imCnkpnkqnnk
limn! ()k(1)nk
nl n i m k1 k !!n(nn (n n k1)) !n (n n kn 1)k((11 n))kn
k
k!
k=0、1、2、3、……
n
Poissn定理：n为正整数，pn=/n， >0。则对任一非负整数k有：
nl im Cnkpnkqnnk
k
k!
其中：＝ npn.
例3. 某人打靶命中率为0.001, 重复射击 5000次，求至少命中2次的概率。
解：设X为至命中次数。
P(X2) =1－P(X<2) =1－P(X=0)－P(X=1)

概率论及数理统计课件第2章

概率论及数理统计课件第2章
在随机试验中，人们除了对某些特定事件发生的概率感兴趣外，往往还关心某个与随机试验结果相联系的变量。在
本章中，我们将用实数来表示随机试验的各种结果(数量化)，即随机变量。这样，不仅可以更全面揭示随机试验的客观存在的统计规律性，而且可使我们用（数学分析）微积分的方法来讨论随机试验。
在随机试验中，如果把试验中观察的对象与实数对应起来，即建立对应关系X，使其对试验的每个结果，都有一
个实数X( )与之对应，
试验的结果
对应关系X
实数X( )
则X的取值随着试验的重复而不同， X是一个变量，且在每次试验中，究竟取什么值事先无法预知，也就是说X是一个随机取值的变量，称X为随机变量。
（1）在有些试验中，试验结果本身就是由数量表示的，如掷骰子观察得到骰子的点数1、2、3、4、5、6。
则称P(X=xk)=pk(k=1, 2, … ) 为随机变量X 的概率分布律或称分布律，也称概率函数。
分布律可用表格形式表示为：
X
x1
x2
x3
…
xk
…
P
p1
p2
p3
…
pk
…
# 概率分布
1、写出可能取值－－即写出了样本点 2、写出相应的概率－－即写出了每一个样本点出现的概率
例设袋中有5只球，其中有2只白球，3只黑球。现从中任取3只球(不放回)，求抽得的白球数X为k的概率。
X()1,1，=反正面面
例将一枚硬币抛掷三次，观察正面H、反面T出现情况的试验中，其样本空间为 S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}.
记每次试验出现正面的总次数为随机变量X,则X作为样本空间S上的函数定义为

概率论与数理统计课件第二章

P( X 1) 1 P( X 0) 1 C 0.1 0.9
0 n 0 n 0
1 0.9 0.9
n
n 22.
例4. 某车间有5台车床,由于种种原因(由
于装、卸工作等),时常需要停车.设各台车床的停车或开车是相互独立的. 若车床在任一时刻处于停车状态的概率是1/3,求车间中恰有一台车床处于停车状态的概率。解：X:处于停车状态的车床数 X~B(5,1/3)
当0 x 1时，F ( x) P( X x) P( X 0) 0.3
当1 x 2时，F ( x) P( X x) P( X 0) P( X 1) 0.9
当x 2时，F ( x) P( X 0) P( X 1) P( X 2) 1
k nk CM CN M P( X k ) , n CN
k 0,1,..., l ,
其中n≤N,M<N,l=min{n,M},n,N,M均为正整数,则称X服从参数为N,M,n的超几何分布，记作X~H(N,M,n).
例8. 某班有学生20名，其中有5名女生，今从班上任选4名学生去参观展览，求被选到的女同学人数X的分布律。 X~H(20,5,4)
Ω X R X(w)
w
随机变量的分类
离散型随机变量
有限个或可列个可能值
随机多，而且还不能一一列举，而是充满一个区间.
许多随机事件都可以通过形如{X≤x}的事件来表示:

1 { X x} X x k k 1
(5) F ( x)是连续函数, 若f ( x)在x0连续, 有 F ( x0 ) f ( x0 ) .
例1. 设连续型随机变量X的概率密度为

工程数学概率第二章(二)-精品PPT

0
1
x
例4 设二维随机变量(X ,Y) 的概率密度为
f(x,y) x21 3xy,
0x1， 0y2, y
2
0,
others.
试求概率 PXY1．
1
解积分区域如右图所示
PXY1 f(x,y)dxdy 0 xy1
1
x
x y 1
(x2
1xy)dxdy
1
dx
2
(x2xy)dy
65
G1
3
0 1x
Y的边缘分布函数。 { X x } { X x } { Y } { X x , Y }
则 FX(x) P{Xx} P {Xx,Y }F(x,) 同理可得 FY(y)F(,y)
研究问题：已知联合分布，怎样求 X,Y 的边缘分布。
例1: 已知 (X ,Y)的分布函数为
F(x,y) (1e2x)(1e3y),
第一讲二维随机变量
定义1 设随机试验 E 的样本空间是{e},设XX(e) 和Y Y(e)是定义在上的随机变量，则由它们构成的一
个向量( X ,Y ) 称为二维随机变量或二维随机向量。定义2 设 ( X ,Y )是二维随机变量，对于任意实数 x , y ,
二元函数 F ( x ,y ) P { X ( x ) ( Y y )} P { X x ,Yy }
F ( x 2 , y 2 ) F ( x 1 , y 2 ) F ( x 2 , y 1 ) F ( x 1 , y 1 )
y
y 2 ( x1, y2 )
(x2, y2)
y 1 ( x1, y1 ) 0 x1
( x2 , y1) x
x2
联合分布函数的性质： ① F (x, y)是变量 x 和 y 的不减函数，即

概率论与数理统计第二章随机变量课件

第二章随机变量第一节随机变量及其分布函数上一章中我们讨论的随机事件中有些是直接用数量来标识的，例如，抽样检验灯泡质量试验中灯泡的寿命；而有些则不是直接用数量来标识的，如性别抽查试验中所抽到的性别.为了更深入地研究各种与随机现象有关的理论和应用问题，我们有必要将样本空间的元素与实数对应起来.即将随机试验的每个可能的结果e 都用一个实数X 来表示.例如，在性别抽查试验中用实数“1”表示“出现男性”，用“0”表示“出现女性”.显然，一般来讲此处的实数X 值将随e 的不同而变化，它的值因e 的随机性而具有随机性，我们称这种取值具有随机性的变量为随机变量.定义2.1 设随机试验的样本空间为Ω，如果对Ω中每一个元素e ，有一个实数X （e ）与之对应，这样就得到一个定义在Ω上的实值单值函数（e ），称之为随机变量（）.随机变量的取值随试验结果而定，在试验之前不能预知它取什么值，只有在试验之后才知道它的确切值；而试验的各个结果出现有一定的概率，故随机变量取各值有一定的概率.这些性质显示了随机变量与普通函数之间有着本质的差异.再者，普通函数是定义在实数集或实数集的一个子集上的，而随机变量是定义在样本空间上的（样本空间的元素不一定是实数），这也是二者的差别.本书中，我们一般以大写字母如X ，Y ，Z ，W ，…表示随机变量，而以小写字母如，…表示实数.为了研究随机变量的概率规律，并由于随机变量X 的可能取值不一定能逐个列出，因此我们在一般情况下需研究随机变量落在某区间（x 1，x 2］中的概率，即求P {x 1＜X ≤x 2}，但由于P {x 1＜X ≤x 2}{X ≤x 2}{X ≤x 1}，由此可见要研究P {x 1＜X ≤x 2}就归结为研究形如P {X ≤x }的概率问题了.不难看出，P {X ≤x }的值常随不同的x 而变化，它是x 的函数，我们称这函数为分布函数.定义2.2 设X 是随机变量，x 为任意实数，函数F (x ){X ≤x }称为X 的分布函数（）.对于任意实数x 12(x 1<x 2)，有P {x 1<X ≤x 2}{X ≤x 2}{X ≤x 1}(x 2)(x 1)，（2.1）因此，若已知X 的分布函数，我们就能知道X 落在任一区间（x 12]上的概率.在这个意义上说，分布函数完整地描述了随机变量的统计规律性.如果将X 看成是数轴上的随机点的坐标，那么，分布函数F （x ）在x 处的函数值就表示X 落在区间（-∞]上的概率.分布函数具有如下基本性质： 1°F (x )为单调不减的函数.事实上，由（2.1）式，对于任意实数x 12（x 1<x 2），有F （x 2）(x 1){x 1<X ≤x 2}≥0.2°0≤F (x )≤1，且)(lim x F x +∞→=1,常记为F （+∞）=1.)(lim x F x -∞→=0，常记为F （-∞）=0.我们从几何上说明这两个式子.当区间端点x 沿数轴无限向左移动（x →-∞）时，则“X 落在x 左边”这一事件趋于不可能事件，故其概率P {X ≤x }(x )趋于0；又若x 无限向右移动（x →+∞）时，事件“X 落在x 左边”趋于必然事件，从而其概率P {X ≤x }(x )趋于1.3°F (0)(x )，即F （x ）为右连续. 证略.反过来可以证明，任一满足这三个性质的函数，一定可以作为某个随机变量的分布函数. 概率论主要是利用随机变量来描述和研究随机现象，而利用分布函数就能很好地表示各事件的概率.例如，P {X ＞a }=1{X ≤a }=1(a ){X ＜a }(0){}(a )(0）等等.在引进了随机变量和分布函数后我们就能利用高等数学的许多结果和方法来研究各种随机现象了，它们是概率论的两个重要而基本的概念.下面我们从离散和连续两种类别来更深入地研究随机变量及其分布函数，另有一种奇异型随机变量超出本书范围，就不作介绍了.第二节离散型随机变量及其分布如果随机变量所有可能的取值为有限个或可列无穷多个，则称这种随机变量为离散型随机变量.容易知道，要掌握一个离散型随机变量X 的统计规律，必须且只须知道X 的所有可能取的值以及取每一个可能值的概率.设离散型随机变量X 所有可能的取值为(1,2,…)取各个可能值的概率,即事件{}的概率P {}, 1,2,… （2.2）我们称（2.2）式为离散型随机变量X 的概率分布或分布律.分布律也常用表格来表示（表2-1）：表2-1 X x 1 x 2 x 3 … …p 1 p 2 p 3 … …由概率的性质容易推得，任一离散型随机变量的分布律{}，都具有下述两个基本性质： 1°≥0，1,2,…；（2.3） 2°11=∑∞=k kp. （2.4）反过来，任意一个具有以上两个性质的数列{}，一定可以作为某一个离散型随机变量的分布律.为了直观地表达分布律，我们还可以作类似图2-1的分布律图.图2-1图2-1中处垂直于x 轴的线段高度为，它表示X 取的概率值.例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯，每盏灯以0.6的概率允许汽车通过，以0.4的概率禁止汽车通过（设各盏信号灯的工作相互独立）.以X 表示汽车首次停下时已经通过的信号灯盏数，求X 的分布律.解以p 表示每盏灯禁止汽车通过的概率，显然X 的可能取值为0，1，2，3，4，易知X 的分布律为或写成P {}=（1），0，1，2，3.P {4}=（1）4.将0.4,10.6代入上式，所得结果如表2-3所示.表2-3（1）两点分布若随机变量X 只可能取x 1与x 2两值，它的分布律是P {1}=1（0＜p ＜1），P {2}，则称X 服从参数为p 的两点分布.特别，当x 1=0，x 2=1时两点分布也叫（0-1）分布，记作（0-1）分布.写成分布律表形式见表2-4.表2-4对于一个随机试验，若它的样本空间只包含两个元素，即={e 1，e 2}，我们总能在上定义一个服从（0-1）分布的随机变量,,,1,0)(21e e e e e X X ==⎩⎨⎧==当当用它来描述这个试验结果.因此，两点分布可以作为描述试验只包含两个基本事件的数学模型.如，在打靶中“命中”与“不中”的概率分布；产品抽验中“合格品”与“不合格品”的概率分布等等.总之，一个随机试验如果我们只关心某事件A 出现与否，则可用一个服从（0-1）分布的随机变量来描述.（2）二项分布若随机变量X 的分布律为P {}kn C (1), 0,1,…， (2.5)则称X 服从参数为n ，p 的二项分布（）,记作().易知（2.5）满足（2.3）、(2.4)两式.事实上，P （）≥0是显然的；再由二项展开式知n k n k nk k nnk p p p p k X P )]1([)1(C}{0-+=-==-==∑∑=1.我们知道，P {}=kn k k n p p --)1(C 恰好是[(1)]n 二项展开式中出现的那一项，这就是二项分布名称的由来.回忆n 重贝努里试验中事件A 出现k 次的概率计算公式(k )kn C (1), 0,1,…,可知，若()，X 就可以用来表示n 重贝努里试验中事件A 出现的次数.因此，二项分布可以作为描述n 重贝努里试验中事件A 出现次数的数学模型.比如，射手射击n 次中，“中的”次数的概率分布；随机抛掷硬币n 次，落地时出现“正面”次数的概率分布；从一批足够多的产品中任意抽取n 件，其中“废品”件数的概率分布等等.不难看出，（0-1）分布就是二项分布在1时的特殊情形，故（0-1）分布的分布律也可写成P {}1(0,1)(1).例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强，当一个校队运动员与一个系队运动员比赛时，校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式，提了三种方案：（1）双方各出3人；（2）双方各出5人；（3）双方各出7人.三种方案中均以比赛中得胜人数多的一方为胜利.问：对系队来说，哪一种方案有利？解设系队得胜人数为X ，则在上述三种方案中，系队胜利的概率为（1） P {X ≥2}=k kk k -=∑3323)6.0()4.0(C ≈0.352；(2) P {X ≥3}=k kk k -=∑5535)6.0()4.0(C ≈0.317；(3) P {X ≥4}=k kk k -=∑7747)6.0()4.0(C ≈0.290.因此第一种方案对系队最为有利.这在直觉上是容易理解的，因为参赛人数越少，系队侥幸获胜的可能性也就越大.例2.3 某一大批产品的合格品率为98%，现随机地从这批产品中抽样20次，每次抽一个产品，问抽得的20个产品中恰好有k 个（1，2，…，20）为合格品的概率是多少？解这是不放回抽样.由于这批产品的总数很大，而抽出的产品的数量相对于产品总数来说又很小，那么取出少许几件可以认为并不影响剩下部分的合格品率，因而可以当作放回抽样来处理，这样做会有一些误差，但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验，显然，抽检20个产品就相当于做20次贝努里试验，以X 记20个产品中合格品的个数，那么（20，0.98），即P {}=kk k -2020)02.0()98.0(C ，1,2, (20)若在上例中将参数20改为200或更大，显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n 很大而p （或1）很小时的近似计算公式.定理2.1（泊松()定理）设λ（λ>0是一常数，n 是任意正整数），则对任意一固定的非负整数k ,有e lim (1)!k k k n knn n n C p p k λλ-→∞-=-.证由λ，有().111121111!)1()(!)1()1(1C kn kkn k kn n kn k n n n n k n n k n n k k n n n p p ---⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅=-+--=-λλλλλ对任意固定的k ，当n →∞时，11121111→⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅n k n n ，11,e 1→⎪⎭⎫ ⎝⎛-→⎪⎭⎫ ⎝⎛---kn n n λλλ故e lim (1).!k kk n knn n n C p p k λλ--→∞-=由于λ是常数，所以当n 很大时必定很小，因此，上述定理表明当n 很大p 很小时，有以下近似公式,!e )1(C k p p k kn k k nλλ--≈- (2.6)其中λ.从表2-5可以直观地看出（2.6）式两端的近似程度.表2-5由上表可以看出，两者的结果是很接近的.在实际计算中，当n ≥20≤0.05时近似效果颇佳，而当n ≥100≤10时效果更好.!e k k λλ-的值有表可查（见本书附表3）二项分布的泊松近似，常常被应用于研究稀有事件（即每次试验中事件A 出现的概率p 很小），当贝努里试验的次数n 很大时，事件A 发生的次数的分布.例2.4 某十字路口有大量汽车通过，假设每辆汽车在这里发生交通事故的概率为0.001，如果每天有5000辆汽车通过这个十字路口，求发生交通事故的汽车数不少于2的概率.解设X 表示发生交通事故的汽车数，则(),此处5000，0.001，令λ5， P {X ≥2}=1{X ＜2}=1-{}∑==1k k X P=1-(0.999)5000-5(0.999)4999≈1!e 50!e 51550----. 查表可得P {X ≥2}=1-0.00674-0.03369=0.95957.例2.5 某人进行射击，设每次射击的命中率为0.02，独立射击400次，试求至少击中两次的概率.解将一次射击看成是一次试验.设击中次数为X ，则(400,0.02)，即X 的分布律为P {}=k400C (0.02)k (0.98)400, 0,1, (400)故所求概率为P {X ≥2}=1{0}{1}=1-(0.98)400-400(0.02)(0.98)399 =0.9972.这个概率很接近1，我们从两方面来讨论这一结果的实际意义.其一，虽然每次射击的命中率很小（为0.02)，但如果射击400次，则击中目标至少两次是几乎可以肯定的.这一事实说明，一个事件尽管在一次试验中发生的概率很小，但只要试验次数很多，而且试验是独立地进行的，那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二，如果在400次射击中，击中目标的次数竟不到两次，由于P {X <2}≈0.003很小，根据实际推断原理，我们将怀疑“每次射击的命中率为0.02”这一假设，即认为该射手射击的命中率达不到0.02.（3）泊松分布若随机变量X 的分布律为P {} =e !k k λλ-，0，1，2，…，（2.7）其中λ＞0是常数，则称X 服从参数为λ的泊松分布（），记为（λ）. 易知（2.7）满足（2.3）、（2.4）两式，事实上，P {}≥0显然；再由∑∞=-0!e k k k λλλ·e λ=1，可知∑∞==0}{k k X P =1.由泊松定理可知，泊松分布可以作为描述大量试验中稀有事件出现的次数0,1,…的概率分布情况的一个数学模型.比如：大量产品中抽样检查时得到的不合格品数；一个集团中生日是元旦的人数；一页中印刷错误出现的数目；数字通讯中传输数字时发生误码的个数等等，都近似服从泊松分布.除此之外，理论与实践都说明，一般说来它也可作为下列随机变量的概率分布的数学模型：在任给一段固定的时间间隔内，① 由某块放射性物质放射出的α质点，到达某个计数器的质点数；② 某地区发生交通事故的次数；③ 来到某公共设施要求给予服务的顾客数（这里的公共设施的意义可以是极为广泛的，诸如售货员、机场跑道、电话交换台、医院等，在机场跑道的例子中，顾客可以相应地想象为飞机）.泊松分布是概率论中一种很重要的分布.例2.6 由某商店过去的销售记录知道，某种商品每月的销售数可以用参数λ＝5的泊松分布来描述.为了以95%以上的把握保证不脱销，问商店在月底至少应进某种商品多少件？解设该商店每月销售这种商品数为X ，月底进货为a 件，则当X ≤a 时不脱销，故有P {X ≤a }≥0.95.由于(5),上式即为∑=-ak kk 05!5e ≥0.95. 查表可知∑=-95!5e k kk ≈0.9319<0.95, ∑=-105!10e k kk ≈0.9682>0.95 于是，这家商店只要在月底进货这种商品10件（假定上个月没有存货），就可以95%以上的把握保证这种商品在下个月不会脱销.下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X 的分布律如表2-1所示.由分布函数的定义可知F (x ){X ≤x }=∑∑≤≤==xx kxx kk k px X P }{，此处的∑≤xx k 和式表示对所有满足≤x 的k 求和，形象地讲就是对那些满足≤x 所对应的的累加.例2.7 求例2.1中X 的分布函数F （x ）. 解由例2.1的分布律知当x ＜0时，F （x ）{X ≤x }=0；当0≤x ＜1时，F （x ）{X ≤x }{0}=0.4；当1≤x ＜2时，F （x ）{X ≤x }（{0}∪{1}）{0}{1}=0.4+0.24=0.64；当2≤x ＜3时F （x ）{X ≤x }（{0}∪{1}∪{2}） {0}{1}{2}=0.4+0.24+0.144 =0.784；当3≤x ＜4时F （x ）{X ≤x }（{0}∪{1}∪{2}∪{3}） =0.4+0.24+0.144+0.0864=0.8704；当x ≥4时F （x ）{X ≤x }（{0}∪{1}∪{2}∪{3}∪{4}） =0.4+0.24+0.144+0.0864+0.1296=1.综上所述F （x ）{X ≤x }=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<.4,1,43,8704.0,32,784.0,21,64.0,10,4.0,0,0x x x x x x F (x )的图形是一条阶梯状右连续曲线，在0，1，2，3，4处有跳跃，其跳跃高度分别为0.4,0.24,0.144,0.0864,0.1296，这条曲线从左至右依次从F （x ）=0逐步升级到F （x ）=1.对表2-1所示的一般的分布律，其分布函数F （x ）表示一条阶梯状右连续曲线，在(1,2,…)处有跳跃，跳跃的高度恰为{}，从左至右，由水平直线F （x ）=0，分别按阶高p 1，p 2，…升至水平直线F （x ）=1.以上是已知分布律求分布函数.反过来，若已知离散型随机变量X 的分布函数F （x ），则X 的分布律也可由分布函数所确定：{}()(0).第三节连续型随机变量及其分布上一节我们研究了离散型随机变量，这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如，测量一个工件长度，因为在理论上说这个长度的值X 可以取区间（0，+∞）上的任何一个值.此外，连续型随机变量取某特定值的概率总是零（关于这点将在以后说明）.例如，抽检一个工件其长度X 丝毫不差刚好是其固定值（如 1.824）的事件{1.824}几乎是不可能的，应认为P{1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是，对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.例2.8 一个半径为2米的圆盘靶，设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比，并设射击都能中靶，以X 表示弹着点与圆心的距离，试求随机变量X 的分布函数.解 1°若x ＜0，因为事件{X ≤x }是不可能事件，所以F （x ）{X ≤x }=0.2°若0≤x ≤2，由题意P {0≤X ≤x }2，k 是常数，为了确定k 的值，取2，有P {0≤X ≤2}=22k ，但事件{0≤X ≤2}是必然事件，故P {0≤X ≤2}=1，即221，所以1/4，即P {0≤X ≤x }2/4.于是F （x ）{X ≤x }{X ＜0}{0≤X ≤x }= x 2/4.3°若x ≥2，由于{X ≤2}是必然事件，于是F （x ）{X ≤x }=1.综上所述F （x ）=⎪⎩⎪⎨⎧≥<≤<,2,1,20,41,0,02x x x x 它的图形是一条连续曲线如图2-2所示.图2-2另外，容易看到本例中X 的分布函数F （x ）还可写成如下形式：F (x )=t t f xd )(⎰∞-，其中 f （t ）=⎪⎩⎪⎨⎧<<.,0,20,21其他t t这就是说F （x ）恰好是非负函数f （t ）在区间（-∞，x ]上的积分，这种随机变量X 我们称为连续型随机变量.一般地有如下定义.定义2.3 若对随机变量X 的分布函数F （x ），存在非负函数f （x ），使对于任意实数x 有F （x ）=⎰∞-xx t f d )(，（2.8）则称X 为连续型随机变量，其中f （x ）称为X 的概率密度函数，简称概率密度或密度函数( ).由（2.8）式知道连续型随机变量X 的分布函数F （x ）是连续函数.由分布函数的性质F （-∞）=0，F （+∞）=1及F （x ）单调不减，知F （x ）是一条位于直线0与1之间的单调不减的连续（但不一定光滑）曲线. 由定义2.3知道，f （x ）具有以下性质：1°f (x )≥0；2°⎰+∞∞-x x f d )(=1；3°P {x 1＜X ≤x 2}(x 2)-F (x 1)=⎰21d )(x x x x f (x 1≤x 2)；4°若f (x )在x 点处连续，则有F ′(x )(x ).由2°知道，介于曲线（x ）与0之间的面积为1.由3°知道，X 落在区间（x 1，x 2］的概率P {x 1＜X ≤x 2}等于区间（x 1，x 2］上曲线（x ）之下的曲边梯形面积.由4°知道，f （x ）的连续点x 处有f （x ）=.}{)()(lim lim 00x x x X x P x x F x x F x x ∆∆+≤<=∆-∆+++→∆→∆ 这种形式恰与物理学中线密度定义相类似，这也正是为什么称f （x ）为概率密度的原因.同样我们也指出，反过来，任一满足以上1°、2°两个性质的函数f (x )，一定可以作为某个连续型随机变量的密度函数.前面我们曾指出对连续型随机变量X 而言它取任一特定值a 的概率为零，即P {}=0，事实上，令Δx ＞0，设X 的分布函数为F （x ），则由{}⊂{a -Δx ＜X ≤a },得 0≤P {}≤P {a -Δx ＜X ≤a }（a ）-F （a -Δx ）. 由于F （x ）连续，所以)(lim 0x a F x ∆-→∆（a ）.当Δx →0时，由夹逼定理得P {}=0,由此很容易推导出P {a ≤X ＜b }{a ＜X ≤b }{a ≤X ≤b }{a ＜X ＜b }.即在计算连续型随机变量落在某区间上的概率时，可不必区分该区间端点的情况.此外还要说明的是，事件{}“几乎不可能发生”，但并不保证绝不会发生，它是“零概率事件”而不是不可能事件.例2.9 设连续型随机变量X 的分布函数为F （x ）=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x Ax x 试求：（1）系数A ；（2）X 落在区间（0.3，0.7）内的概率；（3）X 的密度函数.解（1）由于X 为连续型随机变量，故F （x ）是连续函数，因此有1（1）=2101lim lim )(Axx F x x -→-→= ,即1，于是有F （x ）=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x x x (2) P {0.3<X <0.7}(0.7)-F (0.3)=(0.7)2-(0.3)2=0.4; (3) X 的密度函数为f (x )′(x )=⎩⎨⎧<≤.,0;10,2其他x x由定义2.3知，改变密度函数f (x )在个别点的函数值，不影响分布函数F （x ）的取值，因此，并不在乎改变密度函数在个别点上的值（比如在0或1上f （x ）的值）.例2.10 设随机变量X 具有密度函数f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,43,22,30,其他x x x kx （1）确定常数k ；（2）求X 的分布函数F （x ）；（3）求P {1<X ≤72}. 解（1）由⎰∞∞-x x f d )(=1,得x xx kx d )22(d 4330⎰⎰-+=1, 解得1/6,故X 的密度函数为f (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≤≤-<≤.,0,43,22,30,6其他x x x x(2) 当x <0时，F （x ）{X ≤x }=⎰∞-xt t f d )( =0;当0≤x <3时，F （x ）{X ≤x }⎰∞-xtt f d )(⎰⎰∞-+0d )(d )(xt t f t t f 12d 620x t t x =⎰;当3≤x <4时，F （x ）{X ≤x }⎰∞-xtt f d )(033()()()x f t dt f t dt f t dt -∞++⎰⎰⎰=233(2)23;624x t t x dt dt x +-=-+-⎰⎰当x ≥4时，F （x ）{X ≤x }⎰∞-xtt f d )(⎰⎰⎰⎰∞-+++030434d )(d )(d )(d )(xt t f t t f t t f t t f=t tt t d )22(d 64330⎰⎰-+ =1.即F （x ）=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤-+-<≤<.4,1,43,324,30,12,0,022x x x x x x x(3) P {1<X ≤7/2}（7/2）-F (1)=41/48.下面介绍三种常见的连续型随机变量. （1）均匀分布若连续型随机变量X 具有概率密度f (x )=⎪⎩⎪⎨⎧<<-.,0,,1其他b x a ab （2.9）则称X 在区间（a ，b ）上服从均匀分布（），记为().易知f (x )≥0且⎰⎰∞∞--=ba x ab x x f d 1d )(=1.由（2.9）可得 1°P {X ≥b }=⎰∞bx d 0 =0{X ≤a }⎰∞-ax d 00，即 P {a <X <b }=1-P {X ≥b }-P {X ≤a }=1；2°若a ≤c <d ≤b ，则P {c <X <d }=ab cd x a b dc--=-⎰d 1. 因此，在区间（）上服从均匀分布的随机变量X 的物理意义是：X 以概率1在区间（）内取值，而以概率0在区间（）以外取值，并且X 值落入（）中任一子区间（）中的概率与子区间的长度成正比，而与子区间的位置无关. 由（2.8）易得X 的分布函数为F （x ）=⎪⎩⎪⎨⎧≥<≤--<.,1,,,,0b x b x a a b ax a x (2.10) 密度函数f （x ）和分布函数F （x ）的图形分别如图2-3和图2-4所示.图2-3 图2-4在数值计算中，由于四舍五入，小数点后第一位小数所引起的误差X ，一般可以看作是一个服从在[-0.5,0.5]上的均匀分布的随机变量；又如在（）中随机掷质点，则该质点的坐标X 一般也可看作是一个服从在（）上的均匀分布的随机变量.例2.11 某公共汽车站从上午7时开始，每15分钟来一辆车，如某乘客到达此站的时间是7时到7时30分之间的均匀分布的随机变量，试求他等车少于5分钟的概率.解设乘客于7时过X 分钟到达车站，由于X 在［0，30］上服从均匀分布，即有f (x )=⎪⎩⎪⎨⎧≤≤.,0,300,301其他x显然，只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时，他（或她）等车的时间才少于5分钟，因此所求概率为P {10＜X ≤15}{25＜X ≤30}⎰⎰+15103025d 301d 301x x 1/3. （2）指数分布若随机变量X 的密度函数为f (x )=⎩⎨⎧≤>-.00,,0,e x x x λλ （2.11）其中λ>0为常数，则称X 服从参数为λ的指数分布（），记作(λ).显然f (x )≥0，且x x x f x d e d )(0⎰⎰∞∞-∞-=λλ=1.容易得到X 的分布函数为F （x ）=⎩⎨⎧≤>--.00,,0,e 1x x x λ指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”，即对于任意>0,有P {X >>s }{X >t }. (2.12)如果用X 表示某一元件的寿命，那么上式表明，在已知元件已使用了s 小时的条件下，它还能再使用至少t 小时的概率，与从开始使用时算起它至少能使用t 小时的概率相等.这就是说元件对它已使用过s 小时没有记忆.当然，指数分布描述的是无老化时的寿命分布，但“无老化”是不可能的，因而只是一种近似.对一些寿命长的元件，在初期阶段老化现象很小，在这一阶段，指数分布比较确切地描述了其寿命分布情况.（2.12）式是容易证明的.事实上，(){,}{}{}{}{}1()ee {}.1()es t t λsP X s X s t P X s t P X s t X s P X s P X s F s t P X t F s λλ-+->>+>+>+>==>>-+====>--（3）正态分布若连续型随机变量X 的概率密度为f (x )=222)(e π21σμσ--x ， -∞＜x ＜+∞， (2.13)其中μ，σ（σ＞0）为常数，则称X 服从参数为μ，σ的正态分布（），记为（μ，σ2）.显然f (x )≥0，下面来证明⎰∞∞-x x f d )(=1.令σux -，得到.d eπ21d e π2122)(222t x t x ⎰⎰∞∞--∞∞---=σμσ记t t d e22⎰∞∞--，则有I 2=⎰⎰∞∞-∞∞-+-ds d e222t s t .作极坐标变换：θθ,得到I 2=22π22r redrd πθ∞--∞=⎰⎰,而I >0,，即有.π2d e22=⎰∞∞--t t于是.1π2π21d e 21222)(=⋅=--∞∞-⎰x x σμσπ 正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响，而每个个别因素的影响都不能起决定性作用，那么就可以断定随机变量服从或近似服从正态分布.例如，因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响，但这些因素又不能对身高、体重起决定性作用，所以我们可以认为身高、体重服从或近似服从正态分布.参数μ，σ的意义将在第四章中说明（x ）的图形如图2-5所示，它具有如下性质：图2-5 图2-61°曲线关于μ对称；2°曲线在μ处取到最大值，x 离μ越远，f (x )值越小.这表明对于同样长度的区间，当区间离μ越远，X 落在这个区间上的概率越小；3°曲线在μ±σ处有拐点； 4°曲线以x 轴为渐近线；5°若固定μ，当σ越小时图形越尖陡（图2-6），因而X 落在μ附近的概率越大；若固定σ,μ值改变，则图形沿x 轴平移，而不改变其形状.故称σ为精度参数，μ为位置参数. 由（2.13）式得X 的分布函数F （x ）=t xt d eπ21-2)(22⎰∞--σμσ. （2.14）特别地，当μ=0，σ=1时，称X 服从标准正态分布N （0，1），其概率密度和分布函数分别用)(x ϕ，Φ(x )表示，即有22e π21)(x x -=ϕ，（2.15）Φ(x )=t xt d eπ2122⎰∞--. （2.16）易知，Φ（-x ）=1-Φ（x ）.人们已事先编制了Φ（x ）的函数值表（见本书附录）.一般地，若（μ，σ2），则有σμ-X (0,1).事实上，σμ-X 的分布函数为P {Z ≤x }=}{x X P ≤-σμ{X ≤μ+σx }=t t xd e π21222)(σμσμσ--+∞-⎰，令σμ-t ，得P {Z ≤x }=s xs d eπ2122⎰∞--=Φ(x )，由此知σμ-X (0,1).因此，若（μ,σ2），则可利用标准正态分布函数Φ（x ），通过查表求得X 落在任一区间（x 12]内的概率，即P {x 1<X ≤x 2}=⎭⎬⎫⎩⎨⎧-≤-<-σμσμσμ21x X x P =⎭⎬⎫⎩⎨⎧-≤--⎭⎬⎫⎩⎨⎧-≤-σμσμσμσμ12x X P x X P=⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫⎝⎛-Φσμσμ12x x . 例如，设（1.5，4），可得P {-1≤X ≤2}=⎭⎬⎫⎩⎨⎧-≤-≤--25.1225.125.11X P=Φ(0.25)-Φ(-1.25)=Φ(0.25)-[1-Φ(1.25)]=0.5987-1+0.8944=0.4931.设（μ，σ2）,由Φ（x ）函数表可得P {μ-σ<X <μ+σ}=Φ(1)-Φ(-1)=2Φ(1)-1=0.6826,P {μ-2σ<X <μ+2σ}=Φ(2)-Φ(-2)=0.9544, P {μ-3σ<X <μ+3σ}=Φ(3)-Φ(-3)=0.9974.我们看到，尽管正态变量的取值范围是（-∞,∞),但它的值落在（μ-3σ,μ+3σ）内几乎是肯定的事，因此在实际问题中，基本上可以认为有-μ|<3σ.这就是人们所说的“3σ原则”.例2.12 公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的.设男子身高X 服从μ=170(),σ=6()的正态分布，即（170，62），问车门高度应如何确定？解设车门高度为h ()，按设计要求P {X ≥h }≤0.01或P {X ＜h }≥0.99，因为（170，62），故P {X ＜h }=⎪⎭⎫⎝⎛-Φ=⎭⎬⎫⎩⎨⎧-<-617061706170h h X P ≥0.99，查表得 Φ（2.33）=0.9901＞0.99.故取6170-h =2.33，即184.设计车门高度为184（）时，可使成年男子与车门碰头的机会不超过1%.例2.13 测量到某一目标的距离时发生的随机误差X （单位：米）具有密度函数f (x )=3200)20(2eπ2401--x .试求在三次测量中至少有一次误差的绝对值不超过30米的概率.解 X 的密度函数为f (x )=222402)20(3200)20(e π2401eπ2401⨯----⨯=x x ,即（20，402），故一次测量中随机误差的绝对值不超过30米的概率为P {≤30}{-30≤X ≤30}=⎪⎭⎫⎝⎛--Φ-⎪⎭⎫⎝⎛-Φ402030402030 =Φ(0.25)-Φ(-1.25)=0.5981-(1-0.8944)=0.4931.设Y 为三次测量中误差的绝对值不超过30米的次数，则Y 服从二项分布b (3,0.4931)，故P {Y ≥1}=1-P {0}=1-(0.5069)3=0.8698.为了便于今后应用，对于标准正态变量，我们引入了α分位点的定义. 设（0，1），若z α满足条件P {X ＞z α}=α，0＜α＜1，（2.17）则称点z α为标准正态分布的上α分位点，例如，由查表可得z 0.05=1.6450.001=3.16.故1.645与3.16分别是标准正态分布的上0.05分位点与上0.001分位点.第四节随机变量函数的分布我们常常遇到一些随机变量，它们的分布往往难于直接得到（如测量轴承滚珠体积值Y 等），但是与它们有函数关系的另一些随机变量，其分布却是容易知道的（如滚珠直径测量值X ）.因此，要研究随机变量之间的函数关系，从而通过这种关系由已知的随机变量的分布求出与其有函数关系的另一个随机变量的分布.例2.14 设随机变量X 具有表2-6所示的分布律，试求X 2的分布律.“X 2=9”等价，所以P {X 2=0}{0}=0.1， P {X 2=2.25}{1.5}=0.3， P {X 2=9}{3}=0.1.事件“X 2=1”是两个互斥事件“1”及“1”的和，其概率为这两事件概率和，即P {X 2=1}{1}{1}=0.2+0.3=0.5.于是得X 2的分布律如表2-7所示.解先求Y 的分布函数（y ），由于（X ）2≥0，故当y ≤0时事件“Y ≤y ”的概率为0，即（y ）{Y ≤y }=0，当y ＞0时，有（y ）{Y ≤y }{X 2≤y }{≤X ≤y }=x x f yyX d )(⎰-.将（y ）关于y 求导，即得Y 的概率密度为(y )=()()[]⎪⎩⎪⎨⎧≤>-+.0,0,0,21y y y f y f y XX例如，当（0，1），其概率密度为（2.15）式，则2的概率密度为（y ）=⎪⎩⎪⎨⎧≤>--.0,0,0,e π21221y y y y此时称Y 服从自由度为1的χ2分布.上例中关键的一步在于将事件“Y ≤y ”由其等价事件“≤X ≤y ”代替，即将事件“Y ≤y ”转换为有关X 的范围所表示的等价事件，下面我们仅对（X ），其中g （x ）为严格单调函数，写出一般结论.定理2.2 设随机变量X 具有概率密度（x ），-∞＜x ＜+∞，又设函数g （x ）处处可导且g ′(x )＞0(或g ′（x ）＜0），则（X ）是连续型随机变量，其概率密度为（y ）=⎩⎨⎧<<'.,0,)()]([其他βαx y h y h f X （2.18）其中α（g （-∞），g （+∞）），β（g （-∞），g （+∞）），h （y ）是g （x ）的反函数.我们只证g ′(x )＞0的情况.由于g ′(x )＞0，故g (x )在（-∞∞）上严格单调递增，它的反函数h （y ）存在，且在（α，β）严格单调递增且可导.我们先求Y 的分布函数（y ），并通过对（y ）求导求出（y ）.由于（X ）在（α，β）上取值，故当y ≤α时，（y ）{Y ≤y }=0；当y ≥β时，（y ）{Y ≤y }=1；当α＜y ＜β时，（y ）{Y ≤y }{g （X ）≤y }{X ≤h （y ）}=⎰∞-)(d )(x h X x x f .于是得概率密度（y ）=[()](),,0,X f h y h y x .αβ'<<⎧⎨⎩其他对于g ′(x )＜0的情况可以同样证明，即（y ）=[()][()],,0,fX h y h y x .αβ'<<⎧⎨⎩其他将上面两种情况合并得（y ）=(())(),,0,fX h y h y x .αβ'⎧<<⎨⎩其他注：若f (x )在［a ，b ］之外为零，则只需假设在(a ，b )上恒有g ′(x )＞0(或恒有g ′(x )＜0)，此时α{g （a ），g （b ）}，β{g （a ），g （b ）}.例2.16 设随机变量（μ，σ2）.试证明X 的线性函数（a ≠0）也服从正态分布. 证设X 的概率密度（x ）=,21222)(σμ--x e π-∞＜x ＜+∞.再令（x ），得g （x ）的反函数(y )=y ba-. 所以h ′(y )=1.由（2.18）式（X ）的概率密度为（y ）=⎪⎭⎫ ⎝⎛-a b y f a X 1， -∞＜y ＜+∞，即（y ）=22)(2)]([21σμσa a b y a +--eπ，-∞＜y ＜+∞，即有（a μ，（a σ）2）.例2.17 由统计物理学知分子运动速度的绝对值X 服从麦克斯韦（）分布，其概率密度为f （x ）=⎪⎩⎪⎨⎧≤>-,0,0,0,42232x x a x a x e π其中a ＞0为常数，求分子动能221mX （m 为分子质量）的概率密度. 解已知(x )=221mx (x )只在区间（0，+∞）上非零且g ′(x )在此区间恒单调递增，由。

《概率统计2章》课件

应用场景
非线性回归在许多领域都有应用，例如化学、物理学和生物学等，用于探索非线性关系和预测。
详细描述
非线性回归分析通过建立非线性方程来描述因变量与自变量之间的关系。这种关系不是线性的，而是以其他形式存在，例如二次方、指数、对数等。
贝叶斯统计
贝叶斯定理
贝叶斯定理是概率论中的一个基本定理，它提供了在给定一些新的信息下，更新我们对某个事件发生的概率的估计的方法。
单侧检验与双侧检验
假设检验的步骤
根据假设方向的不同，分为单侧检验和双侧检验。
显著性水平是判断假设是否成立的依据，临界值是判断数据是否显著的依据。
通过提出假设并检验假设是否成立来判断总体参数是否显著。
提出假设、构造检验统计量、确定临界值、做出决策。
回归分析
总结词
详细描述
公式解释
应用场景
一元线性回归是回归分析中最基础的形式，它探Leabharlann 一个因变量与一个自变量之间的关系。
总结词
条件概率是指在某个已知条件下，随机事件发生的概率。独立性是指两个随机事件的发生互不影响。
详细描述
条件概率表示为P(A|B)，即在事件B发生的条件下，事件A发生的概率。独立性则是指两个随机事件A和B，如果P(A|B) = P(A)，则称A与B独立。条件概率与独立性是概率论中的重要概念，它们在概率模型建立和推断中有着广泛的应用。
在统计学中的应用
在金融领域的应用
在社会学中的应用
THANK YOU
感谢聆听
随机变量是用来描述随机实验结果的变量，其取值具有随机性。随机变量的分布描述了随机变量取值的概率规律。
总结词
随机变量是定义在样本空间上的函数，其取值具有随机性。常见的随机变量有离散型和连续型两种类型。离散型随机变量可以取有限或可数无穷多个值，而连续型随机变量则可以取实数域上的任意值。随机变量的分布描述了随机变量取值的概率规律，常见的分布有二项分布、泊松分布、正态分布等。理解随机变量的分布对于进行统计推断和决策具有重要的意义。

2.2_概率论与数理统计_(复旦大学出版社)_南京财经大学朱玲妹老师的课件

P{ X k }
k
e
k 0,1,2,
其中λ> 0,
2 * P{ X k }

k
k!
e 0 k 0,1,2,
xk ex k 0 k ! P{ X k }
k 0
e k 0 k !
k

e e 1
X
p
0
1
2
20 273
3
4
10 3003
5
2 3
5 21
5 273
1 3003
(一) 0 ─ 1 分布
做一次试验,其结果只有两种: 成功,失败.
令成功的概率为p, X 的分布律为: 用X 表示试验成功的次数,
X P
0 1 p
1 p
P{ X k } pk (1 p)1k , k 0,1
q4 P ( B0 ) P ( A1 A2 A3 A4 ) P ( A1 ) P ( A2 ) P ( A3 ) P ( A4 )
P ( B1 ) P ( A1 A2 A3 A4 A1 A2 A3 A4 A1 A2 A3 A4 A1 A2 A3 A4 )
P ( A1 A2 A3 A4 ) P ( A1 A2 A3 A4 )
k0 3
例4 十台机器独立工作,因修理调整等原因,每台机器开车的概率为0.2,设每台机器工作需要1千瓦电力,供电部门只提供6千瓦电力,问十台机器能否正常工作? 解: X 表示正常工作机器台数,
6
X ~ b(10,0.2)
k P{ X 6} C10 0.2k 0.810 k 0.9991 k 0
k0 np p k0 np p 1

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

随机试验样本空间随机事件及其概率
给出了事件的集合表示
事件在一次试验中是否发生具有随机性，它发生的可能性大小是其本身所固有的性质，概率是度量某事件发生可能性大小的一种数量指标.它介于0与1之间.
研究随机现象，不仅关心试验中会出现哪些事件，更重要的是想知道事件出现的可能性大小，也就是
件
那么要问: 如何求得某事件的概率呢? 下面几节就来回答这个问题.
试验有一个需要观察的目的
根据这个目的, 试验被观察到多个不同的结果.
试验的全部可能结果，是在试验前就明确的；或者虽不能确切知道试验的全部可能结果，但可知道它不超过某个范围. 而且，每次试验的结果事先不可预言.
样本空间与事件
现代集合论为表述随机试验提供了一个方便的工具 .
我们把随机试验的每个基本结果称为样本点，记作e 或ω. 全体样本点的集合称为样本空间. 样本空间用S或Ω表示.
了解事件发生的可能性即概率的大小，对人们的生活有什么意义呢？
我先给大家举几个例子，也希望你们再补充几个例子.
例如，了解发生意外人身事故的可能性大小,确定保险金额.
了解来商场购物的顾客人数的各种可能性大小，合理配置服务人员.
了解每年最大洪水超警戒线可能性大小，合理确定堤坝高度.
在这一讲中，我们简要介绍了
也可以按某种标准把支出分为高、中、低三档. 这时，样本点有（高,高）, （高,中），…，(低,低）等9种，样本空间就由这9个样本点构成 .
引入样本空间后，事件便可以表示为样本空间的子集 .
例如，掷一颗骰子，观察出现的点数
样本空间：
S = { i ：i=1,2,3,4,5,6｝
B = {1,3,5｝
H
现且仅有一个样本
点出现 .
T
如果试验是测试某灯泡的寿命：
则样本点是一非负数，由于不能确知寿命的上界，所以可以认为任一非负实数都是一个可能结果，故样本空间
S = {t ：t ≥0｝
调查城市居民（以户为单位）烟、
酒的年支出，结果可以用（x，y）表示， x，y分别是烟、酒年支出的元数.
这时，样本空间由坐标平面第一象限内一定区域内一切点构成 .
上一讲中，我们了解到，随机现象有其偶然性的一面，也有其必然性的一面，这种必然性表现在大量重复试验或观察中呈现出的固有规律性，称为随机现象的统计规律性. 而概率论正是研究随机现象统计规律性的一门学科.
现在，就让我们一起，步入这充满随机性的世界，开始第一步的探索和研究.
从观察试验开始
研究随机现象，首先要对研究对象进行观察试验. 这里的试验，指的是随机试验.
S
.
样本点e
如果试验是将一枚硬币抛掷两次，则样本空间由如下 (T,H), (T,T)}
其中第1次
第2次
样本空间在如下意义上提供了一个理
(H,H): H
H 想试验的模型：
(H,T)： H (T,H): T (T,T)： T
T
在每次试验中
必有一个样本点出
When You Do Your Best, Failure Is Great, So Don'T Give Up, Stick To The End 演讲人：XXXXXX 时间：XX年XX月XX日
事件 B={掷出奇数点}
两个特殊的事件：然即在试验中必定发生的事件，常用S或Ω表示;
可
即在一次试验中不可能发生的事件，常用φ表示 . 例如，在掷骰子试验中， “掷出点数小于7”是必然事件;
而“掷出点数8”则是不可能事件.
下面我们来为随机试验建立一个数学模型
我们注意到试验是在一定条件下进行的
学习总结
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
You Know, The More Powerful You Will Be
结束语
当你尽了自己的最大努力时，失败也是伟大的，所以不要放弃，坚持就是正确的。
在一次试验中可能发生也可能不发生的事件称为随机事件，简称事件.
例如，在掷骰子试验中，
“掷出12点”
基本事件
如在掷骰子试验中，观察掷出的点数 .
（相对于观察目的
事
不可再分解的事件）
事件 Ai ={掷出i点} i =1,2,3,4,5,6
件
复合事件
（两个或一些基本事件并在一起，就构成一个复合事件）
随机试验：
如果每次试验的可能结果不止一个，且事先不能肯定会出现哪一个结果，这样的试验称为随机试验.
例如, 掷寿硬命币试试验验出掷掷的一一测灯枚颗试泡硬骰在的币子掷同寿，，骰一命观观子工. 察试察艺出验出条正现件还的下是点生反数产.
H
T
在随机试验中，我们往往会关心某个或某些结果是否会出现. 这就是随机事件：
事件B就是S的一个子集
B发生当且仅当B中的样本点 1，3，5中的某一个出现.
事件的概率研究随机现象，不仅关心试验中会出
现哪些事件，更重要的是想知道事件出现的可能性大小，也就是事件的概率.
概率是随机事件发生可能性大小的度量
事件发生的可能性越大，概率就越大！
我们用P(A)表示事件A发生的概率，则
0≤P(A)≤1
事件发生的可能性最小是零，此时
概率为0.
事件发生的可能性最大是百分之百，此时
概率为1.
现在，让我们看一个
从死亡线上生还的故事
本来，这位犯臣抽到“生”还是 “死”是一个随机事件，且抽到“生” 和“死”的可能性各占一半，也就是各有1/2概率. 但由于国王一伙“机关算尽”，通过偷换试验条件，想把这种概率只有1/2 的“抽到死签”的随机事件，变为概率为1的必然事件，终于搬起石头砸了自己的脚，反使犯臣得以死里逃生.