离散型随机变量的研究分析

合集下载

概率论与数理统计之离散型随机变量

概率论与数理统计之离散型随机变量
n
电子科技大学
离散型随机变量
14.12.13
lim P{ X n k }
n
lk
k!
e , k 1,2,
l
证明略. 思考:你能从条件 lim npn l 0,
n
中分析出什么结论吗? 注
n
lim npn l
即数列{ pn } 与 { 1 n } 是同阶的无穷小.故
即 10k 10 P{ X a } e 0.95 k 0 k!
a
电子科技大学
离散型随机变量
14
14.12.13
查表可得
10k 10 e 0.9166 0.95 k 0 k!
10k 10 e 0.9513 0.95 k 0 k!
15
这家商店在月底保证存货不少于15件就 能以95%的概率保证下个月该种商品不会 脱销.
p (1 p)
电子科技大学
离散型随机变量
k n
14.12.13
从n次试验中选出k 次试验有C 种不同的 方式.
且各种方式的事件互不相容,由概率的有 限可加性可得
Pn ( k )
结论成立.
k Cn
p (1 p)
k
n k
,
称随机变量X 服从二项分布 ,记为X ~ B(n, p). (0—1)分布可以看作X ~B(1, p).
14.12.13

F ( x ) P{ X x }
P[ { X xi }] P{ X xi }
xi x
xi x
二、贝努里试验和二项分布 E1:抛一枚硬币出现正反面; E2:检查一件产品是否合格; E3:射击,观察是否命中; 贝努里 试验

离散型随机变量的概率函数和分布函数的性质和分析

离散型随机变量的概率函数和分布函数的性质和分析

离散型随机变量的概率函数和分布函数的性质和分析随机变量是概率论中的重要概念,它描述了随机事件的可能结果。

离散型随机变量是指可能取有限个或者可数个值的随机变量。

在概率论中,我们通常通过概率函数和分布函数来描述离散型随机变量的性质和分布情况。

概率函数是离散型随机变量的重要工具,它定义了随机变量取某个特定值的概率。

对于一个离散型随机变量X,其概率函数可以表示为P(X=x),其中x为X可能取的某个值。

概率函数具有以下性质:1. 非负性:对于任意的x,P(X=x)≥0。

2. 正则性:所有可能取值的概率之和等于1,即∑P(X=x)=1。

通过概率函数,我们可以计算离散型随机变量的期望值、方差等统计量。

例如,对于一个服从二项分布的离散型随机变量X,其概率函数可以表示为P(X=k)=C(n,k)p^k(1-p)^(n-k),其中n为试验次数,k为成功次数,p为成功的概率。

通过计算概率函数,我们可以得到二项分布的期望值为E(X)=np,方差为Var(X)=np(1-p)。

除了概率函数,分布函数也是描述离散型随机变量的重要工具。

分布函数描述了随机变量小于等于某个特定值的概率。

对于离散型随机变量X,其分布函数可以表示为F(x)=P(X≤x)。

分布函数具有以下性质:1. 单调性:对于任意的x1<x2,有F(x1)≤F(x2)。

2. 有界性:对于任意的x,0≤F(x)≤1。

3. 右连续性:对于任意的x,有lim[F(x+Δx)]=F(x),其中Δx→0。

通过分布函数,我们可以计算离散型随机变量落在某个区间的概率。

例如,对于一个服从泊松分布的离散型随机变量X,其分布函数可以表示为F(x)=∑(k=0 to x)P(X=k)=e^(-λ)∑(k=0 to x)λ^k/k!,其中λ为平均发生率。

通过计算分布函数,我们可以得到泊松分布在某个特定值x处的概率P(X=x)=e^(-λ)λ^x/x!。

概率函数和分布函数是描述离散型随机变量的重要工具,它们可以帮助我们了解随机变量的性质和分布情况。

概率统计中的离散型随机变量与连续型随机变量

概率统计中的离散型随机变量与连续型随机变量

概率统计中的离散型随机变量与连续型随机变量概率统计是数学的一个分支,用于研究随机现象的规律性和不确定性。

在概率统计中,随机变量是一个非常重要的概念。

随机变量可以分为离散型随机变量和连续型随机变量两种类型。

本文将介绍这两种类型的随机变量以及它们的特点和应用。

一、离散型随机变量离散型随机变量是指在一定范围内取有限个或可列个值的随机变量。

它的特点是在定义域内的每个值都有一定的概率与之对应。

离散型随机变量的概率可以通过概率分布函数来描述。

概率分布函数是一个将随机变量的取值映射到概率的函数。

离散型随机变量常见的例子有抛硬币的结果、掷骰子的点数、抽奖的中奖号码等。

这些随机变量的取值都是有限个或可列个,每个取值的概率可以通过实验或统计数据得到。

离散型随机变量的期望值和方差是衡量其分布特征的重要指标。

期望值表示随机变量的平均取值,方差表示随机变量取值的离散程度。

通过计算期望值和方差,可以更好地理解和描述离散型随机变量的分布特征。

离散型随机变量在实际应用中有着广泛的应用。

例如,在市场调研中,我们可以将消费者的购买行为看作是一个离散型随机变量,通过统计分析不同购买决策的概率分布,可以了解不同消费者的购买偏好和市场需求。

二、连续型随机变量连续型随机变量是指在一定范围内可以取任意实数值的随机变量。

与离散型随机变量不同,连续型随机变量的取值是连续的,无法一一列举出来。

连续型随机变量的概率可以通过概率密度函数来描述。

概率密度函数是一个描述随机变量概率分布的函数,它可以表示在某个取值范围内随机变量出现的概率密度。

与离散型随机变量的概率分布函数不同,连续型随机变量的概率密度函数在定义域内的每个点上的函数值并不表示该点的概率,而是表示该点附近的概率密度。

连续型随机变量常见的例子有身高、体重、温度等物理量。

这些随机变量的取值可以是任意的实数,通过概率密度函数可以描述它们的概率分布情况。

与离散型随机变量类似,连续型随机变量也有期望值和方差这两个重要指标。

离散型随机变量的分布

离散型随机变量的分布

离散型随机变量的分布离散型随机变量在概率论中扮演着重要的角色。

它们描述了一系列可能的取值以及各个取值的概率分布。

本文将介绍离散型随机变量的概念、分布以及如何计算相关的概率。

一、离散型随机变量的定义离散型随机变量是指在有限或可数的取值范围内取值的随机变量。

其取值集合可以是离散的整数或者某种离散的事物。

例如,掷骰子的点数、抛硬币的结果等都属于离散型随机变量。

二、离散型随机变量的分布离散型随机变量的分布通过概率质量函数(Probability Mass Function,简称PMF)来描述。

概率质量函数是一个函数,它计算每个可能取值的概率。

以掷一颗均匀骰子为例,假设随机变量X表示掷骰子的点数。

由于骰子的点数是1到6之间的整数,我们可以定义X的取值集合为S={1, 2, 3, 4, 5, 6}。

对于每个可能的点数,我们可以计算出其概率。

X的概率质量函数可以写成如下形式:P(X=1) = 1/6P(X=2) = 1/6P(X=3) = 1/6P(X=4) = 1/6P(X=5) = 1/6P(X=6) = 1/6其中,P(X=x)表示随机变量X取值为x的概率。

三、计算离散型随机变量的概率在已知离散型随机变量的概率质量函数的情况下,我们可以计算出各种事件的概率。

以随机变量X为例,假设我们想计算X小于等于3的概率。

我们可以使用概率质量函数中相关取值的概率相加来计算:P(X<=3) = P(X=1) + P(X=2) + P(X=3) = 1/6 + 1/6 + 1/6 = 1/2同样地,我们可以计算出其他事件的概率。

四、常见的离散型随机变量分布除了均匀分布之外,还有一些常见的离散型随机变量分布,包括二项分布、泊松分布、几何分布等。

1. 二项分布二项分布描述了在n次独立重复试验中成功的次数的概率分布。

每次试验都有两个可能的结果,成功和失败。

例如,抛硬币n次,成功可以定义为正面朝上的次数。

二项分布的概率质量函数可以写为:P(X=k) = C(n, k) * p^k * (1-p)^(n-k)其中,C(n, k)表示组合数,p表示每次试验成功的概率,k表示成功的次数。

知识讲解离散型随机变量

知识讲解离散型随机变量

知识讲解离散型随机变量110(总14页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除离散型随机变量及其分布列【学习目标】1.了解离散型随机变量的概念.2.理解取有限个值的离散型随机变量及其分布列的概念.3.掌握离散型随机变量的分布列的两个基本性质,并会用它来解决一些简单问题.4. 理解两个特殊的分布列:“两点分布”和“超几何分布”。

【要点梳理】要点一、随机变量和离散型随机变量1. “随机试验”的概念一般地,一个试验如果满足下列条件:a.试验可以在相同的情形下重复进行.B.试验的所有可能结果是明确可知的,并且不止一个.c.每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定这次试验会出现哪一个结果.这种试验就是一个随机试验,为了方便起见,也简称试验.2.随机变量的定义一般地,如果随机试验的结果,可以用一个变量来表示,那么这样的变量叫做随机变量.通常用大写拉丁字母X,Y,Z(或小写希腊字母ξ,η,ζ)等表示。

要点诠释:(1)所谓随机变量,即是随机试验的试验结果和实数之间的一个对应关系,这种对应关系是人为建立起来的,但又是客观存在的。

例如,任意掷一枚硬币,可能出现正面向上、反面向上这两种结果,虽然这个随机试验的结果不具有数量性质,但仍可以用数量来表示它,比如,我们用ξ来表示这个随机试验中出现正面向上的次数,则ξ=0,表示试验结果为反面向上,ξ=1,表示试验结果为正面向上。

(2)随机变量实质是将随机试验的结果数量化。

3.离散型随机变量的定义如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。

离散型随机变量的例子很多.例如某人射击一次可能命中的环数 X 是一个离散型随机变量,它的所有可能取值为0,1,…,10;某网页在24小时内被浏览的次数Y也是一个离散型随机变量,它的所有可能取值为0, 1,2,….4. 随机变量的分类随机变量有以下两种:(1)离散型随机变量:(2)连续型随机变量: 如果随机变量可以取其一区间内的一切值,这样的随机变量叫做连续型随机变量.要点诠释:离散型随机变量和连续型随机变量的区别:离散型随机变量,它所可能取的值为有限个或至多可列个,或者说能将它的可能取值按一定次序一一列出.连续性随机变量可取某一区间内的一切值,我们无法将其中的值一一列举.例如,抛掷一枚骰子,可能出现的点数就是一个离散型随机变量;某人早晨在出租车站等出租车的时间(单位:秒)就不是一个离散型随机变量.5. 若ξ是随机变量,,a b ηξ=+其中a,b 是常数,则η也是随机变量,并且不改变其属性(离散型、连续型)。

专题06 离散型随机变量及其分布列、数字特征(解析版)

专题06 离散型随机变量及其分布列、数字特征(解析版)

06离散型随机变量及其分布列、数字特征知识点1随机变量(1)定义:一般地,对于随机试验样本空间Ω中的每个样本点ω,都有唯一的实数X(ω)与之对应,我们称X为随机变量.随机变量的取值X(ω)随着随机试验结果ω的变化而变化.(2)离散型随机变量:可能取值为有限个或可以一一列举的随机变量称之为离散型随机变量.(2)表示:随机变量通常用大写英文字母表示,例如X,Y,Z;随机变量的取值用小写英文字母表示,例如x,y,z.知识点2离散型随机变量的分布列的定义(1)定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,x i,…,x n,我们称X取每一个值x i 的概率P(X=x i)=p i,i=1,2,…,n为X的概率分布列,简称分布列.(2)表示方法:①表格;②概率分布图.知识点3离散型随机变量的分布列的性质(1)p i ≥0,i =1,2,…,n ;(2)p 1+p 2+…+p n =1.知识点4离散型随机变量的均值与方差一般地,若离散型随机变量X 的分布列如下表所示,X x 1x 2…x n Pp 1p 2…p n(1)均值:称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n =i ii 1nx P =∑为随机变量X 的均值或数学期望,数学期望简称期望.(2)方差:称D (X )=(x 1-E (X ))2p 1+(x 2-E (X ))2p 2+…+(x n -E (X ))2p n =i 1n=∑(x i -E (X ))2p i 为随机变量X的方差,有时也记为Var (X ),并称D (X )为随机变量X 的标准差,记为σ(X ).(3)均值的意义:均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.(4)方差和标准差的意义:随机变量的方差和标准差都可以度量随机变量取值与其均值E (X )的偏离程度,反映了随机变量取值的离散程度.方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散.知识点5均值与方差的性质若Y =aX +b ,其中X 是随机变量,a ,b 是常数,随机变量X 的均值是E (X ),方差是D (X ).则E (Y )=E (aX +b )=aE (X )+b ;D (Y )=D (aX +b )=a 2D (X ).(a ,b 为常数).知识点6分布列性质的两个作用(1)利用分布列中各事件概率之和为1可求参数的值.(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.知识点7均值与方差的四个常用性质(1)E (k )=k ,D (k )=0,其中k 为常数.(2)E (X 1+X 2)=E (X 1)+E (X 2).(3)D (X )=E (X 2)-(E (X ))2.(4)若X1,X 2相互独立,则E (X 1X 2)=E (X 1)·E (X 2).考点1离散型随机变量分布列的性质(1)求a的值;(2)求;(3)求X.【答案】(1)由分布列的性质,得++++P(X=1)=a+2a+3a+4a+5a=1,所以a=115.(2)=++P(X=1)=3×115+4×115+5×115=45.(3)X=++=115+215+315=25.【总结】离散型随机变量分布列性质的应用(1)利用“总概率之和为1”可以求相关参数的取值范围或值;(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;(3)可以根据性质判断所得分布列结果是否正确.【变式1-1】设随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,C为常数,则P(X<3)=__________.【答案】89【解析】随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,∴C2+C6+C12=1,即6C+2C+C12=1,解得C=43,∴P(X<3)=P(X=1)+P(X=2)=43=89.【变式1-2】设离散型随机变量X的分布列为X01234P0.20.10.10.3m(1)求随机变量Y=2X+1的分布列;(2)求随机变量η=|X-1|的分布列;(3)求随机变量ξ=X2的分布列.【解析】(1)由分布列的性质知,0.2+0.1+0.1+0.3+m=1,得m=0.3.首先列表为:X012342X+113579从而Y=2X+1的分布列为:Y13579P0.20.10.10.30.3(2)列表为:X01234|X-1|10123∴P(η=0)=P(X=1)=0.1,P(η=1)=P(X=0)+P(X=2)=0.2+0.1=0.3,P(η=2)=P(X=3)=0.3,P(η=3)=P(X=4)=0.3.故η=|X-1|的分布列为:η0123P0.10.30.30.3(3)首先列表为:X01234X2014916从而ξ=X2的分布列为:ξ014916P0.20.10.10.30.3【变式1-3】设随机变量X的分布列如下:X12345P 112161316p则p为()A.1 6B.13C.14D.112【答案】C【解析】由分布列的性质知,112+16+13+16+p=1,∴p=1-34=14.【变式1-4】设X是一个离散型随机变量,其分布列为X-101P 121-q q-q2则q等于()A.1 B.22或-22C.1+22D.2 2【答案】D【解析】1-q+q-q2=1,1-q≤12,q-q2≤12,解得q=22.【变式1-5】(多选)设随机变量ξ的分布列为ak(k=1,2,3,4,5),则()A.a=115B.ξ=15C.ξ=215D.P(ξ=1)=310【答案】AB【解析】对于选项A,∵随机变量ξ的分布列为ak(k=1,2,3,4,5),∴P(ξ=1)=a+2a+3a+4a+5a=15a=1,解得a=115,故A正确;对于B,易知ξ3×115=15,故B正确;对于C,易知ξ=115+2×115=15,故C错误;对于D,易知P(ξ=1)=5×115=13,故D错误.【变式1-6】设X是一个离散型随机变量,其分布列为X01P9a2-a3-8a则常数a的值为()A.13B.23C.13或23D.-13或-23【答案】A【解析】≤9a 2-a ≤1,≤3-8a ≤1,a 2-a +3-8a =1,解得a =13.【变式1-7】离散型随机变量X 的概率分布列为P (X =n )=an (n +1)(n =1,2,3,4),其中a 是常数,则P X 的值为()A.23B.34C.45D.56【答案】D【解析】因为P (X =n )=a n (n +1)(n =1,2,3,4),所以a 2+a 6+a 12+a 20=1,所以a =54,所以X P (X =1)+P (X =2)=54×12+54×16=56.【变式1-8】若随机变量X 的分布列如下表,则mn 的最大值是()X 024Pm0.5n A.116B.18C.14D.12【答案】A【解析】由分布列的性质,得m +n =12,m ≥0,n ≥0,所以mn =116,当且仅当m =n =14时,等号成立.【变式1-9】随机变量X 的分布列如下:X -101Pabc其中a ,b ,c 成等差数列,则P (|X |=1)=______,公差d 的取值范围是______.【答案】23-13,13【解析】因为a ,b ,c 成等差数列,所以2b =a +c .又a +b +c =1,所以b =13,所以P (|X |=1)=a +c =23.又a =13-d ,c =13+d ,根据分布列的性质,得0≤13-d ≤23,0≤13+d ≤23,所以-13≤d ≤13.考点2求离散型随机变量的分布列【例2】双败淘汰制是一种竞赛形式,与普通的单败淘汰制输掉一场即被淘汰不同,参赛者只有在输掉两场比赛后才丧失争夺冠军的可能.在双败淘汰制的比赛中,参赛者的数量一般是2的次方数,以保证每一轮都有偶数名参赛者.第一轮通过抽签,两人一组进行对阵,胜者进入胜者组,败者进入负者组.之后的每一轮直到最后一轮之前,胜者组的选手两人一组相互对阵,胜者进入下一轮,败者则降到负者组参加本轮负者组的第二阶段对阵;负者组的第一阶段,由之前负者组的选手(不包括本轮胜者组落败的选手)两人一组相互对阵,败者被淘汰(已经败两场),胜者进入第二阶段,分别对阵在本轮由胜者组中降组下来的选手,胜者进入下一轮,败者被淘汰.最后一轮,由胜者组最终获胜的选手(此前从未败过,记为A)对阵负者组最终获胜的选手(败过一场,记为B),若A胜则A获得冠军,若B胜则双方再次对阵,胜者获得冠军.某围棋赛事采用双败淘汰制,共有甲、乙、丙等8名选手参赛.第一轮对阵双方由随机抽签产生,之后每一场对阵根据赛事规程自动产生对阵双方,每场对阵没有平局.(1)设“在第一轮对阵中,甲、乙、丙都不互为对手”为事件M,求M的概率;(2)已知甲对阵其余7名选手获胜的概率均为23,解决以下问题:①求甲恰在对阵三场后被淘汰的概率;②若甲在第一轮获胜,设甲在该项赛事的总对阵场次为随机变量ξ,求ξ的分布列.【分析】(1)先求出8人平均分成四组的方法数,再求出甲,乙,丙都不分在同一组的方法数,从而可求得答案;(2)①甲恰在对阵三场后淘汰,有两种情况:“胜,败,败”和“败,胜,败”,然后利用互斥事件的概率公式求解即可;②由题意可得ξ∈{3,4,5,6,7},然后求出各自对应的概率,从而可得ξ的分布列.【解析】(1)8人平均分成四组,共有C28C26C24C22A44种方法,其中甲,乙,丙都不分在同一组的方法数为A35,所以P(A)=A35C28C26C24C22A44=4 7.(2)①甲恰在对阵三场后淘汰,这三场的结果依次是“胜,败,败”或“败,胜,败”,故所求的概率为23×13×13+13×23×13=427.②若甲在第一轮获胜,ξ∈{3,4,5,6,7}.当ξ=3时,表示甲在接下来的两场对阵都败,即P(ξ=3)=13×13=19.当ξ=4时,有两种情况:(ⅰ)甲在接下来的3场比赛都胜,其概率为23×23×23=827;(ⅱ)甲4场对阵后被淘汰,表示甲在接下来的3场对阵1胜1败,且第4场败,概率为C12·23×13×13=427,所以P (ξ=4)=827+427=49.当ξ=5时,有两种情况:(ⅰ)甲在接下来的2场对阵都胜,第4场败,概率为23×23×13=427;(ⅱ)甲在接下来的2场对阵1胜1败,第4场胜,第5场败,概率为C12·23×13×23×13=881;所以P (ξ=5)=427+881=2081.当ξ=6时,有两种情况:(ⅰ)甲第2场胜,在接下来的3场对阵为“败,胜,胜”,其概率为23×132=881;(ⅱ)甲第2场败,在接下来的4场对阵为“胜,胜,胜,败”,其概率为133×13=8243;所以P (ξ=6)=881+8243=32243.当ξ=7时,甲在接下来的5场对阵为“败,胜,胜,胜,胜”,即P (ξ=7)=134=16243.所以ξ的分布列为:ξ34567P194920813224316243【总结】离散型随机变量分布列的求解步骤【变式2-1】为创建国家级文明城市,某城市号召出租车司机在高考期间至少进行一次“爱心送考”,该城市某出租车公司共200名司机,他们进行“爱心送考”的次数统计如图所示.(1)求该出租车公司的司机进行“爱心送考”的人均次数;(2)从这200名司机中任选两人,设这两人进行送考次数之差的绝对值为随机变量X ,求X 的分布列.【解析】(1)由统计图得200名司机中送考1次的有20人,送考2次的有100人,送考3次的有80人,∴该出租车公司的司机进行“爱心送考”的人均次数为20×1+100×2+80×3200=2.3.(2)从该公司任选两名司机,记“这两人中一人送考1次,另一人送考2次”为事件A ,“这两人中一人送考2次,另一人送考3次”为事件B ,“这两人中一人送考1次,另一人送考3次”为事件C ,“这两人送考次数相同”为事件D .由题意知X 的所有可能取值为0,1,2,则P (X =0)=P (D )=C 220+C 2100+C 280C 2200=83199,P (X =1)=P (A )+P (B )=C 120C 1100C 2200+C 1100C 180C 2200=100199.P (X =2)=P (C )=C 120C 180C 2200=16199.∴X 的分布列为:X 012P8319910019916199【变式2-2】(多选)设离散型随机变量X 的分布列为X 01234Pq0.40.10.20.2若离散型随机变量Y 满足Y =2X +1,则下列结果正确的有()A .q =0.1B .E (X )=2,D (X )=1.4C .E (X )=2,D (X )=1.8D .E (Y )=5,D (Y )=7.2【答案】ACD【解析】因为q +0.4+0.1+0.2+0.2=1,所以q =0.1,故A 正确;由已知可得E (X )=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,D (X )=(0-2)2×0.1+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2=1.8,故C 正确;因为Y =2X +1,所以E (Y )=2E (X )+1=5,D (Y )=4D (X )=7.2,故D 正确.考点3求离散型随机变量的均值与方差【例3】为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为14,16;1小时以上且不超过2小时离开的概率分别为12,23;两人滑雪时间都不会超过3小时.(1)求甲、乙两人所付滑雪费用相同的概率;(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E (ξ),方差D (ξ).【解析】(1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的概率为P 1=14×16=124,两人都付40元的概率为P 2=12×23=13,两人都付80元的概率为P 3-14--16-=124.则两人所付费用相同的概率为P =P 1+P 2+P 3=124+13+124=512.(2)ξ可能取值为0,40,80,120,160,则P (ξ=0)=14×16=124,P (ξ=40)=14×23+12×16=14,P (ξ=80)=14×16+12×23+14×16=512,P (ξ=120)=12×16+14×23=14,P (ξ=160)=14×16=124.所以,随机变量ξ的分布列为ξ04080120160P1241451214124∴E (ξ)=0×124+40×14+80×512+120×14+160×124=80,D (ξ)=(0-80)2×124+(40-80)2×14+(80-80)2×512+(120-80)2×14+(160-80)2×124=40003.【总结】求离散型随机变量ξ的均值与方差的步骤(1)理解ξ的意义,写出ξ全部的可能取值;(2)求ξ取每个值的概率;(3)写出ξ的分布列;(4)由均值的定义求E (ξ),由方差的定义求D (ξ).【变式3-1】据有关权威发布某种传染病的传播途径是通过呼吸传播,若病人(患了某种传染病的人)和正常人(没患某种传染病的人)都不戴口罩而且交流时距离小于一米90%的机率被传染,若病人不戴口罩正常人戴口罩且交流时距离小于一米时60%的机率被传染,若病人戴口罩而正常人不戴口罩且交流距离小于一米时30%的机率被传染上,若病人和正常人都带口罩且交流距离大于一米时不会被传染.为此对某地经常出入某场所的人员通过抽样调查的方式对戴口罩情况做了记录如下表:男士女士戴口罩不戴口罩戴口罩不戴口罩甲地40203010乙地10304515假设某人是否戴口罩互相独立(1)求去甲地的男士带口罩的概率,用上表估计所有去甲地的人戴口罩的概率.(2)若从所有男士中选1人,从所有女士中选2人,用上表的频率估计概率,求戴口罩人数X 的分布列和期望.(3)上表中男士不戴口罩记为“ξ=0”,戴口罩记为“ξ=1”,确定男士戴口罩的方差为Dξ,和女士不戴口罩记为“η=0”,戴口罩记为“η=1”确定女士戴口罩的方差为Dη.比较Dξ和Dη的大小,并说明理由.【解析】(1)设“去甲地的男士带口罩”为事件M ,则P (M )=4040+20=23,设“去甲地的人戴口罩”为事件N ,则P (N )=40+3040+20+30+10=710,(2)设“男士带口罩”为事件A ,则P (A )=40+1040+20+10+30=12,设“女士带口罩”为事件B ,则P (B )=30+4530+10+45+15=34,所有男士中选1人,从所有女士中选2人,戴口罩人数X =0,1,2,3,P (X =0)=12×14×14=132,P (X =1)=12×14×14+12×34×14+12×14×34=732,P (X =2)=12×34×14+12×14×34+12×34×34=1532,P (X =3)=12×34×34=932分布列为:X123P1327321532932E (X )=0×132+1×732+2×1532+3×932=2(3)E (ξ)=0×12+1×12=12,D (ξ)=(0-12)2×12+(1-12)2×12=14,E (η)=0×14+1×34=34,D (η)=(0-34)2×14+(1-34)2×34=316.100名男士中有50人戴口罩,50人不戴口罩,100名女士中有75人戴口罩,25人不戴口罩,从数据分布可看出来女士戴口罩的集中程度要好于男士,所以其方差偏小.【变式3-2】已知X 的分布列为X -101P121316设Y =2X +3,则E (Y )的值为()A .73B .4C .-1D .1【答案】A【解析】∵E (X )=-12+16=-13,∴E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-3】已知离散型随机变量X 的分布列为X 012P0.51-2qq 2则常数q =________.【答案】1-22【解析】由分布列的性质得0.5+1-2q +q 2=1,解得q =1-22或q =1+22(舍去).【变式3-4】设随机变量X 的分布列为P (X =k )=a k,k =1,2,3,则a 的值为__________.【答案】2713【解析】因为随机变量X 的分布列为P (X =k )=a k,k =1,2,3,所以根据分布列的性质有a ·13+a 2+a 3=1,所以a +19+=a ×1327=1,所以a =2713.【变式3-5】已知随机变量X 的分布列如下:X -101P121316若Y =2X +3,则E (Y )的值为________.【答案】73【解析】E (X )=-12+16=-13,则E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-6】若随机变量X 满足P (X =c )=1,其中c 为常数,则D (X )的值为________.【答案】0【解析】因为P (X =c )=1,所以E (X )=c ×1=c ,所以D (X )=(c -c )2×1=0.【变式3-7】(2022·昆明模拟)从1,2,3,4,5这组数据中,随机取出三个不同的数,用X 表示取出的数字的最小数,则随机变量X 的均值E (X )等于()A.32B.53C.74D.95【答案】A【解析】由题意知,X 的可能取值为1,2,3,而随机取3个数的取法有C 35种,当X =1时,取法有C 24种,即P (X =1)=C 24C 35=35;当X =2时,取法有C 23种,即P (X =2)=C 23C 35=310;当X =3时,取法有C22种,即P (X =3)=C 22C 35=110;∴E (X )=1×35+2×310+3×110=32.【变式3-8】已知随机变量X ,Y 满足Y =2X +1,且随机变量X 的分布列如下:X 012P1613a则随机变量Y 的方差D (Y )等于()A.59B.209C.43D.299【答案】B【解析】由分布列的性质,得a =1-16-13=12,所以E (X )=0×16+1×13+2×12=43,所以D (X )×16+×13+×12=59,又Y =2X +1,所以D (Y )=4D (X )=209.【变式3-9】已知m ,n 为正常数,离散型随机变量X 的分布列如表:X -101Pm14n若随机变量X 的均值E (X )=712,则mn =________,P (X ≤0)=________.【答案】11813【解析】+n +14=1,-m =712,=112,=23,所以mn =118,P (X ≤0)=m +14=13.【变式3-10】(2022·邯郸模拟)小张经常在某网上购物平台消费,该平台实行会员积分制度,每个月根据会员当月购买实物商品和虚拟商品(充话费等)的金额分别进行积分,详细积分规则以及小张每个月在该平台消费不同金额的概率如下面的表1和表2所示,并假设购买实物商品和购买虚拟商品相互独立.表1购买实物商品(元)(0,100)[100,500)[500,1000)积分246概率141214表2购买虚拟商品(元)(0,20)[20,50)[50,100)[100,200)积分1234概率13141416(1)求小张一个月购买实物商品和虚拟商品均不低于100元的概率;(2)求小张一个月积分不低于8分的概率;(3)若某个月小张购买了实物商品和虚拟商品,消费均低于100元,求他这个月的积分X 的分布列与均值.【解析】(1)小张一个月购买实物商品不低于100元的概率为12+14=34,购买虚拟商品不低于100元的概率为16,因此所求概率为34×16=18.(2)根据条件,积分不低于8分有两种情况:①购买实物商品积分为6分,购买虚拟商品的积分为2,3,4分;②购买实物商品积分为4分,购买虚拟商品的积分为4分,故小张一个月积分不低于8分的概率为14×+12×16=14.(3)由条件可知X 的可能取值为3,4,5.P (X =3)=1313+14+14=25,P (X =4)=P (X =5)=1413+14+14=310,即X 的分布列如下:X 345P25310310E (X )=3×25+4×310+5×310=3910.考点4均值与方差在决策中的作用【例4】2021年3月5日李克强总理在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构.某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的延保维修方案:方案一:交纳延保金5000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1000元;方案二:交纳延保金6230元,在延保的5年内可免费维修4次,超过4次每次收取维修费t 元;制造商为制定收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表:维修次数0123机器台数20408060以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X 表示2台机器超过保修期后5年内共需维修的次数.(1)求X 的分布列;(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t 定在什么范围?【分析】(1)由题设描述确定2台机器超过保修期后5年内共需维修的次数的可能值,并确定对应的基本事件,进而求各可能值的概率,写出分布列.(2)根据(1)所得分布列,由各方案的费用与维修次数的关系写出费用的分布列,并求期望,通过期望值的大小关系求参数的范围.【解析】(1)由题意得,X =0,1,2,3,4,5,6,P (X =0)=110×110=1100,P (X =1)=110×15×2=125,P (X =2)=110×25×2+15×15=325,P (X =3)=110×310×2+15×25×2=1150,P (X =4)=310×15×2+25×25=725,P (X =5)=310×25×2=625,P (X =6)=310×310=9100,∴X 的分布列为X 0123456P110012532511507256259100(2)选择方案一:所需费用为Y 1元,则X ≤2时,Y 1=5000,X =3时,Y 1=6000;X =4时,Y 1=7000;X =5时,Y 5=8000,X =6时,Y 1=9000,∴Y 1的分布列为Y 150006000700080009000P1710011507256259100E (Y 1)=5000×17100+6000×1150+7000×725+8000×625+9000×9100=6860,选择方案二:所需费用为Y 2元,则X ≤4时,Y 2=6230;X =5时,Y 2=6230+t ;X =6时,Y 2=6230+2t ,则Y 2的分布列为Y 262306230+t 6230+2t P671006259100E (Y 2)=6230×67100+(6230+t )×625+(6230+2t )×9100=6230+21t50,要使选择方案二对客户更合算,则E (Y 2)<E (Y 1),∴6230+21t50<6860,解得t <1500,即t 的取值范围为[0,1500).【总结】利用均值、方差进行决策的2个方略(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.【变式4-1】直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有56是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2021年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为710,15,110;方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为35,310,110.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.0500.0250.010x α2.0722.7063.8415.0246.635其中,χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .【解析】(1)由图1知,“年轻人”占比为45.5%+34.5%=80%,即有200×80%=160(人),“非年轻人”有200-160=40(人),由图2知,“经常使用直播销售用户”占比为30.1%+19.2%+10.7%=60%,即有200×60%=120(人),“不常使用直播销售用户”有200-120=80(人).“经常使用直播销售用户的年轻人”有120×56=100(人),“经常使用直播销售用户的非年轻人”有120-100=20(人).∴补全的列联表如下:年轻人非年轻人合计经常使用直播销售用户10020120不常使用直播销售用户602080合计16040200于是a =100,b =20,c =60,d =20.∴χ2=200×(100×20-60×20)2120×80×160×40=2512≈2.083>2.072,即有85%的把握认为经常使用网络直播销售与年龄有关.(2)若按方案一,设获利X 1万元,则X 1可取的值为300,-150,0,X 1的分布列为:X 1300-1500p71015110E (X 1)=300×710+(-150)×15+0×110=180(万元),D(X1)=(300-180)2×710+(-150-180)2×15+(0-180)2×110=1202×710+3302×15+1802×110=35100若按方案二,设获利X2万元,则X2可取的值为500,-300,0,X2的分布列为:X2500-3000p 35310110E(X2)=500×35+(-300)×310+0×110=210(万元),D(X2)=(500-210)2×35+(-300-210)2×310+(0-210)2×110=2902×35+5102×310+2102×110=132900∵E(X1)<E(X2),D(X1)<D(X2),由方案二的均值要比方案一的均值大,从获利角度来看方案二更大,故选方案二.由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.【变式4-2】某班体育课组织篮球投篮考核,考核分为定点投篮与三步上篮两个项目.每个学生在每个项目投篮5次,以规范动作投中3次为考核合格,定点投篮考核合格得4分,否则得0分;三步上篮考核合格得6分,否则得0分.现将该班学生分为两组,一组先进行定点投篮考核,一组先进行三步上篮考核,若先考核的项目不合格,则无需进行下一个项目,直接判定为考核不合格;若先考核的项目合格,则进入下一个项目进行考核,无论第二个项目考核是否合格都结束考核.已知小明定点投篮考核合格的概率为0.8,三步上篮考核合格的概率为0.7,且每个项目考核合格的概率与考核次序无关.(1)若小明先进行定点投篮考核,记X为小明的累计得分,求X的分布列;(2)为使累计得分的均值最大,小明应选择先进行哪个项目的考核?并说明理由.【解析】(1)由已知可得,X的所有可能取值为0,4,10,则P(X=0)=1-0.8=0.2,P(X=4)=0.8×(1-0.7)=0.24,P(X=10)=0.8×0.7=0.56,所以X的分布列为X0410P0.20.240.56(2)小明应选择先进行定点投篮考核,理由如下:由(1)可知小明先进行定点投篮考核,累计得分的均值为E(X)=0×0.2+4×0.24+10×0.56=6.56,若小明先进行三步上篮考核,记Y为小明的累计得分,则Y的所有可能取值为0,6,10,P(Y=0)=1-0.7=0.3,P (Y =6)=0.7×(1-0.8)=0.14,P (Y =10)=0.7×0.8=0.56,则Y 的均值为E (Y )=0×0.3+6×0.14+10×0.56=6.44,因为E (X )>E (Y ),所以为使累计得分的均值最大,小明应选择先进行定点投篮考核.【变式4-3】为加快某种病毒的检测效率,某检测机构采取“k 合1检测法”,即将k 个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X 为总检测次数,求检测次数X 的分布列和均值E (X );(2)若采用“5合1检测法”,检测次数Y 的均值为E (Y ),试比较E (X )和E (Y )的大小(直接写出结果).【解析】(1)①对每组进行检测,需要10次;再对结果为阳性的一组每个人进行检测,需要10次,所以总检测次数为20.②由题意,X 可以取20,30,P (X =20)=111,P (X =30)=1-111=1011,则X 的分布列为X 2030P1111011所以E (X )=20×111+30×1011=32011.(2)由题意,Y 可以取25,30,两名感染者在同一组的概率为P 1=C 120C 22C 398C 5100=499,不在同一组的概率为P 1=9599,则E (Y )=25×499+30×9599=295099>E (X ).【变式4-4】(2022·莆田质检)某工厂生产一种精密仪器,由第一、第二和第三工序加工而成,三道工序的加工结果相互独立,每道工序的加工结果只有A ,B 两个等级.三道工序的加工结果直接决定该仪器的产品等级:三道工序的加工结果均为A 级时,产品为一等品;第三工序的加工结果为A 级,且第一、第二工序至少有一道工序加工结果为B 级时,产品为二等品;其余均为三等品.每一道工序加工结果为A 级的概率如表一所示,一件产品的利润(单位:万元)如表二所示:表一工序第一工序第二工序第三工序概率0.50.750.8表二等级一等品二等品三等品利润2385(1)用η表示一件产品的利润,求η的分布列和均值;(2)因第一工序加工结果为A 级的概率较低,工厂计划通过增加检测成本对第一工序进行改良,假如改良过程中,每件产品检测成本增加x (0≤x ≤4)万元(即每件产品利润相应减少x 万元)时,第一工序加工结果为A 级的概率增加19x .问该改良方案对一件产品利润的均值是否会产生影响?并说明理由.【解析】(1)由题意可知,η的所有可能取值为23,8,5,产品为一等品的概率为0.5×0.75×0.8=0.3,产品为二等品的概率为(1-0.5×0.75)×0.8=0.5,产品为三等品的概率为1-0.3-0.5=0.2,所以η的分布列为η2385P0.30.50.2E (η)=23×0.3+8×0.5+5×0.2=11.9.(2)改良方案对一件产品的利润的均值不会产生影响,理由如下:在改良过程中,每件产品检测成本增加x (0≤x ≤4)万元,第一工序加工结果为A 级的概率增加19x ,设改良后一件产品的利润为ξ,则ξ的所有可能取值为23-x,8-x,5-x ,+19x 0.75×0.8=0.3+x15,二等品的概率为10.75×0.8=0.5-x15,三等品的概率为10.2,所以E (ξ)-x )-x )+0.2×(5-x )=6.9-0.3x +2315x -115x 2+4-0.5x -815x +1152+1-0.2x =11.9,因为E (ξ)=E (η),所以改良方案对一件产品的利润的均值不会产生影响.1.(多选)设离散型随机变量X 的分布列如下表:X 12345Pm0.10.2n0.3若离散型随机变量Y =-3X +1,且E (X )=3,则()A .m =0.1B .n =0.1C .E (Y )=-8D .D (Y )=-7.8【答案】BC【解析】由E (X )=1×m +2×0.1+3×0.2+4×n +5×0.3=3得m +4n =0.7,又由m +0.1+0.2+n +0.3=1得m +n =0.4,从而得m =0.3,n =0.1,故A 选项错误,B 选项正确;E (Y )=-3E (X )+1=-8,故C 选项正确;因为D (X )=0.3×(1-3)2+0.1×(2-3)2+0.1×(4-3)2+0.3×(5-3)2=2.6,所以D (Y )=(-3)2D (X )=23.4,故D 选项错误.2.已知随机变量ξ的分布列如下表,D (ξ)表示ξ的方差,则D (2ξ+1)=___________.ξ012pa1-2a14【答案】2【解析】由题意可得:a +1-2a +14=1,解得a =14,ξ012p141214所以E (ξ)=0×14+1×12+2×14=1,D (ξ)=14(0-1)2+12×(1-1)2+14×(2-1)2=12,D (2ξ+1)=22D (ξ)=2.3.京西某地到北京西站有阜石和莲石两条路,且到达西站所用时间互不影响.下表是该地区经这两条路抵达西站所用时长的频率分布表:时间(分钟)10~2020~3030~4040~5050~60莲石路(L 1)的频率0.10.20.30.20.2阜石路(L 2)0.10.40.40.1的频率若甲、乙两人分别有40分钟和50分钟的时间赶往西站(将频率视为概率)(1)甲、乙两人应如何选择各自的路径?(2)按照(1)的方案,用X表示甲、乙两人按时抵达西站的人数,求X的分布列和数学期望.【解析】(1)A i表示事件“甲选择路径L i时,40分钟内赶到火车站”,B1表示事件“乙选择路径L i时,50分钟内赶到火车站”,i=1,2,用频率估计相应的概率,则有P(A1)=0.1+0.2+0.3=0.6,P(A2)=0.1+0.4=0.5,P(A1)>P(A2),所以甲应选择路径L1;P(B1)=0.1+0.2+0.3+0.2=0.8,P(B2)=0.1+0.4+0.4=0.9,P(B1)<P(B2),所以乙应选择路径L2;(2)用A,B分别表示针对(1)的选择方案,甲,乙在各自的时间内到达火车站,由(1)知P(A)=0.6,P(B)=0.9,且A,B相互独立,X的取值是0,1,2,P(X=0)=P(A-B-)=0.1×0.4=0.04,P(X=1)=P(A-B+A B-)=0.4×0.9+0.6×0.1=0.42,P(X=2)=P(AB)=0.9×0.6=0.54,所以X的分布列为:X012P0.040.420.54E(X)=0×0.04+1×0.42+2×0.54=1.5.4.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(n∈N*且n≥4)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以a1,a2,a3,…,a n表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令X=|1-a1|+|2-a2|+|3-a3|+...+|n-a n|,则X是对两次排序的偏离程度的一种描述.下面取n=4研究,假设在品酒师仅凭随机猜测来排序的条件下,a1,a2,a3,a4等可能地为1,2,3,4的各种排列,且各轮测试相互独立.(1)直接写出X的可能取值,并求X的分布列和数学期望;(2)若某品酒师在相继进行的三轮测试中,都有X≤2,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.【解析】(1)X的可能取值为0,2,4,6,8P(X=0)=1A44=124,。

离散型随机变量概率函数的研究

离散型随机变量概率函数的研究
l o —
型 随 机 变 量 , 以 根 据 密 度 函 数 写 出似 然 方 程 , 而 用 极 大似 然 法 进 行 可 进
参数估 计。但是 对 于大 多数 给定 分布 列 的 离散 型随 机 变量 , 往 无法 往
直 接 写 出 它 的 概 率 函 数 , 法 用 极 大 似 然 估 计 法 进 行 参 数 估 计 。 本 文 无 构 造 了 分 布 列 的 插 指 多 项 式 作 为 离 散 型 随 机 变 量 的 概 率 函 数 , 而 用 从
插 指 多项 式 , 而 引 入 Lgag 插 指 多项 式 。 进 ar e n
本 文 引 用 L gag 插 指 多 项式 定 义 了 离 散 型 随 机 变 量 的 概 率 ar e n
定 义 l ( 指 多 项 式ቤተ መጻሕፍቲ ባይዱ) 设 函数 Y ( ) 区 间 [ ,] 插 一 x 在 a b 上有 定
指 函数 ,1式 叫做 插 指 条 件 , 间 [ ,] () 区 a b 叫做 插 指 区 间 , x叫 做 点
插 指点 。
[] 2 吴伟璃 散 型随机 变量 的分段 线性插值 []苏州教 育 学 院学报 ,04 J. 20 ,
L ga  ̄插 指 多项 式 。 a n
引 理 l 满 足 插指 条 件 () 1 的次 数 不 超 过 n的
项式唯一。
3 数 值例
插 指 多
极 大似 然法对 参数进 行估计 , 并讨 论 了估 计量 的各种 性质 。
【 键 词 】 指 多 项 式 ; 数 估 计 ; 大 似 然 估 计 关 插 参 极
函数 , 是 Lgm , 值 的变 形 , 且 是 存 在 唯 一 的 。这 种 多 项 式 它 an g 插 并 的优 点 是 简 单 明 确 , 式 对 称 , 算 方 便 , 而 使 极 大 似 然 估 计 法 形 计 从

2-2离散型随机变量及其分布律

2-2离散型随机变量及其分布律

P(X=2)=C (0.05) (0.95) = 0.007125
思考:本例中的“有放回”改为”无放回” 思考: 本例中的“有放回”改为”无放回”? 不是伯努利试验。 各次试验条件不同,此试验就不是伯努利试验 此时, 各次试验条件不同,此试验就不是伯努利试验。此时, 1 2 只能用古典概型求解. 古典概型求解 只能用古典概型求解. C C
3. 泊松分布
定义 若一个随机变量 X 的概率分布为 λke−λ P{ X = k} = , k = 0,1,2,⋯, k! 则称 X 服从参数为 λ 的泊松分布, 泊松分布, 记为 X ~ P (λ ) 或 X ~ π (λ ). 易见, 易见,1) P { X = k } ≥ 0; ( k −λ ∞ ∞ ∞ λk λe −λ (2)∑P{X = k} = ∑ =e ∑ k! k=0 k ! k=0 k=0
泊松分布是常见的一种分布: 泊松分布是常见的一种分布: 地震 火山爆发 特大洪水
商场接待的顾客数 电话呼唤次数 交通事故次数
4. 二项分布的泊松近似
很大时, 对二项分布 b( n, p ), 当试验次数 n 很大时, 计 算其概率很麻烦. 例如, 算其概率很麻烦 例如,b(5000, 0.001), 要计算
.
二、几种常见分布
1. 两点分布 只可能取x 设随机变量 X 只可能取 1与x2两个值 , 它的 分布律为 x x
X pi
p 1− p
1
2
0< p<1
则称 X 服从x1 , x2处参数为 的两点分布。 处参数为p的两点分布。
说明: 只可能取0与 两个值 说明:若随机变量 X 只可能取 与1两个值 , 它的 分布律为 0 1
则随机变量 X的分布律为 X 的分布律为
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目录毕业设计任务书 (Ⅰ)开题报告 (Ⅱ)指导教师审查意见 (Ⅲ)评阅教师评语 (Ⅳ)答辩会议记录 (Ⅴ)中文摘要 (Ⅵ)外文摘要 (Ⅶ)1 前言 (1)2 选题背景 (2)2.1 题目类型及来源 (2)2.2 研究目的和意义 (2)2.3 国内外现状和发展趋势与研究的主攻方向 (2)3 离散型随机变量的一些基本知识 (3)3.1 随机变量与概率分布 (3)3.2 离散型随机变量函数的概率分布 (5)3.3 离散型随机变量的母函数 (6)4 常见离散型随机变量的概率及其分布关系 (10)4.1 常用离散型随机变量 (10)4.2 常用离散型随机变量的关系 (12)4.3 常见离散型随机变量的特殊性质 (14)5 离散型随机变量的数字特征 (15)5.1 公式法 (16)5.2 随机变量分解法 (16)5.3 母函数方法 (17)6 几个常用离散分布的应用讨论 (19)6.1 关于泊松分布及其应用 (19)6.2 关于二项分布及其应用 (21)参考文献 (22)致谢 (23)离散型随机变量的研究前言离散型随机变量的研究1 前言目前,概率统计理论进入其他自然科学领域的趋势还在不断发展.在社会科学领域 ,特别是经济学中研究最优决策和经济的稳定增长等问题,都大量采用概率统计方法.法国数学家拉普拉斯(Laplace)说对了:“生活中最重要的问题 , 其中绝大多数在实质上只是概率的问题.”英国的逻辑学家和经济学家杰文斯曾对概率论大加赞美:概率论是生活真正的领路人,如果没有对概率的某种估计, 那么我们就寸步难行,无所作为.随机变量概念的引入是概率论发展史上的一次突破,它不仅在形式上使随机事件的表达形式简洁,而且还使变量、函数、积分等分析工具进入了概率论的理论研究之中,从而大大加快了概率论的发展进程.随机变量在概率统计[1]研究中起着极其重要的作用,随机变量是用来描述随机现象的结果的一类特殊的变量,随机变量能够反映随机现象的共性,有关随机变量的结论可以应用到具有不同背景的实际问题中,随机变量是连接随机现象和实数空间的一座桥梁,它使得我们可以借助于有关实数的数学工具来研究随机现象的本质.自18世纪以来,随机变量在得到不断的广泛应用的同时,也得到不断发展和完善,内容也越来越丰富,它直接联系着众多自然现象和实际问题,不断地提出或产生需要解决的新课题和新方法.它所面临的数学问题多样而复杂,不断地促进着许多相关数学分支的发展.对于随机变量,我们最关心的问题是它取哪一些值,以及它以多大概率取这些值.因此从这个角度看离散型随机变量的概率分布律的计算就成了学习离散随机变量的主要计算课题. 关于离散随机变量,常见离散随机变量概率分布及其关系、离散随机变量的数字特征、离散随机变量的概率分布的母函数及其性质的研究都是当今研究的主要方面.在离散型中比较典型,也比较重要的概率分布律要属二项分布,泊松分布,超几何分布与几何分布了,它们在许多实际问题中也有应用到.本文先介绍随机变量与概率分布的关系,然后给出几种常见的离散型随机变量的概率分布及其关系,介绍离散型随机变量的函数的一些性质,通过研究离散型随机变量的母函数来求它的数字特征及其其他问题,最后讨论离散型随机变量的一些应用研离散型随机变量的研究究.通过研究离散型随机变量的一些常见性质以及它在某些方面的应用研究,来更深刻的学习它的一方面知识.基于此以突出它在数学教学中的重要意义以及未来发展中的重要影响.2 选题背景2.1 题目类型及来源题目类型:研究论文题目来源:专题研究2.2 研究目的和意义随机变量在概率统计研究中起着极其重要的作用,随机变量是用来描述随机现象的结果的一类特殊的变量,随机变量能够反映随机现象的共性,有关随机变量的结论可以应用到具有不同背景的实际问题中,随机变量是连接随机现象和实数空间的一座桥梁,它使得我们可以借助于有关实数的数学工具来研究随机现象的本质.而离散型随机变量是为随机变量中的一种,即研究的变量仅可能取有限个或可列个值,比如抛掷骰子出现的点数、射击命中的环数、产品检验中次品的件数等等,都是离散型随机变量研究的范畴.通过研究也可以检验自己对专业理论知识的理解与掌握程度.锻炼自己综合运用所学知识分析问题,解决问题的能力.使自己具有良好的思想作风,顽强的学习毅力和实事求是的工作作风,培养自己综合运用所学理论知识和技能的能力.2.3 国内外现状和发展趋势与研究的主攻方向自18世纪以来,随机变量在得到不断的广泛应用的同时,也得到不断发展和完善,内容也越来越丰富,它直接联系着众多自然现象和实际问题,不断地提出或产生需要解决的新课题和新方法.它所面临的数学问题多样而复杂,不断地促进着许多相关数学分支的发展.关于离散随机变量,常见离散随机变量概率分布及其关系、离散随机变量的数字特征、离散随机变量的概率分布的母函数及其性质的研究都是当今研究的主要方面.每个随机变量都有一个分布,不同随机变量可以有不同的分布,随机变量有千千万万离散型随机变量的数字特征个,但常用分布并不多,常用离散分布主要为二项分布、泊松分布、超几何分布、几何分布与负几何分布,其中二项分布,泊松分布以及超几何分布在现实生活中有比较广泛的应用,是当今国内外研究的主攻方向.另外多维随机变量也是当今研究的主要范畴.随机变量(random variable )表示随机现象(在一定条件下,并不总是出现相同结果的现象称为随机现象)各种结果的变量(一切可能的样本点),例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等等,都是随机变量的实例.随着社会文明的发展,我国与其它国家的文化交流沟通很全面,离散随机变量的研究方向基本上也是一致的,主要研究离散随机变量的概率分布关系及其母函数的特征性质,离散随机变量的分布列以及数字特征,离散随机变量的均值与方差,离散随机变量的数学期望等等.3 离散型随机变量的一些基本知识3.1 随机变量与概率分布定义 1 定义在样本空间Ω上的实值函数()X X ω=称为随机变量,常用大写字母X,Y,Z 等表示随机变量,其取值用x,y,z 等表示.假如一个随机变量仅可能取有限个或可列个值,则称其为离散随机变量.假如一个随机变量的可能取值充满数轴上的一个区间(a,b ),则称其为连续随机变量,其中a 可以是∞-,b 可以是∞.概率分布是随机变量指X 小于任何已知实数x 的事件可以表示成的函数。

用以表述随机变量取值的概率规律.描述不同类型的随机变量有不同的概率分布形式.是概率论的基本概念之一.概率分布是概率论的一个概念,使用时可以有以下两种含义:广义地,概率分布是指称随机变量的概率性质:当我们说概率空间 (Ω,F,P)中的两个随机变量X 和Y 具有同样的分布(或同分布)时,我们是无法用概率P 来区别他们的.换言之:称X 和Y 为同分布的随机变量,当且仅当对任意事件ΑF ∈,有()()P X A P Y A ∈=∈成立.但是,不能认为同分布的随机变量是相同的随机变量.事实上即使X 与Y 同分布,也可以没有任何点ω使得X(ω)=Y(ω).在这个意义下,可以把随机变量分类,每一类称作一个分布,其中的所有随机变量都同分布。

用更简要的语言来说,同分布是一离散型随机变量的研究种等价关係,每一个等价类就是一个分布.需注意的是,通常谈到的二项分布,泊松分布,超几何分布,几何分布与负二项分布等,都是指各种类型的分布,而不能视作一个分布.狭义地,它是指随机变量的概率分布函数.设X 是样本空间(Ω,F)上的随机变量,P 为概率测度,则称如下定义的函数是X 的分布函数(distribution function ),或称累积分布函数(cumulative distribution function ,简称CDF ):()()x F a P X a =≤,对任意实数a 定义.具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数.随机变量的概率分布列具有以下两点性质:(1)非负性 ()i p x 0,i 1,2,≥=. (2) 正则性 1i p(x )1i ∞==∑.对于特定的随机变量X ,其分布函数FX 是单调不减及右连续,而且()()x x F 0,F 1∞∞-==.这些性质反过来也描述了所有可能成为分布函数的函数:随机变量的分布设P 为概率测度,X 为随机变量则函数()()()F x P X x x R =≤∈称为X 的概率分布函数.如果将X 看成是数轴上的随机点的坐标,那么,分布函数F(x)在x 处的函数值就表示X 落在区间(-∞,x]上的概率.例如,设随机变量X 为掷两次骰子所得的点数差,而整个样本空间由36个元素组成,数量( i , j )∈ S x P(X = x) F(x) 6 ( 1,1 ),( 2,2 ),( 3,3 )( 4,4 ),( 5,5 ),( 6,6 )06/36 6/36 10 ( 1,2 ),( 2,3 )( 3,4 ),( 4,5 ),( 5,6 ) 110/3616/36离散型随机变量的数字特征( 2,1 ),( 3,2 ),( 4,3 )( 5,4 ),( 6,5 )8 ( 1,3 ),( 2,4 ),( 3,5 )( 4,6 ),( 3,1 ),( 4,2 )( 5,3 ),( 6,4 )28/36 24/36 6 ( 1,4 ),( 2,5 ),( 3,6 )( 4,1 ),( 5,2 ),( 6,3 )36/36 30/36 4 ( 1,5 ),( 2,6 )( 5,1 ),( 6,2 )44/36 34/36 2 ( 1,6 ),( 6,1 ) 52/3636/36 3.2 离散型随机变量函数的概率分布设y=g(x)是定义在直线上的一个函数,X 是一个随机变量,那么Y=g(X)作为X 的函数,同样也是一个随机变量.在实际问题中,我们经常感兴趣的问题是:已知随机变量X 的分布,如何求出另一个随机变量的Y=g(X)的分布.描述离散型随机变量的概率特性常用它的概率分布或分布律,即,1,2,k k P X x p k ===()离散型随机变量的研究设X 为随机变量,x 是任意实数,则函数)()(x X P x F ≤=称为随机变量X 的分布函数,本质上是一个累积函数.)()()(a F b F b X a P -=≤<可以得到X 落入区间],(b a 的概率.分布函数)(x F表示随机变量落入区间]– x ∞(,内的概率. 分布函数具有如下性质:1° ,1)(0≤≤x F +∞<<∞-x ;2° )(x F 是单调不减的函数,即21x x <时,有 ≤)(1x F )(2x F ;3° 0)(lim )(==-∞-∞→x F F x , 1)(lim )(==+∞+∞→x F F x ; 4° )()0(x F x F =+,即)(x F 是右连续的;5° )0()()(--==x F x F x X P .对于离散型随机变量,∑≤=x x k k p x F )(; 离散型随机变量的分布列为()()()12n 12n x x x x x x X~p p p ⎛⎫ ⎪ ⎪⎝⎭ 则其Y 的分布列为 ()()()12n 12nx x x y y y Y~p p p ⎛⎫ ⎪ ⎪⎝⎭ 当y 的取值中有某些值相等时,则把那些相等的值分别合并,并把对应的概率相加即可.3.3 离散型随机变量的母函数母函数在研究离散型随机变量的某些问题中,具有非常重大的作用.现给出母函数的定义.定义 2 设X 是取非负整数值的随机变量,其分布律为{}k p P X k ==,对于1s ≤,称0()()k X k k G s p s E s ∞===∑为该分布的母函数.例如,若~(,)X b n p ,则离散型随机变量的数字特征0()()()n kkn k n n k G s C ps q q ps -===+∑;若)(~p Ge X ,则11()1k k k ps G s pq s qs∞-===-∑; 若()X πλ∈,则(1)0()!k k s k G s e s e k λλλ∞--===∑.母函数的性质:可以证明母函数有如下性质[2] :(1) 概率分布与母函数是一一对应的.因而对于概率分布的许多研究可以化为对其所对应的母函数的研究;(2) 独立随机变量之和的母函数 若随机变量12,,,n X X X 相互独立,它们的母函数分别为12(),(),,()n G s G s G s ,则X =12n X X X +++的母函数为 ()G s =12()()()n G s G s G s 特别当12,,,n X X X 独立同分布时,1()()i G s G s =,这时 1()[()]n G s G s =;(3)随机个随机变量之和的母函数 设12,,,,n X X X 是一串独立同分布的取非负整数值的随机变量,其母函数为()g s ,随机变量Y 是取正整数值的,其母函数为()G s .若{}n X 与Y 独立,则Z =12Y X X X +++(若0Y =,则定义0Z =)的母函数为()H s =[]()G g s .典型离散型随机变量的母函数⑴ 两点分布的母函数:()G z q pz =+⑵ 二项式分布的母函数:()()n G z q pz =+⑶ 泊松分布():()()λz 1G z e--= ⑷ 几何分布:()pz G z 1qz=- 现在讲解几个母函数的应用1 利用母函数求概率分布列定理:设随机变量X 的母函数为()()0X G S P S S 1k k k ∞==≤∑离散型随机变量的研究则X 的概率分布列为()kk x k s 01d p G s k!ds =⎡⎤=⎢⎥⎣⎦证明:对()x G s 用幂级数展开,并逐项求导,可得()()()km k x k m km k 1d G s k!p m m 1m k 1p s ds ∞--+=+--+∑在上式中令s 0=,有()k X k k S 0d G S k!p ds =⎡⎤=⎢⎥⎣⎦因此()kk x k s 01d p G s k!ds =⎡⎤=⎢⎥⎣⎦2 现在证明母函数的唯一性 证明:设随机变量的概率分布为{}k p ,随机变量的概率分布为{}k q ,它们的母函数分别为()kx k k 0G s p s ∞==∑及()k y k k 0G s q s ∞==∑ 且()()x y G s G s =,因()()x y G s G s 和均为幂级数,且当s 1≤时该幂级数收敛,对()()x y G s G s 和求导k 次,并令s 0=,则得()()()()k k k x y k k!p G 0G 0k!q ===因此得:k k p q ,k 0,1,2,==,即两个概率分布相同,由此可知,概率分布和母函数是一一对应的.3 利用母函数求均值利用母函数可以求得相应的概率分布的的数字特征,若非负整值随机变量X 的母函数为()0kX k G S P s k ∞==∑则其导数为()1k 1x k d G s kp s ds k ∞-==∑离散型随机变量的数字特征上述级数至少在s 1<是收敛的,当随机变量X 的数学期望存在时,即()1k E X kp k ∞==∑存在时,显然有()()x k s 11d G s kp E X ds k ∞==⎡⎤==⎢⎥⎣⎦∑.4 利用母函数求方差母函数()X G s 对s 求二阶导数,有()()()22X k 1x 22s 1d d G s k k 1p G s dx dx k ∞==⎡⎤=-=⎢⎥⎣⎦∑因此X 的方差为:()()()()()2222X X x 2s 1s 1s 1d d d D X E X E X G s G s G s ds ds ds ---⎧⎫⎡⎤⎡⎤⎡⎤⎡⎤=-=+-⎡⎤⎨⎬⎢⎥⎣⎦⎣⎦⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎩⎭现在举出几个母函数求期望与方差的例子① 计算二项分布随机变量的母函数、数学期望和方差解:若随机变量服从二项分布,则有[]()k k n kk n p P X k C p q k 0,1,2,n -====因此其母函数为()0kx k G s P s k ∞==∑()()nnk k n n 0k kx G s C p qs q ps k =-==+∑其一、二阶导数为()()()()()2n 1n 22x x 2d d G s n q ps p G s n n 1q ps p ds ds--=+=-+ X 的数学期望为[]()()n 1x s 1d E X G s |n q p p np ds --==+=()()()()2n 222x s 12d G s |n n 1q p p n n 1p ds --=-+=-X 的方差为[]()()()22x s 1x s 1x s 12d d d D X [G s ][G s ][G s ]ds ds ds ---⎧-+⎫=⎨⎬⎩⎭()()22n n 1p np np npq=-+-=离散型随机变量的研究② 计算泊松分布随机变量的母函数、数学期望和方差 解:若随机变量X 服从泊松分布,则[]k λk λp P X k e k!-===因此其母函数为()()()kkλs 1λk λλλs X 00λs λG S e s e e e e k!k!k k ∞∞==----====∑∑()()()()2λs 1λs 12x x 2d d G s λe G s λe ds ds --==X 的数学期望为[]()()λs 1x s 1s 1d E X G s |e λλds ---⎡⎤===⎣⎦()()2λs 122x s 12s 1d G s |λe λds ---⎡⎤==⎣⎦X 的方差为[]()()()22x s 1x s 1x s 12d d d D X G s ]G s ][G s ]ds ds ds ---⎡⎡⎧⎫=+-⎨⎬⎢⎢⎩⎭⎣⎣ 22λλλλ=+-=综上所言为离散型随机变量的母函数的一些性质及用来解决问题的方法.4 常见离散型随机变量的概率及其分布关系4.1 常用离散型随机变量常用离散型随机变量大致有七种:(1) 0-1分布或两点分布:),1(~p b X ,两点分布也成为伯努利分布,是超几何分布的特殊情况,当伯努利试验成功,令伯努利随机变量为1,若伯努利试验失败,令伯努利随机变量为0;(2)二项分布:~(,)X b n p ,二项分布即重复的n 次独立的伯努利试验,在每次试验中只有两种可能的结果,且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生于否的概率在每一次独立试验中都保持不变,则这一系列才、试验总称为n 重伯努利实验,当试验次数为1时,二项分布就是伯努利分布;常见离散型随机变量的概率及其分布关系(3)几何分布:)GeX,在n次伯努利试验中,试验k次才得到第一次成功的~p(机率,详细的说,是:前k-1次皆失败,第k次成功的概率;(4)巴斯卡分布或负二项分布:~(,)X Nb r p,满足其分布要有以下条件:实验包含一系列独立的实验,每个实验都有成功、失败两种结果,成功的概率是恒定的,实验持续到r次成功,r为正整数;(5)泊松分布:Xπλ,泊松分布中只有一个参数,它是泊松分布的均值,~()也是泊松分布的方差,关于泊松分布,接下会有详细的讨论;(6)超几何分布:~(,,)X h n M N,它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数;(7)多项分布,是二项式分布的推广.它们的关系图如下图 1 基于贝努利试验的结构图离散型随机变量的研究这些随机变量的最大特点是它们的取值是非负整数,因此引入母函数便于处理.因为母函数是幂级数,具有许多良好的性质,所以母函数是研究取非负整数值随机变量的有效工具.4.2 常用离散型随机变量的关系它们具有以下关系: 1 极限关系(1)设(,)n X b n p ∈,当n 较大时, 由棣莫佛-拉普拉斯定理, 二项分布可用正态分布逼近,(0,1)N ;(2) 当n 较大、p 较小, 且np 不大时, 二项分布可用泊松分布逼近, 即(;,)!kb k n p e k λλ-≈,其中np λ=;(3) 当N 很大而n 较小时, 超几何分布可用二项分布近似,即()(;,)h k b k n p ≈, 其中M p N=. 2 随机变量之和的关系 (1) 设12,,,n X X X 独立同分布于0-1分布, 则1(,)ni i X X b n p ==∈∑;实际上,由于12,,,n X X X 独立同分布于0-1分布,i X 的母函数为()q ps +,由母函数的性质(2),1ni i X X ==∑的母函数为()()n G s q ps =+.与二项分布的母函数相同,故(,)X b n p ∈. (2) 设12,,,r X X X 独立同分布于几何分布, 则1(,)ri i X X Nb r p ==∈∑;证明与(1)类似.这时X 的母函数为()1rps G s qs ⎛⎫= ⎪-⎝⎭.(3 在超几何分布的产生背景中,将抽取n 件产品分解为抽取n 次,每次一常见离散型随机变量的概率及其分布关系件.令i X 表示第i 次抽取的次品数(1)i n ≤≤,显然i X 服从0-1分布,{}1i P X ==M N {},01i M P X N ==-.这时1ni i X X ==∑~(,,)h n M N ; 不过要注意这里的12,,,n X X X 不是相互独立的[3].(4) 设12,,,,n X X X 是独立同分布于0-1分布的随机变量序列,()Y πλ∈,且与{}n X 相互独立,则12Y Z X X X =+++()p πλ∈;这个结果可以从母函数[](1)(1)()()q ps p s H s G g s e e λλ+--===得到验证. (5)设12,,,,n X X X 是独立同分布于参数为1p 的几何分布的随机变量序列,2()Y Ge p ∈,且与{}n X 相互独立,则12Y Z X X X =+++12()Ge p p ∈.这个结果可以从母函数[]1212()()1(1)p p sH s G g s p p s==--得到验证.3 特殊关系(1) 二项分布(,)b n p 中, 取1n =, 即为0-1分布; (2) 巴斯卡分布中, 取1r =, 即为几何分布; (3)多项分布中,取2r =, 即为二项分布;(4)若12(),()X Y πλπλ∈∈, 且,X Y 相互独立,则112(,)X X Y b n λλλ+∈+.即{}112(;,)P X k X Y n b k n λλλ=+==+,说明了泊松分布与二项分布的关系[4];(5)若~(,)X Nb r p , 则{}1(;,)1r k r r k r k k r r P X k p q p q b r k p r r k k ---⎛⎫⎛⎫==== ⎪ ⎪-⎝⎭⎝⎭,这说明了二项分布与巴斯卡分布之间的关系[5]; (6)设12,,,n X X X 相互独立,且~(),1,2,,i i X Ge p i n =, 则11min()(1(1))ni i i ni X X Ge p ≤≤==∈--∏.证明:{}{}{}{}111min()min()1min()i i i i ni ni nP X k P X k P X k P X k ≤≤≤≤≤≤====>-->离散型随机变量的研究{}{}12121,1,,1,,,n n P X k X k X k P X k X k X k =>->->-->>>11111111nn n ni i k k j j j j j j i k i k j j j j p q p q q q +∞+∞---==+====⎛⎫⎛⎫=-=- ⎪ ⎪⎝⎭⎝⎭∑∑∏∏∏∏1111(1)(1)k nn i i i i p p -==⎛⎫⎛⎫=--- ⎪⎪⎝⎭⎝⎭∏∏故11min()(1(1))ni i i ni X X Ge p ≤≤==∈--∏4.3 常见离散型随机变量的特殊性质1 二项分布的最可能成功次数与中心项当n 固定时,考察(;,)b k n p 随k 的变化情况.当k 从0变到n 时,(;,)b k n p ,单调上升,当[](1)k m n p ==+(这里[]为取整符号)时,达到最大值,以后又单调下降.因此,[](1)m n p =+称为最可能成功次数,项(;,)b m n p 称为(;,)b k n p 的中心项.2 几何分布的无记忆性设X 是取正整数值的随机变量,若{}{}P X m n X n P X m >+>=>,这里,m n 是非负整数,则称X 的分布具有无记忆性.显然,若X ∈)(p Ge ,则X 的分布具有无记忆性.实际上,在离散型分布中,也只有几何分布才具有这样的性质.为此,我们证明如下命题[2]:设X 是正整数值的随机变量,并且在已知X k >的条件下,1X k =+的概率与k 无关,那么X 服从几何分布. 为方便证明,记{}k q P X k =>,{}k p P X k ==,{}1p P X k X k ==+>.则111,k k k k k p p q q p q +++=-=,即11k kqp q +=-.注意到01q =,那么(1)k k q p =-,因此(1),1,2,k k p p p k =-= 这正是几何分布.3 二项分布与泊松分布的再生性(1)设,X Y 相互独立,且12(,),(,)X b n p Y b n p ∈∈,则几个常用离散分布的应用讨论12(,)Z X Y b n n p =+∈+;实际上,12()(),()()n n X Y G s q ps G s q ps =+=+,()Z G s=12()n n q ps ++,故12~(,)Z b n n p +.(2)设,X Y 相互独立,且12(),()X Y πλπλ∈∈,则12()Z X Y πλλ=+∈+. 实际上, 12(1)(1)(),()s s X Y G s e G s e λλ--==,()Z G s =12()(1)s e λλ+-. 故12~()Z πλλ+.5 离散型随机变量的数字特征随机变量的数字特征描述了随机变量变化的全貌特点,数学期望或均值描述了随机变量取值的集中位置或平均大小,方差描述了随机变量的取值偏离均值的程度或分散程度.因此研究随机变量数字特征的计算方法是非常必要的.先引入离散型随机变量的数学期望的定义定义 3 设离散随机变量X 的分布列为,1,2,3()(),i i p x P X x i ===如果()ii1x p x i ∞=<∞∑,则称()()1i i E x x p x i ∞==∑为随机变量的X 的数学期望,或称为该分布的数学期望,简称期望或均值.若级数()ii1x p x i ∞=∑不收敛,则称X 的数学期望不存在.再引入其方差的定义定义 4 若随机变量2X 的数学期望2()E X 存在,则称偏差平方()2X EX -的数学期望()2E X EX -为随机变量X (或相应分布)的方差,记为 ()()()2Var X E X E X =-()()()2i i ix E X p x =-∑离散型随机变量的研究X (或相应分布)的标准差,记为()σX . 下面介绍几种求随机变量的数字特征方法:5.1 公式法我们知道,若X 的分布律为{},0,1,2,k k P X x p k ===,则0()k k k E X x p ==∑,()22()()()D X E X E X =-.这就是离散型随机变量X 的期望与方差的计算公式.例如,若),1(~p b X ,则()01E X q p p =⨯+⨯=,()22()()()D X E X E X =-=222201q p p p p pq ⨯+⨯-=-=;若)(~p Ge X ,则11()k k E X kpq+∞-==∑p q p q dq d p q dq d p k k 1)1(11)(20=-=⎪⎪⎭⎫ ⎝⎛-==∑+∞=,又因为2()E X =211k k k pq+∞-=∑1111[(1)]k k k k p k k qkq+∞+∞--===-+∑∑pq dq d pq k k 1022+⎪⎭⎫ ⎝⎛=∑+∞=p q dqd pq 11122+⎪⎪⎭⎫ ⎝⎛-=p p q p q pq 121)1(223+=+-= 由此得X 的方差为 22222211()()[()]q qD XE X E X p p p p =-=+-=; 若)(~λπX ,则11()!(1)!kk k k E X keee e k k λλλλλλλλλ-+∞+∞---======-∑∑,22()[(1)]!!kkk k E X kek k k e k k λλλλ+∞+∞--====-+∑∑= 222(2)!k k ek λλλλ-+∞-=+-∑ =λλ+2,由此得X 的方差为2222()()(())D X E X E X λλλλ=-=+-=.5.2 随机变量分解法若~(,)X b n p , 则1ni i X X ==∑,其中12,,,n X X X 独立同分布于0-1分布[6],由期望与方差的性质,1()()ni i E X E X np ===∑,1()()ni i D X D X npq ===∑.几个常用离散分布的应用讨论若~(,)X Nb r p , 则1ri i X X ==∑,其中12,,,r X X X 独立同分布于几何分布[6],由期望与方差的性质,1()()ri i r E X E X p ===∑,21()()ri i rqD X D X p ===∑.若~(,,)X h n M N ,由X 的产生背景,将抽取n 件产品分解为抽取n 次,每次一件.令i X 表示第i 次抽取的次品数(1)i n ≤≤,则1ni i X X ==∑,i X 服从0-1分布,这里NMp =.不过要注意12,,,n X X X 不是相互独立的[3].故(),()i i E X p D X pq ==.又因为{}{}{}{}111,11111i j i j i j i M P X X P X X P X P X X pN -=========-,故 1()1i j M E X X pN -=-,(,)()()()i j i j i j Cov X X E X X E X E X =-211M p p N -=--,最后由期望与方差的性质得:1()()ni i nME X E X np N====∑, 111()()2(,)2[()()()]ni i j i j i j i i j ni j nD X D X Cov X X npqE X X E X E X =≤<≤≤<≤=+=+-∑∑∑=22()2[n nM N M C N -+21]1M p p N ---2()()(1)nM N M N n N N --=-. 5.3 母函数方法当X 的期望与方差存在时,()(1)E X G '=, []2()(1)(1)(1)D X G G G ''''=+-.上述公式为用母函数计算数学期望及方差的简便公式. 若)(~p Ge X ,则()1ps G s qs =-,1()(1),E X G p'==离散型随机变量的研究[]22()(1)(1)(1)qD X G G G p''''=+-=; 若()Xπλ,则(1)()s G s e λ-=,()(1)E X G λ'==,[]2()(1)(1)(1)D X G G G λ''''=+-=;若~(,)X b n p ,则()()n G s q ps =+,()(1)E X G np '==,2()(1)(1)[(1)]D X G G G npq ''''=+-=.再比如,若(,)X Nb r p ∈,则1ri i X X ==∑,其中12,,,r X X X 独立同分布于几何分布.由于i X 的母函数为1ps qs -,由母函数的性质(2)知()1rps G s qs ⎛⎫= ⎪-⎝⎭.这时2()(1),()(1)(1)[(1)]r E X G D X G G G p '''''===+-=2rqp. 设Z 是母函数的性质(3)中的随机变量,这时,()H s =[]()G g s .由于[]()()()H s G g s g s '''=,[][]2()()[()]()()H s G g s g s g s G g s ''''''''=+,因此当()i E X ,()E Y ,()i D X ,()D Y 存在时,()(1)()()i E Z H E Y E X '==⨯,()(1)D Z H ''=+[]2(1)(1)H H ''-2()[()]()()i i D Y E X E Y D X =+.这是计算随机个独立同分布的随机变量之和的期望与方差的公式[7].例如,设12,,,,n X X X 是独立同分布于0-1分布的随机变量序列,()Y πλ,且与{}n X 相互独立,则12Y Z X X X =+++的期望与方差分别为:()()()i E Z E Y E X p λ=⨯=,2()()[()]()()i i D Z D Y E X E Y D X p λ=+=. 实际上,这个结果也可以从母函数[](1)(1)()()q ps p s H s G g s e e λλ+--===得到验证,因为这时的()Z p πλ∈.再例如,设12,,,,n X X X 是独立同分布于参数为1p 的几何分布的随机变量序列,2()Y Ge p ∈,且与{}n X 相互独立,则12Y Z X X X =+++的期望与方差分别为:121()()()i E Z E Y E X p p =⨯=,2122121()()[()]()()()i i p p D Z D Y E X E Y D X p p -=+=.几个常用离散分布的应用讨论实际上,这个结果也可以从母函数[]1212()()1(1)p p sH s G g s p p s==--得到验证,因这时的12()Z Ge p p ∈.6 几个常用离散分布的应用讨论6.1 关于泊松分布及其应用作为一种常见的离散型随机变量的分布, 泊松分布日益显示其重要性, 成为概率论中最重要的几个分布之一.服从泊松分布的随机变量是常见的.泊松分布产生的一般条件:在自然界和人们的现实生活中, 经常要遇到在随刻出现的某种事件, 我们把在随机时刻相继出现的事件所形成的序列, 叫做随机事件流[8],若事件流具有平稳性、无后效性、普通性, 则称该事件流为泊松事件流(泊松流). 例如一放射性源放射出的 子数;某电话交换台收到的电话呼叫数; 到某机场降落的飞机数; 一个售货员接待的顾客数; 一台纺纱机的断头数; 等这些事件都可以看作泊松流.泊松分布的数学期望与方差: 泊松分布其概率分布列为()k λλP X k e ,k 0,1,2,k!-===其中参数λ0>,记为()X~P λ.由泊松分布知()()()()()000E N t N t D N t N t λt t -=-=-⎡⎤⎡⎤⎣⎦⎣⎦特别地, 令0t 0=, 由于假设()N 00=, 故可推知泊松过程的均值函数和方差分别为()()E N t λt,D N t λt ==⎡⎤⎡⎤⎣⎦⎣⎦泊松过程的强度λ(常数)等于单位长时间间隔内出现的质点数目的期望值. 即对泊松分布有: ()()E X D X λ==泊松分布的特征:⑴ 泊松分布是描述和分析稀有事件的概率分布.要观察到这类事件,样本含量n 必须很大.⑵ 是泊松分布所依赖的唯一参数.值愈小,分布愈偏倚,随着的增大,分布趋于对称.离散型随机变量的研究⑶ 当λ20=时,泊松分布接近于正态分布;当λ50=时,可以认为泊松分布呈正态分布.在实际工作中,当λ20≥时,就可以用正态分布来近视地处理泊松分布的问题.泊松分布的应用研究:在生物学研究中,服从泊松分布的随机变量时常见的.如每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数等.都是服从泊松分布的.[例] 为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如表1.表 1 某社区每毫升饮用水中细菌数3 试分析引用水中细菌数的分布是否服从泊松分布.若服从,按泊松分布计算:细菌数ml ∕(水)的概率及理论次数,并将频率分布与泊松分布直观比较.经计算得每毫升水中平均细菌数x 0.500=,方差2s 0.496=.两者很接近,故可认为细菌数ml ∕(水)服从泊松分布.以x 0.500=代入公式中的得()()k 0.50.5P x k e k 0,1,2k!-===计算结果如表2.表 2 细菌数的泊松分布3 可见细菌数的频率分布与λ0.5=的泊松分布是相当吻合的,进一步说明泊松分布描述单位容积(或面积)中细菌数的分布是适宜.泊松分布理论及其应用的研究,对于试验成功概率很小而试验次数很多的随机过程,都可以很自然的应用于泊松分布的理论.在泊松分布中的概率表达式只含一个参数λ,减少了对参数的确定与修改工作量,模型构建比较简单,具有很重要的实际意。

相关文档
最新文档