第二章随机变量讲义

合集下载

2014年自考 概率论与数理统计串讲讲义 第二章 随机变量及其概率分布

2014年自考 概率论与数理统计串讲讲义 第二章  随机变量及其概率分布

第二章 随机变量及其概率分布1. 离散型随机变量()01k K K KP X x p p ==≥⎧⎪⎨=⎪⎩∑ 例1 设 ,则3.02.05.01=--=c2.常见离散型随机变量(1)0—1分布:设X ~),1(p B ,则应用背景:一次抽样中,某事件A 发生的次数X ~),1(p B ,其中EX X P A P p ====)1()(例2 设某射手的命中率为p ,X 为其一次射击中击中目标的次数,则X ~),1(p B(2)二项分布:设X ~),(p n B ,则()(1),0,1,2,,k k n k n P X k C p p k n -==-=应用背景:n 次独立重复抽样中某事件A 发生的次数X ~),(p n B ,其中()p P A =为事件A 在一次抽样中发生的概率。

例3 某射手的命中率为0.8,X 为其5次射击中命中目标的次数,则X 取的可能值为5,,1,0 ,52()0.80.2k k k P X k C -==,即X ~)8.0,5(B记住:若X ~),(p n B ,则np EX =,)1(p np DX -=(3)泊松(Poisson )分布 若(),0,1,2,!KP X k e k k λλ-===则称X 服从参数λ的泊松分布,且DX EX ==λ,记X ~)(λB ,0>λ应用背景:偶然性事件发生的次数X 一般服从某个参数的泊松分布,如某地的降雨的次数,车祸发生的次数等等。

另外,当Y ~),(p n B ,且n 很大,P 很小时,令np =λ,则()!kP Y k e k λλ-=≈例4 一个工厂生产的产品中的次品率0.005,任取1000件,计算解:设X 表任取的1000件产品中的次品数,则X ~)005.0,100(B ,由于n 很大,p 很小,令5==np λ则(1)55551506151!15!051)1()0(1)2(------=--=--≈=-=-=≥e e e e e X P X P X P (2)5505(5)!kk P X e k -=≤≈∑3.随机变量的分布函数:X 的分布函数为)()(x X P X F ≤=,+∞<<∞-x)(x F 的性质:①1)(0≤≤x F②若21x x <,则0)()(12≥-x F x F③1)(,0)(=+∞=-∞F F④)()(b F b X P =≤,)(1)(),()()(b F b X P a f b F b X a P -=>-=≤<例5 设X 的分布函数⎩⎨⎧≤>+=-0,00,)(x x be a x F x λ,其中0>λ,则______=a b=______. 解:由1)(=+∞F 知1=a (因为a be a F x x =+=+∞-+∞→)(lim )(λ)由0)(=-∞F ,及题设0≤x 时0)(=x F ,故0)1()()(lim 0=+=+=-→+b be a x F x x λ综上有⎩⎨⎧≤>-=-0,00,1)(x x e x F x λ,即1,1-==b a例6 设X 的分布函数⎪⎩⎪⎨⎧≥<≤<=e x e x x x x F ,11,ln 1,0)(求 )5.22(),30(),2(≤<≤<≤X P X P X P解:2ln )2()2(==≤F X P101)0()3()30(=-=-=≤<F F X P25.1ln 2ln 5.2ln )2()5.2()5.22(=-=-=≤<F F X P4. 连续型随机变量若((,))()b a P X a b f x dx ∈=⎰,其中b a <任意,则称X 为连续型随机变量。

概率论讲义第二章随机变量及其分布[统计学经典理论]

概率论讲义第二章随机变量及其分布[统计学经典理论]

第二章随机变量及其分布第一节随机变量1. 为什么引入随机变量?概率论是从数量上来研究随机现象统计规律性的,为了更方便有力的研究随机现象,就要用数学分析的方法来研究,因此为了便于数学上的推导和计算,就需将任意的随机事件数量化.当把一些非数量表示的随机事件用数字来表示时,就建立起了随机变量的概念.2. 随机变量的引入实例1 在一装有红球、白球的袋中任摸一个球,观察摸出球的颜色.实例2 抛掷骰子,观察出现的点数.二、随机变量的概念定义设随机试验E的样本空间是S = {e}, X = X (e)是定义在样本空间S 上的实值单值函数, 则我们称X = X (e)为随机变量.2.说明(1)随机变量与普通的函数不同随机变量是一个函数 , 但它与普通的函数有着本质的差别 ,普通函数是定义在实数轴上的,而随机变量是定义在样本空间上的 (样本空间的元素不一定是实数).(2)随机变量的取值具有一定的概率规律随机变量随着试验的结果不同而取不同的值, 由于试验的各个结果的出现具有一定的概率, 因此随机变量的取值也有一定的概率规律.(3)随机变量与随机事件的关系随机事件包容在随机变量这个范围更广的概念之内.或者说 : 随机事件是从静态的观点来研究随机现象,而随机变量则是从动态的观点来研究随机现象.下面我们举几个随机变量的例子:(1) n次射击命中目标的次数X (或随意抽验n件产品, 其中不合格品的件数), 它有n + 1个可能取值: 0, 1, 2, …, n.(2) 灯泡寿命X, 可以取[0, +∞)上的任意值.(3) 测量误差X, 可以取(-∞, +∞)上的任意值.有了随机变量, 随机试验中的各种事件, 就可以通过随机变量的关系式表达出来.例如, 从一批产品中任意取出10件, 若用X表示其中的废品数, 这时, {少于2件废品}、{恰有1件废品}两个事件, 就可以分别用{X < 2}、{X = 1}来表示.又如单位时间内电话交换台接到的呼唤次数用X 表示, 此时{接到不少于1次呼唤}、{没有接到呼唤}两个事件, 可以分别用{X ≥ 1}、{X = 0}来表示.再如, 上面(2)中事件{寿命不少于200小时而不超过1000小时}的事件, 就可用{200 ≤ X ≤ 1000}来表示.例1 “掷一颗骰子”是随机现象, 用随机变量X 表示出现的点数, 求(1) X 的取值范围; (2) 概率P{X ≤ 4}及P{X < 4}; (3) 概率P{X > 4}及P{2 ≤ X < 4}.引进了随机变量, 就可以通过随机变量来描述随机试验中各种事件, 全面反映试验的情况. 因此, 我们对随机现象统计规律性的研究, 就可以由对事件与事件的概率的研究扩大为对随机变量的研究.-∞第二节 离散型随机变量极其分布律如果随机变量它所有可能取的值是有限个或可列个值, 则我们就称之为离散型随机变量.设离散型随机变量X 的所有可能取值为x k (k = 0, 1, 2, ...), X 取各个可能值的概率, 即事件{X = x k }概率为 P{X = x k }= p k , k = 0, 1, 2, (1)则我们称(1)式为离散型随机变量X 的分布律或概率分布. 分布律也可以用表格的形式来表示:k 1︒ 0 ≤ p k ≤ 1, k = 0, 1, 2, …; 2︒ 11=∑∞=k k p .(2) 注: 凡满足(2)的函数p k 一定是某个离散型随机变量的分布律. 例1 (1) 设随机变量X 的分布律为k c k X P ⎪⎭⎫ ⎝⎛⋅==32}{, k = 1, 2, 3, 求常数c 的值. 3827 (2) 设随机变量X 的分布律为!}{k c k X P k λ⋅==, k = 0, 1, 2, …, λ > 0, 求常数c 的值. 1)1(--λe下面介绍三种重要的离散型随机变量.一、(0 - 1)分布(或两点分布)设随机变量X 只可能取0或1两个值, 它的分布律为k k p p k X P --==1)1(}{, k = 0, 1, (0 < p < 1), 或则称X 服从(0 - 1)分布 凡是只有两个结果的试验都可以用(0 - 1)分布来描述.二、伯努利试验、二项分布在实践中, 我们经常遇到下列类型的重复试验:(1) 每次试验的条件都相同, 且试验结果; 只有两个: A 及A , 且P(A) = p, P(A ) = q = 1 - p (0 < p < 1),(2) 每次试验的结果(即基本事件)是相互独立的.我们称之为n 重伯努利(Bernoulli)试验, 或伯努利概型.由于它是一个常见的、十分有用的概型, 所以在这里着重对它进行讨论.对于伯努利概型, 可以得到如下结果: 在n 次试验中事件A 出现k 次的概率为()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n. (3)事实上, 如将“第i 次试验中A 出现”的事件记为A i (i = 1, 2, …, n), 则由伯努利概型知, 在n 次试验中事件A 在指定的k 次试验中出现(如在前k 次出现), 其余n - k 次试验中不出现的概率为=+)(11n k k A A A A P =+)()()()(11n k k A P A P A P A P k k k k q p p p --=-11)1(.由于n 次试验中A 出现k 次的方式很多(在前k 次出现只是其中一种方式), 其总数相当于k 个相同的质点安排在n 个位置(每个位置只能安排一个质点)上的所有可能方式, 易知共应有k n C 种方式, 而它所对应的这k n C 个事件(即“n 次试验中A 出现k 次”这一事件)是不相容的, 故由概率的可加性得()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n.例3 设由四门高射炮同时独立地向一架敌机各发射一发炮弹, 若低机被不少于两发炮弹击中时, 就被击落. 设每门高射炮击中敌机地概率为0.6, 球敌机被击落地概率.解: 所求概率为 P = 1 - P 4(0) - P 4(1) = 0.8208.例4 甲、乙两乒乓球运动员实力相等, 连赛数局, 问哪一种结果的可能性大: 赛3局甲胜2局; 赛5局甲胜3局.解: 赛3局甲胜2局 83)2(3=P ; 赛5局甲胜3局 165)3(5=P .例5 某人有两盒火柴, 用时从任一盒中取一根火柴, 经过若干时间以后发现一盒火柴已经用完, 如果最初两盒中各有n 根火柴, 求这时另一盒中还有r 根火柴的概率.解: 发现一盒火柴已经用完, 而另一盒中还有r 根火柴, 这种情况一定是在第n + (n - r) + 1= 2n - r + 1次用时发现的. 设在前2n - r 次中此人恰有n 次取了第一盒, n - r 次取了第二盒, 而在第2n - r + 1次又取了第一盒, 发现它是空的, 这一事件的概率为 21)(21⋅=-n P p r n =2121212⋅⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛--r n n n r n C =12221+--⎪⎭⎫ ⎝⎛r n n r n C 同理, 设在前2n - r 次中此人恰有n 次取了第二盒, n - r 次取了第一盒, 而在第2n - r + 1次又取了第二盒, 发现它是空的, 这一事件的概率为 122221+--⎪⎭⎫ ⎝⎛=r n n r n C p . 因此, 所求事件的概率为 r n n r n C p p P --⎪⎭⎫ ⎝⎛=+=222121.设X 表示n 重伯努利试验中事件A 发生的次数, 则X 是一个随机变量, 它的可能取值为0、1、2、…、n, 由前面的讨论, 我们有 {}k k n k n P X k C p q -==, k = 0, 1,2, …, n. (4) 显然, P{X = k} ≥ 0, k = 0, 1, 2, …, n; 0()1n k k n k n n k C p q p q -==+=∑即P{X = k}满足条件(2), 注意到k k n k n C p q -刚好是二项式n q p )(+的展开式中出现p k 的项,故我们称随机变量X 服从参数为n 、p 的二项分布, 记为X ~b (n, p).特别地, 当n = 1时, 二项分布即为(0 - 1)分布.例6 设有12台独立运转的机器, 在一小时内每台机器停机的概率为0.1, 试求在一小时内停机台数不超过2的概率.解: 设X 表示一小时内停机台数, 则X ~b (12, 0.1). 从而所求概率为P{X ≤ 2} = P{X= 0} + P{X= 1} + P{X= 2} = 0.2824 + 0.3766 + 0.2301 = 0.8891.例7 某车间有10台电机各为7.5千瓦的机床, 如果每台机床的工作情况是相互独立的, 且每台机床平均每小时开动12分钟, 问全部机床用电超过48千瓦的可能性有多少?解: 设X 表示正在工作的机床台数, 则)51,10(~b X , 用电超过48千瓦即有7台或7台以上的机床在工作, 则所求概率为377105451}7{⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=≥C X p +288105451⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛C +⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛54519910C +10101051⎪⎭⎫ ⎝⎛C 11571≈. 从此例可看出, 当n 很大时, 计算k k k n q p C k X P -==1}{是十分麻烦的.为此, 我们有泊松(Poisson)定理 设λ > 0是一个常数, n 是任意正整数, 设np n = λ , 则对于任一固定的非负整数k, 有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 证: 由n p n λ=, 有 k n k k n n k n k n n n k n n n k p p C --⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=-λλ1)1()1(!1)1( k n k n n n k n n k -⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛----⋅-⋅=λλλ11)]11()21()11(1[! . 对于任意固定的k, 当n →∞时, 有 1)]11()21()11(1[→---⋅-⋅n k n n , λλ-→⎪⎭⎫ ⎝⎛-e n n 1, 11→⎪⎭⎫ ⎝⎛--k n λ. 故有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 可见, 当n 很大, p 很小时, 二项分布就可以用下列公式来近似计算: !)1(1k e p p C k k k k n λλ--≈- (λ = np) (5) 这就是著名的二项分布的泊松逼近公式.例8 某人进行射击, 每次命中率为0.02, 独立射击400次, 求命中次数X ≥ 2的概率.解: 显然, X ~ b(400, 0.02), 则P{X ≥2} = 1 - P{X = 0} - P{X =1}9970.091)98.0()02.0()98.0()02.0(183991140040000400≈-≈--=-e C C .这个概率接近于1, 它说明, 一个事件尽管它在一次试验中发生的概率很小, 但只要试验次数很多, 而且试验是独立进行的, 那么这一事件的发生几乎是肯定的, 所以不能轻视小概率事件. 另外, 如果在400次射击中, 击中目标的次数竟不到2次, 根据实际推断原理, 我们将怀疑“每次命中率为0.02”这一假设.例9 为保证设备正常工作, 需要配备适量的维修工人(工人配备多了就浪费, 配备少了要影响生产). 现有同类型设备300台, 各台工作与否是相互独立的, 发生故障的概率都是0.01, 在通常情况下, 一台设备的故障可由一人来处理(我们也只考虑这种情况), 问至少需配备多少工人, 才能保证当设备发生故障但不能维修的概率小于0.01?解: 设需要配备N 人, 记同一时刻发生故障的设备台数为X, 则X ~ b(300, 0.01), 所要解决的问题是确定N, 使得 P{X > N} < 0.01. 由泊松定理, λ = np = 3, }{1}{N X P N X P ≤-=>=∑=-⋅-N k k k k C 0300300)99.0()01.0(1∑∑∞+=-=-=-≈1303!3!31N k k N k k k e k e < 0.01. 查表知, 满足上式的最小的N 是8, 因此需配备8个维修工人.例10 在上例中, 若由一人负责维修20台设备, 求设备发生故障而不能及时处理的概率. 若由3人共同负责维修80台呢?解: 在前一种情况, 设备发生故障而不能及时处理, 说明在同一时刻设备有2台以上发生故障. 设X 为发生故障设备的台数, 则X ~ b(20, 0.01)且n = 20, λ = 0.2, 于是, 设备发生故障而不能及时处理的概率为 }2{1)99.0()01.0(}2{2020220<-==≥-=∑X P C X P k k k k ∑=--=102020)99.0()01.0(1k k k k C 0175.0!)2.0(1102.0=-≈∑=-k k k e . 若由3人共同负责维修80台, 设同一时刻发生故障的设备台数为X, 则X ~ b(80, 0.01), λ = 0.8, 故同一时刻至少有4台设备发生故障的概率为 k k k k C X P -=∑=≥8080480)99.0()01.0(}4{0091.0!)8.0(8048.0≈≈∑=-k k k e . 计算结果表明, 后一种情况尽管任务重了(平均每人维修27台), 但工作质量不仅没有降低, 相反还提高了, 不能维修的概率变小了, 这说明, 由3人共同负责维修80台, 比由一人单独维修20台更好, 既节约了人力又提高了工作效率, 所以, 可用概率论的方法进行国民经济管理, 以便达到更有效地使用人力、物力资源的目的. 因此, 概率方法成为运筹学的一个有力工具.三、泊松分布设随机变量X 的所有可能取值为0, 1, 2, …, 而取各个值的概率为 !}{k e k X P k λλ-==, k = 0, 1, 2, … 其中λ > 0是常数, 则称X 服从参数为λ的泊松分布, 记为X ~ π (λ).易验证, P{X = k}满足条件(2).例11 有一汽车站, 每天都有大量汽车通过. 设每辆汽车在一天中的某段时间内发生事故的概率为0.0001, 而在某天的该段时间内有1000辆汽车通过, 试求发生事故的次数X < 2的概率.解: 显然X ~ b(1000, 0.0001). 因n = 1000较大, p = 0.0001较小, 故可用泊松分布来计算, λ = np = 0.1, 从而 }1{}0{}2{=+==<X P X P X P 1.01.00!11.0!0)1.0(--+=e e 9953.01.11.0≈=-e . 泊松定理指明了以n 、p(np = λ)为参数的二项分布, 当n →∞时趋于以λ为参数的泊松分布, 这一事实也显示了泊松分布在理论上的重要性.具有泊松分布的随机变量在实际中存在相当广泛. 例如, 纺纱车间大量纱锭上的纺线在一个时间间隔内被扯断的次数; 纺织厂生产的一批布匹上的疵点个数; 电话总机在一段时间内收到的呼唤次数; 种子中杂草种子的个数; 一本书某页(或某几页)上印刷错误的个数; 在一个固定时间内从某块放射物质中发射出的α粒子的数目等都服从泊松分布.泊松分布通常适用于描绘大量重复试验中稀有事件(即每次试验中出现的概率很小的事件, 例如不幸事件、意外事故、非常见病、自然灾害等)出现的次数的概率分布.第三节 随机变量的分布函数对于非离散型随机变量X, 由于其取值不能一个个列举出来, 因此在一般情况下, 需研究随机变量取值落在任意区间(x 1, x 2)中的概率, 即求 P{x 1< X ≤ x 2}. 由于事件{x 1< X ≤ x 2}与事件{X ≤ x 1}互不相容, 且{x 1< X ≤ x 2}∪{X ≤ x 1}= {X ≤ x 2}, 因此有P{x 1< X ≤ x 2} = P{X ≤ x 2} - P{X ≤ x 1}.由此可见, 若对任何给定的实数x, 事件{X ≤ x}的概率P{X ≤ x}确定的话, 概率P{x 1< X ≤ x 2}也就确定了, 但概率P{X ≤ x}随着不同的x 而变化, 这个概率是x 的函数, 于是引进下面的分布函数的概念.定义 设X 是一个随机变量, x 是任意实数, 函数 F(x) = P{X ≤ x}(1)称为分布函数.注: 1︒ F(x)是一个普通实函数, 它的定义域是整个数轴, 故求分布函数时要就x 落在整个数轴上讨论, F(x)的值域是区间[0, 1]. 如果将X 看成是数轴上的随机点的坐标, 则分布函数F(x)在x 处的函数值就表示X 落在(-∞, x ]上的概率.2︒ 由上面的讨论, 有P{x 1< X ≤ x 2}= F(x 2) - F(x 1).例1 接连进行两次射击, 以X 表示命中目标的次数, 假设已知每次射击命中目标的概率为0.4, 求X 的分布律与分布函数.解: XX 的分布函数为 ⎪⎪⎩⎨≥<≤=.2,1,21,84.0)(x x x F 一般地, 设离散型随机变量X 的分布律为 P{X = x k }= p k , k = 1, 2, …, 则X 的分布函数为∑∑≤≤===≤=x x k x x k k k p x X P x X P x F }{}{)( (2)这里和式是对所有满足x k ≤ x 的k 求和. 此外, 分布函数F(x)在x = x k (k = 1, 2, …)处有跳跃, 其跳跃值为p k = P{X = x k }.例2求X 的分布函数}2{≤X P }21{≤<X P }21{≤≤X P 例3 向区间[a, b]上均匀地投掷一随机点, 以X 表示随机点的落点坐标, 求X 的分布函数. 解: ⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 分布函数F(x)具有以下一些性质:1︒ 0 ≤ F(x) ≤ 1 (-∞ < x < +∞);2︒ F(x)是单调不减函数, 即若x 1 < x 2, 则F(x 1) ≤ F(x 2);3︒ 0)(lim )(==-∞-∞→x F F x , 1)(lim )(==+∞+∞→x F F x ; 4︒ )()(lim )0(0000x F x F x F x x ==++→ (-∞ < x 0 < +∞), 即F(x)是右连续的.第四节 连续型随机变量极其概率密度在实际问题中, 除了离散型随机变量以外, 还有非离散型随机变量, 其中常用的是连续型随机变量. 如炮弹落地点和目标之间的距离. 尽管分布函数是描述各种类型随机变量变化规律的最一般的共同形式, 但由于它不够直观, 往往不常用. 如对于离散型随机变量, 用分布律来描述既简单又直观. 对于连续型随机变量我们也希望有一种比分布函数更直观的描述方式.定义 如果对于随机变量X 的分布函数F(x), 存在非负函数f (x), 使对任意实数x, 有 ⎰∞-=x dt t f x F )()( (1) 则称X 为连续型随机变量, 其中函数f (x)称为X 的概率密度函数, 简称概率密度.概率密度f (x)在几何上表示一条曲线, 称之为分布曲线. 分布函数F(x)的几何意义是分布曲线f (x)下从-∞到x 的一块面积, 这块面积随x 而改变.可以证明: 连续型随机变量的分布函数F(x)是连续函数.易知, 概率密度f (x)具有下列性质:1︒ f (x) ≥ 0; 2︒ 1)(=⎰∞+∞-dx x f ; 3︒ P{x 1< X ≤ x 2}= F(x 2) - F(x 1) =⎰21)(x x dx x f (x 1 ≤ x 2); 4︒ 若f (x)在点x 处连续, 则有)()(x f x F ='.注: (1) 若函数f (x)满足性质1︒、2︒, 则f (x)一定是某个连续型随机变量的概率密度.(2) 对于连续型随机变量X 来说, 它取任一指定实数a 的概率为0, 即P{X = a}= 0.事实上, 设X 的分布函数为F(X), ∆x > 0, 则由{X = a}⊂ {a - ∆x < X ≤ a}得 ⎰∆+=∆--=≤<∆-≤=≤x a a dx x f x a F a F a X x a P a X P )()()(}{}{0. 又0)(lim 0=⎰∆+→∆x a a x dx x f , 所以, P{X = a}= 0. 因此 P{a < X ≤ b} = P{a < X < b} = P{a ≤ X < b} = P{a ≤ X ≤ b} = F(b) - F(a).(3) 概率为0的事件不一定是不可能事件, 同样, 概率为1的事件也不一定是必然事件.(4) 连续型随机变量X 落在小区间(x, x + ∆x) (∆x > 0)上的概率为 =∆+≤<}{x x X x P dx x f dx x f x x x )()(≈⎰∆+. 乘积f (x)dx 称为概率微分, 上式表明, 连续型随机变量X 落在小区间(x, x + ∆x)上的概率近似地等于概率微分. f (x)dx 在连续型随机变量理论中所起的作用与概率P{X = x k } = p k 在离散型随机变量理论中所起的作用是类似的. 如果把x 看成质点的坐标, f (x)看成在x 处的线密度, 则P{x 1< X ≤ x 2}=⎰21)(x x dx x f 就可看成是分布在线段x 1x 2上的质量, 这就是称f (x)为概率密度的理由.例1 确定常数A, 使x Ae x f -=)((-∞ < x < +∞)为某一随机变量的概率密度. 21 例2 设随机变量X 的概率密度为 ⎪⎩⎪⎨⎧<≤-<≤=,,0,21,2,10,)(其它x x x x x f ⎪⎪⎪⎩⎪⎪⎪⎨⎧><≤-+-<≤<=.2,1,21,122,10,2,0,0)(22x x x x x x x x F 求X 的分布函数F(x). 例3 设随机变量X 的概率密度x x e e A x f -+=)( (-∞ < x < +∞). 求 (1) 常数A; (2) 概率}3ln 210{<<X P ; (3) X 的分布函数F(x). 解: (1) 由12arctan )(===+∞∞-∞+∞-⎰A e A dx x f x π, 得 π2=A . (2) }3ln 210{<<X P =61arctan 23ln 0=x e π. (3) X 的分布函数F(x)为 x e x F arctan 2)(π= (-∞ < x < +∞). 例4 设连续型随机变量X 的分布函数为⎪⎩⎪⎨⎧><≤-+-<=,,1,,arcsin ,,0)(a x a x a a x B A a x x F 其中a > 0, 求 (1) 常数A 、B; (2) 概率}2{a X P <; (3) X 的概率密度f (x). 注: 若已知X 的概率密度f (x), 要求分布函数F(x), 用积分方法⎰∞-=x dt t f x F )()(, 当f (x)是分段函数时, 积分要分段讨论; 若已知X 的分布函数F(x), 要求概率密度f (x), 则用微分方法)()(x f x F =', 当F(x)是分段函数时, 在分段点处用导数定义求导, 当)(x F '不存在(个别点), 则可任意规定)(x F '的值(个别点的值不影响积分结果).下面介绍几个重要的连续型随机变量.一、均匀分布如果随机变量X 的取值范围是有限区间(a, b), 并且落在[a, b]中的任一小区间的概率只与这个区间的长度成正比, 而与该小区间的位置无关, 则称X 在(a, b)上服从均匀分布, 它的概率密度为 ⎪⎩⎪⎨⎧<<-=.,0,,1)(其它b x a a b x f 分布函数为⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 记为X ~ U (a, b). 例5 设随机变量X ~ U (0, 10), 求方程012=++Xx x 有实根的概率.解: ∆=042≥-X , X ≤ -2或X ≥ 2, 所以 P{X ≤ -2} + P{X ≥ 2} = 0.8.二、指数分布 如果连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧>=-.,0,0,1)(其它x e x f xθθ 其中θ > 0是常数, 则称X 服从参数为θ 指数分布, 其分布函数为⎪⎩⎪⎨⎧>-=-.,0,0,1)(其它x e x F x θ 指数分布有重要应用, 常用它来作为各种“寿命”分布的近似. 例如无线电元件的寿命、动物的寿命、电话问题中的通话时间、随机服务系统中的服务时间等都常假定服从指数分布.服从指数分布的随机变量X 具有以下有趣的性质:对于任意的s 、t > 0, 有P{X > s + t ∣X > s} = P{X > t}. 事实上 P{X > s + t ∣X > s} =}{}{}{)}(){(s X P t s X P s X P s X t s X P >+>=>>+> =}{)(1)(1t X P e e e s F t s F t s t s >===-+---+-θθθ. 此性质称为无记忆性. 如果X 是某一元件的寿命, 那么上式表明: 已知元件已使用了s 小时, 它总共能使用至少s + t 小时的条件概率, 与从开始使用时算起它至少能使用t 小时的概率相等. 这就是说, 元件对它已使用过s 小时没有记忆. 具有这一性质是指数分布有广泛应用的原因.三、正态分布 设连续型随机变量X 的概率密度为 222)(21)(σμσπ--=x e x f , (-∞ < x < +∞). 其中μ、σ (σ > 0)为常数, 则称X 服从参数为μ、σ 的正态分布或高斯(Gauss)分布, 记为X ~ N (μ、2σ). 其分布函数为 ⎰∞---=x t dt e x F 222)(21)(σμσπ (-∞ < x < +∞).可以证明, f (x)满足概率密度的两个性质. 事实上 ⎰∞+∞---dx e x 222)(21σμσπ(令σμ-=x t )= I dt e t =⎰∞+∞--2221π. 而=2I 22221⎪⎪⎪⎭⎫ ⎝⎛⎰∞+∞--dt e t π=⎰⎰∞+∞-∞+∞---⋅dy e dx e y x 22222121ππ=⎰⎰∞+∞-∞+∞-+-dxdy e y x )(212221π. 利用极坐标, 令x = rcos θ, y = rsin θ, 则 =2I ⎰⎰∞+-02021221πθπrdrd e r =1022=⎰∞+-dr re r , 由于I ≥ 0, 故有 1)(=⎰∞+∞-dx x f .正态分布的概率密度f (x)的图形称为正态曲线, 它具有以下性质:1︒ 曲线位于x 轴的上方, 以直线x = μ为对称轴, 即f (μ + x) = f (μ - x). 这表明对于任意的h > 0, 有P{μ - h < X ≤ μ}= P{μ < X ≤ μ + h}. 2︒ 当x = μ 时, 曲线处于最高点(σπμ21)(=f ), 当x < μ 时, f (x)单调增加; 当x > μ 时, f (x)单调减少, 即当x 向左右远离μ 时, 曲线逐渐降低, 整条曲线呈现“中间高, 两边低”的形状. 这表明对于同样长度的区间, 当区间离μ 越远, X 落在这个区间上的概率越小. 3︒ 在x = μ ±σ 处曲线有拐点, 并以x 轴为渐近线.4︒ 参数μ 确定了曲线的位置, σ 确定了曲线的形状. σ 越大, 曲线越平坦; σ 越小, 曲线越集中.特别地, 当μ = 0, σ = 1时, 称X 服从标准正态分布, 其概率密度和分布函数分别用ϕ(x)和Φ(x)表示, 即 2221)(x e x -=πϕ, ⎰∞--=Φx t dt e x 2221)(π.我们知道, 利用分布函数F(x)可以计算事件“X ≤ x ”的概率. 但当X ~ N (0, 1)时, 就无法用初等方法计算, 因此, 为计算方便, 人们编制了Φ(x)的函数表, 从表中可查出服从N (0, 1)的随机变量小于指定值x(x > 0)的概率P{X ≤ x} = Φ(x).因⎰⎰-∞--∞----==-Φx x t d t dt t x )()()()(ϕϕ=)(1)(1)(x dt t dt t x x Φ-=-=⎰⎰∞-∞+ϕϕ(ϕ(x)是偶函数), 所以, 当x < 0时, 只要查得Φ(-x), 即可求得Φ(x)的值.对一般的正态分布, 可利用变换σμ-=x t , 将其化成标准正态分布, 即有(){}x F x P X x μσ-⎛⎫=≤=Φ ⎪⎝⎭. 事实上, }{)(x X P x F ≤==⎰∞---x t dt e 222)(21σμσπ(令σμ-=t y )=⎰-∞--⎪⎭⎫ ⎝⎛-Φ=σμσμπx y x dy e 2221.对任意区间[x 1, x 2], 有 ⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=≤-≤=≤<σμσμ121221}{}{}{x x x X P x X P x X x P .例6 设X ~ N (0, 1), 求:(1) P{X ≤ 1.15}; 0.8749 (2) P{X ≤ -2.35}; 0.0094(3) P{0.02 < X ≤ 1.15}; 0.4821 (4) P{-1.85 < X ≤ 0.04}; 0.4838例7 设X ~ N (108, 9), 求: (1) P{101.1 < X < 117.6}; 0.9886(2) 求常数a, 使P{X < a} = 0.90; 111.84 (3) 求常数a, 使P{∣X - a ∣> a} = 0.01. 57.50例8 设),(~2σμN X , 求:(1) P{μ - σ < X < μ + σ}; 0.6826 (2) P{μ - 2σ < X < μ + 2σ}; 0.9544 (3) P{μ - 3σ < X < μ + 3σ}. 0.9974此例表明, 当时, X 以99.74%的概率落入区间(μ - 3σ , μ + 3σ)内, 即X 的可取值几乎全部在(μ - 3σ , μ + 3σ)内, 这就是统计中的3σ 原则.例9 公共汽车车门的高度是按男子与车门顶碰头的机会在0.01以下来设计的. 设男子身长X 服从μ = 170cm, σ = 6cm 的正态分布, 即)6,170(~2N X , 问车门高度应如何确定?解: 设车门高度为hcm. 按设计要求, P{X ≥ h} ≤ 0.10或P{X < h} ≥ 0.99. 因)6,170(~2N X , 故99.06170)(}{≈⎪⎭⎫ ⎝⎛-Φ==<h h F h X P , 查表得 Φ(2.33) = 0.9901 > 0.99, 所以, 33.26170=-h , h = 184cm.为了便于今后应用, 对于标准正态随机变量, 我们引入α分位点的概念.设X ~ N (0, 1), 对给定的数α, 0 < α < 1, 称满足条件 αϕαα==>⎰∞+z dx x z X P )(}{ 的数z α为标准正态分布的上(侧) α分位点(如图).对于给定的α, z α的值可这样求得; P{X > z α} = 1 - Φ( z α) = α , 从而, Φ( z α) = 1 - α , 查表可得. 如, z 0.05 = 1.645, z 0.3 = 0.52.一般地, 对随机变量X, 若对给定的数α, 0 < α < 1, 称满足条件P{X ≥ z α}= 1 - F(z α)的数z α为此概率分布的上(侧) α分位点(数).在自然现象和社会现象中, 大量随机变量服从或近似服从正态分布. 一般地, 只要某个随机变量是由大量相互独立、微小的偶然因素的总和所构成, 而且每一个别偶然因素对总和的影响都均匀地微小, 则可断定这个随机变量必近似服从正态分布.第五节 随机变量的函数的分布在微积分中, 函数y = g(x)是一个最基本的概念, 同样, 在概率论与数理统计中, 也常遇到随机变量的函数. 例如, 在测量圆轴截面面积的试验中, 所关心的随机变量−圆轴截面面积A 不能直接测量得到, 只能直接测量圆轴截面的直径d 这个随机变量, 再根据关系式 得到A, 这里随机变量A 是随机变量d 的函数.一般地, 设g(x)是定义在随机变量X 的一切可能取值x 的集合上的函数, 如果当X 取值为x 时, 随机变量Y 的取值为y = g(x), 则称Y 是随机变量X 的函数, 记为Y = g(X). 下面我们讨论如何由已知的随机变量X 的分布去求得它的函数的分布.一、X 是离散型随机变量设求 当X 取得它的某一可能值x i 时, 随机变量Y = g(X)取值y i = g(x i ) (i = 1, 2, …).如果诸i i i , 则把那些相等的值分别合并起来, 并根据概率可加性把对应的概率相加,就得到函数Y = g(X)的分布律.例求)2(-X 例求⎪⎭ ⎝=X Y 2sin 解: 因⎪⎩⎪⎨⎧-==-=-=⎪⎭⎫ ⎝⎛.34,1,2,0,14,12sin k n k n k n n π 所以, ⎪⎭⎫ ⎝⎛=X Y 2sin π只有三个可能取值: -1, 0, 1. 而取得这些值的概率分别是 152********}1{141173=+++++=-=- k Y P , 3121212121}0{2642=+++++== k Y P , 158********}1{3495=+++++==- k Y P . 所以, Y二、X 是连续型随机变量若X 是连续型随机变量. Y = g(X)是X 的函数, 则Y 也是随机变量, 这时如何求出Y = g(X)的分布呢? 先看一个例子.例3 已知),(~2σμN X , 求σμ-=X Y 的概率密度. 解: 设Y 的分布函数为F Y (y), 于是 F Y (y) = P{Y = y}=}{y X P ≤-σμ= P{X ≤ σ y + μ} = F X (σ y + μ). 其中F X (x)为X 的分布函数. 将上式两边对y 求导, 并利用概率密度是分布函数的导数的关系得 []σμσμσ⋅+='+==')()()()(y f y F y f y F y X Y Y . 再将222)(21)(σμσπ--=x e x f 代入, 有 22])[(2222121)(y y Y e e y f --+-=⋅=πσσπσμμσ, 这表明Y ~ N(0, 1).在以上推导过程中, 除去用到分布函数的定义以及分布函数和概率密度的关系之外, 还用到这样一个等式}{y X P ≤-σμ= P{X ≤ σ y + μ}. 表面上看, 只是把不等式“y X ≤-σμ”变形为“X ≤ σ y + μ”, 它们是同一个随机事件, 因而概率相等. 实质上关键在于把σμ-=X Y 的分布函数在y 的值F Y (y)转化为X 的分布函数在σ y + μ 的值F X (σ y + μ). 这样就建立了分布函数之间的关系, 然后通过求导得到Y 的概率密度. 这种方法叫做“分布函数法”, 按照上例的解题思路, 可得到下面的定理:定理 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 又设函数g (x)处处可导且有)(x g '> 0 (或恒有)(x g '< 0), 则Y = g(X)是连续型随机变量, 其概率密度为 ⎩⎨⎧<<'⋅=.,0,,)()]([)(其它βαy y h y h f y f XY 其中α = min{g(-∞), g(+∞)}, β =max{g(-∞), g(+∞)}, h(y)是g(x)的反函数.证: 对于任意x 有)(x g '> 0 (或)(x g '< 0). 因而g(x)单调增加(或单调减少), 它的反函数h(y)存在, 并且h(y)在(α,.β)内单调增加(或单调减少)且可导.设g(x)单调增加, Y 的分布函数为 ⎰∞-=≤=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F , 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '='=, g(-∞) < g(+∞), )0)((>'y h 设g(x)单调减少, Y 的分布函数为 ⎰∞+=≥=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F . 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '-='=, g(+∞) < g(-∞), )0)((<'y h 综合以上两种情形, 即得所要结论.注: 若f X (x)在有限区间[a, b]以外等于零, 则只需设在[a, b]上有> 0 (或< 0)., 此时α = min{g(a), g(b)}, β =max{g(a), g(b)}.例4 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 求线性函数Y = a + bX (a 、b 为常数, 且b ≠ 0)的概率密度.解: 因y = g(x) = bx + a, 故b a y y h x -==)(. 而b y h 1)(=', 由定理得⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(,-∞ < y < +∞. 若),(~2σμN X , 则=)(x f X 222)(21σμσπ--x e (-∞ < x < +∞), 故Y 的概率密度为 ⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(2222)(21σμσπb b a y e b ---. 因而),(~22σμb b a N Y +, 这就是说正态随机变量X 的线性函数仍服从正态分布, 只是参数不同而已.例5 设X 具有概率密度f X (x), -∞ < x < +∞, 求2X Y =的概率密度.解: 2x y =不是单调函数, 故不能用定理来求. 但可划分为两个单调区间(-∞, 0)和(0, +∞), 在这两个单调区间上它的反函数分别为y x -=与y x =. 对于y > 0, Y 的分布函数为 ⎰-=≤≤-=≤=y y X Y dx x f y X y P y Y P y F )(}{}{)( 由于02≥=X Y , 且P{Y = 0} = 0, 所以当y ≤ 0时, 其分布函数F Y (y) = 0, 于是Y 的概率密度为 ⎪⎩⎪⎨⎧≤>-+='=.0,0,0)],()([21)()(y y y f y f y y F y f X X Y Y 例如, 设X ~ N (0, 1), 其概率密度为2221)(x e x -=πϕ(-∞ < x < +∞), 则的概率密度为 ⎪⎩⎪⎨⎧≤>=⎪⎩⎪⎨⎧≤>+=----.0,0,0,21.0,0,0),2121(21)(22122y y e y y y e e y y f y y y Y πππ 称Y 服从自由度为1的分布.习 题 课一、要点与要求本章主要内容是把随机事件数量化, 使得随机事件极其概率能够用随机变量极其分布函数来表示, 以便使用微积分等数学工具研究随机现象. 这一章是本课程的重点.1︒ 求离散型随机变量X 的分布律时, 首先要确定X 的取值, 然后求出对应于各取值的事件的概率, 要注意验证∑∞===11}{n k x X P , 否则不正确.两点分布、二项分布、泊松分布是三种常用离散型随机变量的概率分布.2︒ 使用概率密度f (x)描述连续型随机变量X, f (x)满足f (x) ≥ 0, ⎰∞+∞-=1)(dx x f . 对于任意(a, b), 有 ⎰=<<b a dx x f b X a P )(}{. 均匀分布、正态分布、指数分布是三种常用连续型随机变量的分布.3︒ 可以使用分布函数统一描述离散型随机变量和连续型随机变量. 当分布函数F(x)中含有待定常数时, 常利用0)(lim =-∞→x F x , 1)(lim =+∞→x F x 或F(x + 0) = F(x)来确定该常数. 而当概率密度f (x)及分布律中含有待定常数时, 常利用⎰∞+∞-=1)(dx x f 或∑∞===11}{n k x X P 来确定该常数. 有概率密度f (x)求分布函数F(x), 要在相应的区间段把F(x)写成f (x)的变上限积分, 利用公式)()(x f x F =', 可由分布函数F(x)求概率密度f (x).离散型随机变量的分布函数为分段函数, 若随机变量X 的取值为n 个, 则要分为n + 1段, 其图形是右连续的阶梯曲线.4︒ 对正态随机变量, 我们有Φ(-x) = 1 - Φ(x). 若),(~2σμN X , 则⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=<<σμσμa b b X a P }{. 5︒ 随机变量的函数是一个重要概念. 对连续型随机变量X 的函数Y = g(X), 要了解求Y 的分布的原理和方法, 当g(x)是严格单调函数时, Y 的概率密度可使用公式计算出来.本章中的概念比第一章少, 并且多数概念容易理解, 重点是计算问题. 对离散型随机变量, 求它的分布律实质上是第一章内容的继续, 要用到第一章中的许多内容; 对连续型随机变量, 在进行各种计算时, 涉及到高等数学中的知识, 主要是定积分的计算(其中包括无穷限的广义积分), 要牢记积分的基本公式, 掌握简单的换元积分法和分部积分法, 同时要掌握简单的极限计算.二、典型例题例1 选择题1. 设F 1(x)与F 2(x)分别为随机变量X 1与X 2的分布函数, 为使F(x) = a F 1(x) - b F 2(x)是某一随机变量的分布函数, 在下列给定的各组数值中应取(98数三)( ) A (A) 52,53-==b a ; (B) 32,32==b a ; (C) 23,21=-=b a ; (D) 23,21-==b a . 2.设X 1与X 2是任意两个相互独立的连续型随机变量, 它们的概率密度分别为f 1 (x)与f 2 (x), 分布函数分别为F 1(x)与F 2(x), 则(2002数一)( ) D(A) f 1 (x) + f 2 (x)必为某一随机变量的概率密度; (B) f 1 (x) f 2 (x)必为某一随机变量的概率密度;(C) F 1(x) + F 2(x)必为某一随机变量的分布函数; (D) F 1(x) F 2(x)必为某一随机变量的分布函数.3. 设随机变量X 服从正态分布),(2σμN , 则随σ 的增大, 概率P{|X - μ| < σ}(95)( ) C(A) 单调增大; (B) 单调减小; (C) 保持不变; (D) 增减不定.4. 设随机变量X 与Y 均服从正态分布, )4,(~2μN X , )5,(~2μN Y . 记p 1 = P{X ≤ μ - 4}, p 2 = P{Y ≥ μ + 5}, 则(93)。

概率论与数理统计(茆诗松)第二章讲义(PDF)

概率论与数理统计(茆诗松)第二章讲义(PDF)

第二章 随机变量及其分布上一章研究内容: 事件(集合A )→ 概率(数).本章将用函数研究概率,函数是数与数的关系,即需要用数反映事件——随机变量.事件(数)→ 概率(数).§2.1 随机变量及其分布2.1.1.随机变量的概念随机试验的样本点有些是定量的:如掷骰子掷出的点数,电子元件使用寿命的小时数.有些是定性的:如掷硬币正面或反面,检查产品合格或不合格.对于定性的结果也可以规定其数量性质:如掷硬币,正面记为1,反面记为0;检查产品,合格记为1,不合格记为0.随机试验中,可将每一个样本点ω 都对应于一个实数X (ω),称为随机变量(Random Variable ),常用大写英文字母X , Y , Z 等表示随机变量,而随机变量的具体取值通常记为小写英文字母x , y , z .对于随机变量首先应掌握它的全部可能取值:如掷硬币,⎩⎨⎧=反面正面,0,1X ,X 的全部可能取值为0, 1;掷两枚骰子,X 表示掷出的点数之和,X 的全部可能取值为2, 3, 4, … , 12 ;观察某商店一小时内的进店人数X ,X 的全部可能取值为0, 1, 2, … ;电子元件使用寿命,用X 表示使用的小时数,X 的全部可能取值为 ),0[∞+; 一场足球比赛(90分钟),用X 表示首次进球时间(分钟),若为0:0,记X = 100,X 的全部可能取值为 (0, 90 )∪{100};注意:1. 每个样本点都必须对应于一个实数,2.不同样本点可以对应于同一个实数,3.随机变量的每一取值或取值范围都表示一个事件.应掌握将随机变量的取值或取值范围描述为事件,又能将事件用随机变量表达的方法. 例 掷一枚骰子,用X 表示出现的点数,则 X = 1表示出现1点;X > 4表示点数大于4,即出现5点或6点;X ≤ 0为不可能事件.又出现奇数点,即X = 1, 3, 5;点数不超过3,即X ≤ 3. 例 X 表示商店一天中某商品的销售件数(顾客的需求件数), 则 X = 0表示没有销售;X ≤ 10表示销售不超过10件.又销售5件以上(不含5件)即X > 5;若该商店准备了a 件该商品,事件“能满足顾客需要”,即X ≤ a . 例 X 表示一只电子元件的使用寿命(小时), 则 X = 1000表示该元件恰好使用了1000小时,X ≥ 800表示该元件使用寿命在800小时以上. 例 90分钟足球比赛,X 表示首次进球时间(分钟),且0:0时,记X = 100, 则 X = 10表示上半场第10分钟首次进球.又上半场不进球即X > 45;开场1分钟内进球即X ≤ 1.如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.(注:可列个即可以排成一列,一个一个往下数,如非负整数0, 1, 2, 3, … )离散型随机变量的全部可能取值是实数轴上一些离散的点,而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并,如电子元件使用寿命X (小时),全部可能取值是),0[∞+.下面按离散型和连续型分别进行讨论.2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率.定义 如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.设离散型随机变量X 的全部可能取值为x 1, x 2, …, x k , …,则X 取值x k 的概率p k = p (x k ) = P {X = x k }, k = 1, 2, …… 称为离散型随机变量的概率分布函数(Probability Distribution Function ,PDF ),简称概率分布或概率函数.直观上,又写为L LLL)()()(2121k kx p x p x p Px x x X 或 ⎟⎟⎠⎞⎜⎜⎝⎛L L L L)()()(~2121k k x p x p x p x x x X , 称为X 的概率分布列.如掷一枚骰子,X 表示出现的点数,X 的分布列为616161616161654321PX . 概率函数基本性质:(1)非负性 p (x k ) ≥ 0 , k = 1, 2, ……; (2)正则性1)(1=∑∞=k kxp .这是因为事件X = x 1 , X = x 2 , … , X = x k , … 是一个完备事件组, 故P {X = x 1} + P {X = x 2} + … + P {X = x k } + … = P (Ω) = 1,即p (x 1) + p (x 2) + … + p (x k ) + … = 1. 例 设盒中有2个红球3个白球,从中任取3球,以X 表示取得的红球数.求X 的分布列. 解:X 的全部可能取值0, 1, 2 ,样本点总数为1035=⎟⎟⎠⎞⎜⎜⎝⎛=n ,X = 0表示“取到3个白球”,所含样本点个数为1330=⎟⎟⎠⎞⎜⎜⎝⎛=k ,有1.0101)0(==p , X = 1表示“取到1个红球2个白球”,所含样本点个数为612231=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有6.0106)1(==p , X = 2表示“取到2个红球1个白球”,所含样本点个数为322132=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有3.0103)2(==p . 故X 的分布列为3.06.01.0210P X.求离散型随机变量X 的概率分布步骤: (1)找出X 的全部可能取值,(2)将X 的每一取值表示为事件, (3)求出X 的每一取值的概率.例 现有10件产品,其中有3件不合格.若不放回抽取,每次取一件,直到取得合格品为止.用X 表示抽取次数,求X 的概率分布. 解:X 的全部可能取值1, 2, 3, 4 ,X = 1表示“第1次就取得合格品”,有107)1(=p , X = 2表示“第2次取得合格品且第1次是不合格品”,有30797103)2(=⋅=p , X = 3表示“第3次取得合格品且前两次是不合格品”,有12078792103)3(=⋅⋅=p , X = 4表示“第4次取得合格品且前三次是不合格品”,有1201778192103)4(=⋅⋅⋅=p , 故X 的分布列为120112073071074321PX . 例 上例若改为有放回地抽取,又如何? 解:X 的全部可能取值1 , 2 , … , n , … ,7.0107)1(==p ,21.0107103)2(=⋅=p ,7.03.0)3(2×=p ,…,7.03.0)(1×=−k k p ,…, 故X 的概率函数为L ,2,1,7.03.0)(1=×=−k k p k ;X 的分布列为LL L L 7.03.07.03.021.07.032112××−k PkX .例 若离散型随机变量的概率函数为kCk p =)(,k = 1, 2, 3, 4,且C 为常数. 求:(1)C 的值,(2)P {X = 3},(3)P {X < 3}.解:(1)由正则性知:1432)4()3()2()1(=+++=+++CC C C p p p p ,即11225=C ,故2512=C .(2)254)3(}3{===p X P , (3)25182562512)2()1(}3{=+=+=<p p X P . 2.1.3.随机变量的分布函数连续型随机变量在单个点取值概率为零,如电子元件使用寿命恰好为1000小时这个事件的概率就等于零,因此连续型随机变量不能考虑概率函数.为了用单独一个变量表示一个区间,特别地取区间 (−∞, x ].定义 随机变量X 与任意实数x ,称F (x ) = P {X ≤ x },−∞ < x < +∞为X 的累积分布函数(Cumulative Distribution Function ,CDF ),简称分布函数.P {a < X ≤ b } = P {X ≤ b } − P {X ≤ a } = F (b ) − F (a ),P {X > a } = 1 − P {X ≤ a } = 1 − F (a ),由概率的连续性知)0()(lim }{lim }{−==≤=<−−→→a F x F x X P a X P ax ax ,且P {X = a } = P {X ≤ a } − P {X < a } = F (a ) − F (a – 0),可见X 在任一区间上或任一点取值的概率都可用分布函数表示. 例 已知随机变量X 的分布列为3.05.02.0210PX ,求X 的分布函数.解:X 的全部可能取值为0, 1, 2,当x < 0时,F (x ) = P {X ≤ x } = P (∅) = 0, 当0 ≤ x < 1时,F (x ) = P {X ≤ x } = p (0) = 0.2,当1 ≤ x < 2时,F (x ) = P {X ≤ x } = p (0) + p (1) = 0.7, 当x ≥ 2时,F (x ) = P {X ≤ x } = P (Ω ) = 1,故⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.2,1,21,7.0,10,2.0,0,0)(x x x x x F若离散型随机变量的全部可能取值为x 1, x 2, ……,概率函数p (x k ) = p k ,k = 1, 2, ……,则分布函数∑≤=≤=xx kk xp x X P x F )(}{)(.且离散型随机变量的分布函数F (x )是单调不减的阶梯形函数,X 的每一可能取值x k 是F (x )的跳跃点,跳跃高度是相应概率p (x k ).例 已知某离散型随机变量X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤−−<=,5,1,52,6.0,20,4.0,01,3.01,0)(x x x x x x F 求X 的分布列. 解:X 的全部可能取值是F (x )的跳跃点,即 −1, 0, 2, 5,跳跃高度依次为:p (−1) = 0.3 − 0 = 0.3; p (0) = 0.4 − 0.3 = 0.1; p (2) = 0.6 − 0.4 = 0.2; p (5) = 1 − 0.6 = 0.4.故X 的分布列为4.02.01.03.05201PX −.分布函数的基本性质:(1)单调性,F (x ) 单调不减,即x 1 < x 2时,F (x 1) ≤ F (x 2); (2)正则性,F (−∞) = 0,F (+∞) = 1;(3)连续性,F (x ) 右连续,即)()(lim 00x F x F x x =+→. 证:(1)当x 1 < x 2时,{X ≤ x 1} ⊂ {X ≤ x 2},有F (x 1) ≤ F (x 2);(2)F (−∞) = P {X < −∞} = P (∅) = 0,F (+∞) = P {X < +∞} = P (Ω ) = 1;(3)任取单调下降且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n ≤=≤=≤∞=∞→I ,根据概率的连续性知}{}{}{lim 01x X P x X P x X P n n n n ≤=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→I ,即)()(lim 00x F x F x x =+→. 但F (x )不一定左连续,任取单调增加且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n <=≤=≤∞=∞→U ,得}{}{}{lim 01x X P x X P x X P n n n n <=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→U , 故}{)(}{)(lim 0000x X P x F x X P x F x x =−=<=−→.2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点,连续型随机变量的全部可能取值是实数区间.但连续型随机变量在单独一个点取值的概率为0,其概率函数无实际意义,对于连续随机变量通常考虑其在某个区间上取值的概率,这就需要讨论分布函数.连续型随机变量的分布函数是连续函数. 注意:概率为0的事件不一定是不可能事件.定义 随机变量X 的分布函数F (x ),若存在函数p (x ),使 ∫∞−=xdu u p x F )()(,则称X 为连续型随机变量,p(x )为X 的概率密度函数(可以理解为:p (u )为概率密度,p (u )du 为X 在该小区间内取值的概率,∫∞−x 为从−∞ 到x 无限求和.几何意义:在平面上作出密度函数p (x )的图形,则阴影部分的面积即为F (x )的值.密度函数基本性质:(1)非负性 p (x ) ≥ 0;(2)正则性 1)(=∫∞+∞−dx x p .因)()(x F du u p x =∫∞−,有1)()(=+∞=∫∞+∞−F dx x p .连续型随机变量的性质:设连续型随机变量X 的概率密度函数为p (x ),分布函数为F (x ),则有 (1)∫=−=≤<21)()()(}{1221x x dx x p x F x F x X x P ;(2)当p (x ) 连续时,p (x ) = F ′(x ); 因∫∞−=x du u p x F )()(,当p (x ) 连续时,有)(])([)(x p du u p x F x=′=′∫∞−(3)X 在单独一个点取值的概率为0,其分布函数为连续函数;(4)P {x 1 < X ≤ x 2} = P {x 1 ≤ X ≤ x 2} = P {x 1 < X < x 2} = P {x 1 ≤ X < x 2},即连续型...随机变量在某区间内的概率与区间开闭无关,离散型则不成立;(5)只在有限个点上取值不相同的密度函数对应于同一个分布函数,一般,只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数.例 设F (x ) = A + B arctan x 为某连续型随机变量X 的分布函数. 求:(1)A , B ; (2)}31{≤≤−X P ; (3)密度函数p (x ). 解:(1)由正则性 F (−∞) = 0,F (+∞) = 1,得:02π)arctan (lim =−=+−∞→B A x B A x ,12π)arctan (lim =+=++∞→B A x B A x ,故21=A ,π1=B ;(2)x x F arctan π121)(+=,得1274ππ1213ππ121)1()3(}31{=⎥⎦⎤⎢⎣⎡⎟⎠⎞⎜⎝⎛−⋅+−⎟⎠⎞⎜⎝⎛⋅+=−−=≤≤−F F X P . (3)密度函数)1π(1)()(2x x F x p +=′=.例 已知⎩⎨⎧<<−=,,0,10),()(32其它x x x C x p是某连续型随机变量X 的密度函数,求:(1)C , (2)}211{<<−X P , (3)分布函数F (x ).解:(1)由正则性:1)(=∫∞+∞−dx x p ,得1120)4131()43()(10431032==−−=−=−∫C C x x C dx x x C ,故C = 12;(2)165)641241(12)43(12)(12)(}211{2104321032211=−=−=−==<<−∫∫−x x dx x x dx x p X P ;(3)X 的全部可能取值为 [0, 1],分段点0, 1,当x < 0时,0)()(==∫∞−xdu u p x F ,当0 ≤ x < 1时,4304303234)43(12)(12)()(x x u u du u u du u p x F xxx−=−=−==∫∫∞−,当x ≥ 1时, 1)(12)()(132=−==∫∫∞−du u u du u p x F x,故⎪⎩⎪⎨⎧≥<≤−<=.1,1,10,34,0,0)(43x x x x x x F例 已知⎩⎨⎧<<−=,,0,11|,|)(其它x x x p是某连续型随机变量X 的密度函数,求分布函数F (x ).解:分段点−1, 0, 1,当x < −1时,0)()(==∫∞−xdu u p x F ;当−1 ≤ x < 0时, 212122)()()(22121x x u du u du u p x F xxx−=+−=−=−==−−∞−∫∫; 当0 ≤ x < 1时,21221022)()()(220212001x x u u udu du u du u p x F xxx+=++=+−=+−==−−∞−∫∫∫;当x ≥ 1时, 1)()()(101=+−==∫∫∫−∞−udu du u du u p x F x.故⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤+<≤−−<=.1,1,10,21,01,21,0,0)(22x x x x xx x F§2.2 随机变量的数学期望对于随机变量,还应当掌握反映其平均值、分散程度等的指标,这就需要引入数学期望和方差等概念. 2.2.1.数学期望的概念例 甲、乙两个射击选手,在射击训练中甲射了10次,其中3次10环,1次9环,4次8环,2次7环;乙射了15次,其中2次10环,9次9环,2次8环,2次7环.问谁的表现更好? 分析:比较他们射中的平均环数甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环,平均每次射中5.81085=环; 乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环,平均每次射中73.815131=&环. 故乙的表现更好.一般地,若在n 次试验中,出现了m 1次x 1,m 2次x 2,…,m k 次x k ,(其中m 1 + m 2 + … + m k = n ),则平均值为∑==+++ki i i k k n mx n x m x m x m 12211L ,即平均值等于取值与频率乘积之和.因n 很大时,频率稳定在概率附近,即平均值将稳定在取值与概率乘积之和附近. 2.2.2.数学期望的定义定义 设离散型随机变量X 的分布列是⎟⎟⎠⎞⎜⎜⎝⎛L L L L )()()(~2121k kx p x p x p x x x X ,如果级数∑∞=1)(k k k x p x 绝对收敛,则称之为X 的数学期望(Expectation ),记为E (X ). 数学期望的实际意义是反映随机变量的平均取值,是其全部可能取值以相应概率为权数的加权平均.如X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−2.04.01.03.04102,则E (X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6. 例 某人有4发子弹,现在他向某一目标射击,若命中目标就停止射击,否则直到子弹用完为止.设每发子弹命中率为0.4,以X 表示射击次数,求E (X ). 解:先求X 的分布列,X 的全部可能取值为1, 2, 3, 4,X = 1,第一枪就命中, p (1) = 0.4;X = 2,第一枪没有命中,第二枪命中,p (2) = 0.6 × 0.4 = 0.24; X = 3,前两枪没有命中,第三枪命中,p (3) = 0.6 2 × 0.4 = 0.144; X = 4,前三枪没有命中, p (4) = 0.6 3 = 0.216.则X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛216.0144.024.04.04321,故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176.例 若X 的概率函数为L ,2,1,21)2(==⎟⎟⎠⎞⎜⎜⎝⎛−k kp k k,求E (X ). 解:因∑∑∞=∞=−=⋅−11)1(21)2(k kk k k k k 收敛但不是绝对收敛,故E (X ) 不存在.离散型随机变量的数学期望是取值乘概率求和:∑∞=1)(k k k x p x ,类似可定义连续型随机变量的数学期望是取值乘密度积分:∫+∞∞−dx x xp )(.定义 设连续型随机变量X 的密度函数为p (x ).如果广义积分∫+∞∞−dx x xp )(绝对收敛,则称之为X 的数学期望,记为E (X ).例 已知连续型随机变量X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其它x x x p 求E (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xp X E . 例 已知X 的密度函数为⎩⎨⎧<<+=.,0,20,)(其它x bx a x p 且32)(=X E ,求a , b . 解:由正则性得122)2()()(2220=+=⋅+=+=∫∫∞+∞−b a x b ax dx bx a dx x p ,又32382)32()()()(20322=+=⋅+⋅=+==∫∫∞+∞−b a x b x a dx bx a x dx x xp X E ,故21,1−==b a . 例 已知X 的密度函数为+∞<<∞−+=x x x p ,)1π(1)(2,求E (X ).解:因+∞∞−+∞∞−+∞∞−+∞∞−+=⋅+=+=∫∫∫)1ln(π21)(21)1π(1)1π()(2222x x d x dx x x dx x xp 发散, 故E (X )不存在. 2.2.3.数学期望的性质设X 为随机变量,g (x ) 为函数,则称Y = g (X ) 为随机变量函数,Y 也是一个随机变量.下面不加证明地给出随机变量函数的数学期望计算公式.定理 设X 为随机变量,Y = g (X ) 为随机变量函数,则(1)若X 为离散型随机变量,概率函数为p(x k ), k = 1, 2, …,则∑∞===1)()()]([)(k k k x p x g X g E Y E ;(2)若X 为连续型随机变量,密度函数为p (x ),则∫+∞∞−==dx x p x g X g E Y E )()()]([)(.数学期望具有以下性质:(1)常数的期望等于其自身,即E (c ) = c ;(2)常数因子可移到期望符号外,即E (aX ) = a E (X );(3)随机变量和的期望等于期望的和,即E [g 1 (X ) + g 2 (X )] = E [g 1 (X )] + E [g 2 (X )]. 证明:(1)将常数c 看作是单点分布p (c ) = 1,故E (c ) = c p (c ) = c ;(2)以连续型为例加以证明,)()()()(X aE dx x xp a dx x axp aX E ===∫∫+∞∞−+∞∞−;(3)以连续型为例加以证明,∫∫∫+∞∞−+∞∞−+∞∞−+=+=+dx x p x g dx x p x g dx x p x g x g X g X g E )()()()()()]()([)]()([212121= E [g 1 (X )] + E [g 2 (X )].由性质(2)、(3)知随机变量线性组合的期望等于期望的线性组合,可见数学期望具有线性性质. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−3.04.01.02.02101, 求E (2X +1),E (X 2).解:E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6;E (X 2) = 1 × 0.2 + 0 × 0.1 + 1 × 0.4 + 4 × 0.3 = 1.8. 例 已知圆的半径X 是一个随机变量,密度函数为⎪⎩⎪⎨⎧<<=.,0,31,21)(其他x x p 求圆面积Y 的数学期望. 解:圆面积Y = π X 2,故3π1332π21π)(π)(3133122=⋅=⋅==∫∫∞+∞−xdx x dx x p x Y E . 例 设国际市场对我国某种出口商品的需求量X (吨)的密度函数为⎪⎩⎪⎨⎧<<=.,0,40002000,20001)(其他x x p 设每售出一吨,可获利3万美元,但若销售不出,每积压一吨将亏损1万美元,问如何计划年出口量,能使国家获利的期望最大.解:设计划年出口量为a 吨,每年获利Y 万美元.当X ≥ a 时,销售a 吨,获利3a 万美元;当X < a 时,销售X 吨,积压a − X 吨,获利3X − (a − X ) = 4X − a 万美元;即⎩⎨⎧<≤−≤≤==.2000,4,4000,3)(a X a X X a a X g Y则4000200024000200020003)2(2000120001320001)4()()()(aa a a x a ax x dx a dx a x dx x p x g Y E +−=⋅+⋅−==∫∫∫+∞∞− 8250)3500(10001400071000122+−−=−+−=a a a , 故计划年出口量为3500吨时,使国家获利的期望最大.§2.3 随机变量的方差与标准差数学期望反映平均值,方差反映波动程度.如甲、乙两台包装机,要求包装重量为每袋500克,现各取5袋,重量为甲:498,499,500,501,502; 乙:490,495,500,505,510.二者平均值相同都是500克,但显然甲比乙好.此时比较的是它们的偏差(即取值与平均值之差).偏差:甲:−2,−1,0,1,2;乙:−10,−5,0,5,10. 2.3.1.方差的定义定义 随机变量X 与其数学期望E (X ) 之差X − E (X ) 称为偏差.偏差有大有小,可正可负,比较时需要去掉符号,但绝对值函数进行微积分处理不方便,因此考虑偏差平方的数学期望.定义 随机变量X ,若E [X − E (X )]2存在,则称之为X 的方差(Variance ),记为Var (X ) 或D (X ).即Var (X ) = E [X − E (X )]2.显然方差Var (X ) ≥ 0,称)Var(X 为X 的标准差(Standard Deviation ).在实际问题中,标准差与随机变量有相同的量纲.方差与标准差反映波动程度.方差越大,取值越分散;方差越小,取值越集中. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求E (X ), Var (X ).解:E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2;Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p求E (X ), Var (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xf X E ; 181949821949842)98382()()32()Var(1023410232=+−=⎟⎠⎞⎜⎝⎛+−=+−=−=∫∫∞+∞−x x x dx x x x dx x p x X .例 已知X 的全部可能取值为0, 1, 2,且E (X ) = 1.3,Var (X ) = 0.81.求X 的分布列.解:设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛c b a 210,由正则性得:a + b + c = 1,且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3,Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81, 解得a = 0.3,b = 0.1,c = 0.6,故X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛6.01.03.0210.2.3.2. 方差的性质方差具有以下性质:(1)方差计算公式:Var (X ) = E (X 2) − [E (X )]2; (2)常数的方差等于零,即Var (c ) = 0;(3)设a , b 为常数,则Var (a X + b ) = a 2 Var (X ). 证:(1)Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2.= E (X 2) − [E (X )]2;(2)Var (c ) = E [c − E (c )]2 = E (c − c )2 = E (0) = 0;(3)Var (a X + b ) = E [(a X + b ) − E (a X + b )]2 = E [a X + b − a E (X ) − b ]2 = a 2 E [X − E (X )]2 = a 2 Var (X ). 由性质(1),显然有以下推论:推论 对于随机变量X ,如果E (X 2) 存在,则E (X 2) ≥ [E (X )]2.以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差.通常用公式计算比直接用定义计算方差要方便. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求Var (X ).解:前面已求得E (X ) = 2.2,因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4, 故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p 求Var (X ).解:前面已求得32)(=X E , 因21422)(141022=⋅=⋅=∫x xdx x X E , 故1813221)]([)()Var(222=⎟⎠⎞⎜⎝⎛−=−=X E X E X . 对于随机变量X ,若方差Var (X ) 存在,且Var (X ) > 0.令)Var()(*X X E X X −=,有0)]()([)Var(1)]([)Var(1)Var()(*)(=−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=X E X E X X E X E X X X E X E X E ; 1)Var()Var(1)](Var[)Var(1)Var()(Var *)Var(==−=⎟⎟⎠⎞⎜⎜⎝⎛−=X X X E X X X X E X X .称X *为X 的标准化随机变量.2.3.3. 切比雪夫不等式方差反映随机变量的分散程度,切比雪夫不等式给出其定量标准.切比雪夫不等式表明大偏差概率的上限与方差成正比.定理 设X 为随机变量,且方差Var (X ) 存在,则对于任何正数ε ,都有2)Var(}|)({|εεX X E X P ≤≥−.证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫≥−=≥−εε|)(|)(}|)({|X E x dx x p X E X P ,且∫∞+∞−−=−=dx x p X E x X E X E X )()]([)]([1)Var(22222εεε,故222|)(|22)Var()()]([)()]([}|)({|εεεεεX dx x p X E x dx x p X E x X E X P X E x =−≤−≤≥−∫∫∞+∞−≥−,得证.注:切比雪夫不等式的等价形式2)Var(1}|)({|εεX X E X P −≥<−.如随机变量X 的数学期望为E (X ) = 10,方差Var (X ) = 1,则由切比雪夫不等式可得43211}2|10{|}128{2=−≥<−=<<X P X P . 例 设随机变量X 的全部可能取值为),0[∞+,且数学期望E (X ) 存在,试证:对任何正数a ,都有)(1}{X E aa X P ≤≥. 证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫+∞=≥a dx x p a X P )(}{,且∫∫+∞+∞∞−==0)()(1)(1dx x p a x dx x xp a X E a ,故)(1)()(}{0X E adx x p a x dx x p a x a X P a =≤≤≥∫∫+∞+∞,得证.定理 设随机变量X 的方差存在,则Var (X ) = 0的充分必要条件是存在常数b ,使得X 几乎处处收敛于b ,即P {X = b } = 1.证:充分性,设存在常数b ,使得P {X = b } = 1,有P {X ≠ b } = 0,即E (X ) = b P {X = b } = b ,故Var (X ) = E [X − E (X )]2 = E (X − b )2 = 0 × P {X = b } = 0; 必要性,设X 的方差Var (X ) = 0,因事件U +∞=+∞→⎭⎫⎩⎨⎧≥−=⎭⎬⎫⎩⎨⎧≥−=>−11|)(|lim 1|)(|}0|)({|n n n X E X n X E X X E X ,则01)Var(lim 1|)(|lim 1|)(|}0|)({|21=⎟⎠⎞⎜⎝⎛≤⎭⎬⎫⎩⎨⎧≥−=⎟⎟⎠⎞⎜⎜⎝⎛⎭⎬⎫⎩⎨⎧≥−=>−+∞→+∞→+∞=n X n X E X P n X E X P X E X P n n n U , 可得P {| X − E (X )| > 0} = 0,即P {| X − E (X )| = 0} = 1,取b = E (X ),有b 为常数, 故P {X = b } = 1.注:如果P {X = b } = 1,记为X = b , a.e.(或a.s.),称为X = b 几乎处处成立(或几乎必然成立).这里,a.e.就是almost everywhere 的缩写,a.s.就是almost surely 的缩写.意味着不成立的情况是一个测度(或概率)等于零的集合(或事件).§2.4 常用离散分布对于一个给定的函数,只要满足概率函数的两条基本性质:非负性、正则性,都可以成为某个离散随机变量的概率函数.但绝大多数在实际工作中并不常见,下面是几种常用的概率函数. 2.4.1.两点分布与二项分布一.两点分布两点分布只可能在两个点取值,通常就是0或1.定义 随机变量的可能取值只有两个:0或1,且概率函数为p (0) = 1 − p ,p (1) = p , 其中0 < p < 1,称X 服从两点分布(Two-point Distribution )或0-1分布,记为X ~ (0-1).分布列为⎟⎟⎠⎞⎜⎜⎝⎛−p p110. 两点分布实际背景是一次伯努利试验.通常描述为:X 表示一次伯努利试验中事件A 发生的次数.非负性:p (0) = 1 − p > 0,p (1) = p > 0; 正则性:(1 − p ) + p = 1. 两点分布的数学期望为E (X ) = 0 × (1 − p ) + 1 × p = p .又因E (X 2 ) = 02 × (1 − p ) + 12 × p = p ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p ).二.二项分布在n 重伯努利试验中,以X 表示事件A 的发生次数,则X 的全部可能取值为0, 1, 2, …, n ,且kn k p p k n k X P −−⎟⎟⎠⎞⎜⎜⎝⎛==)1(}{. 定义 若离散型随机变量X 的概率函数为kn k p p k n k p −−⎟⎟⎠⎞⎜⎜⎝⎛=)1()(, k = 0, 1, 2, …, n ;0 < p < 1, 则称X 服从二项分布(Binomial Distribution ),记为X ~ b (n , p ).二项分布的实际背景是n 重伯努利试验. 当n = 1时,二项分布就是两点分布.非负性:0)1()(>−⎟⎟⎠⎞⎜⎜⎝⎛=−kn k p p k n k p ; 正则性:1)]1([)1()(11=−+=−⎟⎟⎠⎞⎜⎜⎝⎛=∑∑=−=nnk k n k nk p p p p k n k p . 例 掷三枚硬币,X 表示正面朝上的次数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3 ,将掷每一枚硬币看作一次试验.每次试验两种结果:正面A ,反面A ;每次试验相互独立;每次试验概率5.0)(=A P . 即n 重伯努利试验,n = 3,5.0=p ,有X ~ b (3, 0.5),p (0) = 0.5 3 = 0.125,375.05.05.013)1(21=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 375.05.05.023)2(12=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (3) = 0.5 3 = 0.125.例 现有5台机床,每台机床一小时内平均开动18分钟,且是否开动相互独立,以X 表示同一时刻开动的机床数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3, 4, 5 ,将每台机床是否开动看作一次试验.每次试验两种结果:开动A ,不开动A ;每次试验相互独立;每次试验概率P (A ) = 0.3. 即n 重伯努利试验,n = 5,p = 0.3,有X ~ b (5, 0.3).p (0) = 0.7 5 = 0.16807,36015.07.03.015)1(41=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 3087.07.03.025)2(32=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 1323.07.03.035)3(23=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 02835.07.03.045)4(14=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (5) = 0.3 5 = 0.00243 .一般地,如果随机变量X 服从二项分布,概率函数值p (k ) 将随着k 的增加,先逐渐增加,达到最大值后,又逐渐减少.通常,一个随机变量X 的概率函数或密度函数的最大值点称为X 的最可能值.二项分布b (n , p )的最可能值为⎩⎨⎧+−++++=.)1(,1)1()1(,)1(],)1[(0是正整数时当或不是正整数时当p n p n p n p n p n k 这里[x ]表示不超过x 的最大整数.如[2.3] = 2,[3.14] = 3,[−1.2] = −2.证:若X ~ b (n , p ),有n k p p k n k n p p k n k p k n k kn k ≤≤−−=−⎟⎟⎠⎞⎜⎜⎝⎛=−−0,)1()!(!!)1()(, 则11)1()!1()!1(!)1()!(!!)1()(+−−−−+−−−−−=−−k n k k n k p p k n k n p p k n k n k p k p ⎟⎠⎞⎜⎝⎛+−−−⋅−−−=−−11)1()!()!1(!1k n p k pp p k n k n k n k)1()1()1()!()!1(!1+−−+⋅−−−=−−k n k k p n p p k n k n k n k , 当k < (n + 1) p 时,有p (k ) > p (k − 1);当k > (n + 1) p 时,有p (k ) < p (k − 1).如果(n + 1) p 不是正整数,取k 0 = [(n + 1) p ],有k 0 < (n + 1) p ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > (n + 1) p ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果(n + 1) p 是正整数,取k 0 = (n + 1) p ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值.如X ~ B (3, 0.5),有(n + 1) p = 4 × 0.5 = 2是正整数,最可能值k 0 = 2或1;X ~ B (5, 0.3),有(n + 1) p = 6 × 0.3 = 1.8不是正整数,最可能值k 0 = [1.8] = 1.三.二项分布的数学期望和方差组合数公式⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=−⋅−−⋅=−⋅=⎟⎟⎠⎞⎜⎜⎝⎛11)!()!1()!1()!(!!k n k n k n k n k n k n k n k n , (n ≥ k > 0). 二项分布b (n , p )的数学期望为∑∑∑=−−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅⋅=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k kn k nk k n k p p k n np p p k n k n k p p k n k X E 1110)1(11)1(11)1()( = np [ p + (1 − p )]n − 1 = np .又因∑∑∑=−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k k n k nk k n k p p k n k p p k n k k p p k n k X E 002022)1()1(11)()1()( )()1(22)1()1()(22X E p p k n k k n n k k nk k n k+−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=∑=− np p p k n pn n nk kn k +−⎟⎟⎠⎞⎜⎜⎝⎛−−−=∑=−−222)1(22)1( = n (n − 1) p 2 [ p + (1 − p )]n − 2 + np = (n 2 − n ) p 2 + np ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n 2 − n ) p 2 + np − (np )2 = − np 2 + np = np (1 − p ).2.4.2.泊松分布一.泊松分布泊松分布是一种理论推导的极限分布(成立的条件和推导过程见附录). 定义 若随机变量X 的概率函数为λλ−=e !)(k k p k, k = 0, 1, 2, …… ;λ > 0,则称X 服从参数为 λ 的泊松分布(Poisson’s Distribution ),记为X ~ P (λ).泊松分布的实际背景是已知平均发生次数为常数λ ,实际发生次数的概率分布.如足球比赛进球数,商店进店人数,电话接听次数等.非负性:λ > 0时,0e !>−λλk k;正则性:1e e e !=⋅=⋅−∞=−∑λλλλk kk .例 已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布,求比分为0:0, 1:0以及总进球数超过5个的概率.解:因X ~ P(2.5),则3.2e !3.2)(−=k k p k , k = 0, 1, 2, …….比分0:0,即X = 0,100.0e e !03.2)0(3.23.20===−−p (查表);比分1:0,即X = 1,231.0100.0331.0e 3.2e !13.2)1(3.23.21=−===−−p (查表);总进球数超过5个,即X > 5,030.0970.01e !3.21e!3.2}5{53.263.2=−=−==>∑∑=−∞=−k k k k k k X P (查表). 例 已知某公用电话每小时内打电话的人数X 服从参数为λ = 8的泊松分布.求某一小时内无人打电话的概率,恰有10人打电话的概率,至少有10人打电话的概率.解:因X ~ P(8),有8e !8}{−==k k X P k . 无人打电话的概率0003.0e e !08}0{880====−−X P ,恰有10人打电话的概率099.0717.0816.0e !108}10{810=−===−X P (查表),至少有10人打电话的概率283.0717.01}9{1e !8}10{108=−=≤−==≥∑∞=−X P k X P k k (查表). 例 已知某商店一天中某种贵重商品的销售件数X 服从泊松分布P (7),问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要?解:设准备了a 件该商品,X ~ P(7),则7e !7)(−=k k p k .事件“满足顾客需要”,即X ≤ a ,有P {X ≤ a } ≥ 0.999,故查表可得a = 16. 泊松分布P (λ )的最可能值为⎩⎨⎧−=.,1,],[0是正整数时当或不是正整数时当λλλλλk 证:若X ~ P(λ),有L ,2,1,0,e !)(==−k k k p kλλ,故k k k k k k k k p k p k k k k−⋅−=⎟⎠⎞⎜⎝⎛−⋅−=−−=−−−−−−−−−λλλλλλλλλλe )!1(1e )!1(e)!1(e !)1()(111,当k < λ 时,有p (k ) > p (k − 1);当k > λ 时,有p (k ) < p (k − 1).如果λ 不是正整数,取k 0 = [λ ] ,有k 0 < λ ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > λ ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果λ 是正整数,取k 0 = λ ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值. 二.泊松分布的数学期望和方差泊松分布P (λ )的数学期望为λλλλλλλλλλλ=⋅=−⋅=−=⋅=−∞=−−∞=−∞=−∑∑∑e e )!1(e e)!1(e!)(111k k k kk kk k k k X E ,即泊松分布的参数 λ 反映平均发生次数.又因)()!2(e e!e!)(e!)(222222X E k k k k k k k k X E k k k kk kk k+−⋅=⋅+⋅−=⋅=∑∑∑∑∞=−−∞=−∞=−∞=−λλλλλλλλλ= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ .三.二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题.下面的定理说明了二者之间的联系,泊松分布是二项分布的一种极限分布. 定理 (泊松定理)在n 重伯努利试验中,记事件A 在每次试验中发生的概率为与试验次数n 有关的数p n ,如果当n → +∞ 时,有n p n → λ ,则λλ−−+∞→=−⎟⎟⎠⎞⎜⎜⎝⎛e !)1(lim k p p k n k k n n k n n . 证:记λ n = n p n ,有λλ=+∞→n n lim ,因nk n n n kn n k n n n n n n p )(11)1(−−⋅−−−⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛−=−λλλλ,且e 1lim =⎟⎠⎞⎜⎝⎛−+−+∞→nnn n n λλ,λλ−=−−+∞→n k n n n )(lim , 则λλλλ−−−⋅−+∞→−+∞→=⎟⎠⎞⎜⎝⎛−+=−e 1lim )1(lim )(n k n n n n k n n n n n n p ,又因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛n k n k n k k n n n k n k 1111!!)1()1(L L ,且11111lim =⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−+∞→n k n n L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→−+∞→n k n p p k n p p k n k n nk n k n k n n k n n 1111)1(!lim )1(lim L λλ−+∞→−+∞→+∞→=⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅=e !1111lim )1(lim !)(lim k n k n p k np k n k n n n k n n L . 此定理表明对于二项分布b (n , p ),当n 很大,p 很小时,可用泊松分布P (λ ) 近似,其中λ = n p .例 某地区每年人口意外死亡率为0.0001,现有60000人投保人身意外保险,求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率.解:设X 表示“一年内因投保人意外死亡而赔付的人数”,X ~ B (60000, 0.0001).则5999289999.00001.0860000}8{××⎟⎟⎠⎞⎜⎜⎝⎛==X P ,∑=−××⎟⎟⎠⎞⎜⎜⎝⎛=≤50600009999.00001.060000}5{k kk k X P , 但显然计算很繁琐,为便于计算,用泊松分布近似.因n = 60000很大,p = 0.0001很小,λ = np = 6,有)6(~P X &,故103.0744.0847.0e !86}8{68=−=≈=−X P ,446.0e !6}5{506=≈≤∑=−k k k X P .2.4.3. 超几何分布一.超几何分布在N 件产品中,有M 件次品,从中不放回地取n 件,以X 表示取得的次品数.设X 取值为k ,一方面,显然有k ≤ n 且k ≤ M ,即k ≤ min{n , M },另一方面,有k ≥ 0且n − k ≤ N − M ,可得k ≥ M + n − N ,即k ≥ max{0, M + n − N }.这样X 的全部可能取值为l , l + 1, …, L ,其中l = max{0, M + n − N },L = min{n , M },且⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛==n N k n M N k M k X P }{.定义 若随机变量X 的概率函数为⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=n N k n M N k M k p )(,k = l , l + 1, …, L ,l = max(0, n + M − N ),L = min(M , n ),M < N ,n < N , 则称X 服从超几何分布(Hypergeometric Distribution ),记为X ~ h (n , N , M ).超几何分布的实际背景是古典概型中的不放回抽样检验问题. 注:有放回检验抽样问题对应的是二项分布.非负性:0>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛n N k n M N k M ;正则性:10=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑∑==n N n N n N k n M N k M n N k n M N k M Ll k L k .注:比较(1 + x )M(1 + x )N − M与(1 + x )N中x n的系数可以证明⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑=n N k n M N k M Ll k .例 一袋中有3个红球,2个白球,不放回地取出3个球,X 表示取得的红球数.求X 的概率分布.解:不放回抽样,N = 3,M = 2,n = 3,则X ~ h (3, 5, 3).故X 的全部可能取值为1, 2, 3, (l = max (0, n + M − N ) = 1,L = min(n , M ) = 3),3.0352213}1{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,6.0351223}2{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,1.0350233}3{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P . 超几何分布h (n , N , M )的最可能值为⎪⎩⎪⎨⎧+++−++++++++++++=.21)1(,121)1(21)1(,21)1(],21)1[(0是正整数时当或不是正整数时当N M n N M n N M n N M n N M n k证:若X ~ h (n , N , M),有)!()!()!()!(!!1)(k n M N k n M N k M k M n N n N k n M N k M k p +−−−−⋅−⋅⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=, 故p (k ) − p (k − 1))!1()!1()!1()!1()!(!)!()!()!(!)!(!−+−−+−+−−⎟⎟⎠⎞⎜⎜⎝⎛−−+−−−−⎟⎟⎠⎞⎜⎜⎝⎛−=k n M N k n k M k n N M N M k n M N k n k M k n N M N M)]()1)(1[()!()!1()!1(!)!(!k n M N k k n k M k n M N k n k M k n N M N M +−−−+−+−+−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=)]2()1)(1[()!()!1()!1(!)!(!+−+++−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=N k n M k n M N k n k M k n N M N M .当21)1(+++<N M n k 时,有p (k ) > p (k − 1);当21)1(+++>N M n k 时,有p (k ) < p (k − 1). 如果21)1(+++N M n 不是正整数,取21)1[(0+++=N M n k ,有21)1(0+++<N M n k ,即p (k 0) > p (k 0 − 1);且21)1(10+++>+N M n k ,即p (k 0 + 1) < p (k 0).故p (k 0) 为最大值.如果21)1(+++N M n 是正整数,取21)1(0+++=N M n k ,即p (k 0) = p (k 0 − 1),故p (k 0) 和p (k 0 − 1) 都是最大值. 二.超几何分布的数学期望和方差超几何分布h (n , N , M )的数学期望为N nM n N k n M N k M N nM n N n N k n M N k M k M k n N k n M N k M k X E Ll k L lk L l k =⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=∑∑∑===11111111)(, 又因∑∑∑===⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=L lk L l k Ll k n N k n M N k M k n N k n M N k M k k n N k n M N k M k X E )()(222 ∑=+⎟⎟⎠⎞⎜⎜⎝⎛−−−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=Llk X E n N n n N N k n M N k M k k M M k k )(22)1()1(22)1()1()(2N nM N N M M n n N nM n N k n M N k M N N M M n n Ll k +−−−=+⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−−−=∑=)1()1()1(2222)1()1()1(, 故方差为)1())(()1()1)(1()]([)()Var(222222−−−=−+−−−=−=N N n N M N nM N M n N nM N N M n nM X E X E X . 为了便于记忆,可将超几何分布与二项分布的数学期望和方差进行比较.二项分布b (n , p ):数学期望E (X ) = np ,方差Var (X ) = np (1 − p );超几何分布h (n , N , M ):数学期望N M nX E =)(,方差11)Var(−−⎟⎠⎞⎜⎝⎛−=N n N N M N M n X ; 可见分布h (n , N , M )中的N M 相当于二项分布b (n , p )中的p ,方差修正因子为1−−N nN . 三.超几何分布的二项近似直观上,当抽样个数n 远小于M 及N − M 时,不放回抽样问题可近似看作有放回抽样问题,也就是此时超几何分布可用二项分布近似.定理 如果当N → +∞ 时,p NM→, (0 < p < 1),则k n k N p p k n n N k n M N k M −+∞→−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛)1(lim . 证:因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛N n N n N n n N N N n N n 1111!!)1()1(L L , 且⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛M k M k M k M k 1111!L ,⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−=⎟⎟⎠⎞⎜⎜⎝⎛−−−M N k n M N k n M N k n M N kn 1111)!()(L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→+∞→N n N n N M N k n M N k n M N M k M k M n N k n M N k M n k n k N N 1111!1111)!()(1111!lim lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅−=−+∞→N n N M N k n M N M k M N M N M k n k n nk n k N 111111111111)()!(!!lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛=+∞→−+∞→N n N M N k n M N M k M N M N M k n N kn k N 111111111111lim 1lim L L L。

第2章 随机变量及其分布 ppt课件

第2章 随机变量及其分布 ppt课件
2.10
2.1.3 离散随机变量的分布列
➢ 设离散随机变量 X 的可能取值为: x1,x2,……,xn,……
称 pi=P(X=xi), i =1, 2, …… 为 X 的分布列.
➢ 分布列也可用表格形式表示:
X x1 P p1
x2 …… xn …… p2 …… pn ……
2.11
分布列的基本性质 (1) pi 0, (非负性)
(2) pi 1. (正则性)
i
2.12
注 意 点 (1)
求离散随机变量的分布列应注意: (1) 确定随机变量的所有可能取值; (2) 计算每个取值点的概率.
2.13
例2.1.1 从1~10这10个数字中随机取出5个数字,令
X:取出的5个数字中的最大值.
试求 X 的分布列.
解:X 的取值为5,6,7,8,9,10.
第二章 随机变量及其分布
§2.1 随机变量及其分布 §2.2 随机变量的数学期望 §2.3 随机变量的方差与标准差 §2.4 常用离散分布 §2.5 常用连续分布 §2.6 随机变量函数的分布 §2.7 分布的其他特征数
2.1
§2.1 随机变量及其分布
(1) 掷一颗骰子, 出现的点数 X 1,2,…,6.
注意点
(1) 随机变量X()是样本点的函数, 其定义域为 ,其值域为R = (,) 若 X 表示掷一颗骰子出现的点数, 则 {X=1.5} 是不可能事件.
(2) 若X为随机变量,则 {X = k} 、 {a < X b} 、……
均为随机事件. 即 {a < X b} ={;a < X() b }
2.16
例2.1.3
已知 X 的分布函数如下,求 X 的分布列.

概率论与数理统计第2章随机变量

概率论与数理统计第2章随机变量
F ( x) P X x 1
所以
x 0, 0, 1 2 F ( x) x , 0 x 2, 4 x 2. 1,
2.1.2 随机变量的分布函数
定理2.1.1 任一分布函数F(x)都有如下性质: (1)单调性: F(x)单调不减,即若x1<x2,则有 F ( x1 ) F ( x2 )
于样本空间中的每一个样本点,X都有一个值与之对应:
样本点
X的值
HH
2
HT
1
TH
1
TT
0
2.1.2 随机变量的分布函数
定义2.1.2 设X是随机变量,x是任意实数,称
F ( x) P X x
为随机变量X的分布函数.
2.1.2 随机变量的分布函数
例2.1.4 一个靶子是半径为2米的圆盘,设击中靶上任
2.3.1 连续型随机变量的概念及性质
(2)画频率分布直方图
图2.3某中学学生身高的频率直方图
2.3.1 连续型随机变量的概念及性质
图2.4
2.3.1 连续型随机变量的概念及性质
图2.5
2.3.1 连续型随机变量的概念及性质
2. 连续型随机变量的定义及性质 (1)定义2.3.1 设F(x)是随机变量X的分布函数,若存 在非负的f(x),使得对于任意的实数x有
e4 42 P{ X 2} 0.1465 2!
2.2.2 常用离散型随机变量的分布
(2)破汽水甁多于2瓶的概率为
P{X 2} 1 P{X 0} P{X 1} P{ X 2}
=
4 2 e 4 1 e4 4e4 0.761897 2!
n=40 p=0.025 0.363 0.372 0.186 0.060 0.014 0.005

高中数学 第2章 概率 2.1 随机变量及其概率分布讲义 苏教版选修2-3-苏教版高二选修2-3数学

高中数学 第2章 概率 2.1 随机变量及其概率分布讲义 苏教版选修2-3-苏教版高二选修2-3数学

2.1 随机变量及其概率分布学习目标核心素养1.了解取有限值的离散型随机变量及其分布列的概念,了解分布列刻画随机现象的重要性,会求某些简单离散型随机变量的分布列.(重点、难点)2.掌握离散型随机变量分布列的性质,掌握两点分布的特征.(重点)1.通过对离散型随机变量的学习,提升数学抽象素养.2.借助随机变量的分布列,提升逻辑推理素养.1.随机变量如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量.通常用大写拉丁字母X,Y,Z(或小写希腊字母ξ,η,ζ)等表示.思考1:随机变量是自变量吗?[提示] 不是,它是随试验结果变化而变化的,不是主动变化的.思考2:离散型随机变量的取值必须是有限个吗?[提示] 不一定.离散型随机变量的取值可以一一列举出来,所取值可以是有限个,也可以是无限个.2.概率分布列假定随机变量X有n个不同的取值,它们分别是x1,x2,…,x n,且P(X=x i)=p i,i=1,2,…,n,①则称①为随机变量X的概率分布列,简称为X的分布列.称表X x1x2…x nP p1p2…p np i(i =1,2,…,n)满足条件:①p i≥0(i=1,2,…,n);②p1+p2+…+p n=1.思考3:在离散型随机变量分布列中,每一个可能值对应的概率可以为任意的实数吗?[提示] 错误.每一个可能值对应的概率为[0,1]中的实数.思考4:离散型随机变量的分布列中,各个概率之和可以小于1吗?[提示] 不可以.由离散型随机变量的含义与分布列的性质可知不可以.思考5:离散型随机变量的各个可能值表示的事件是彼此互斥的吗?[提示] 是.离散型随机变量的各个可能值表示的事件不会同时发生,是彼此互斥的.3.两点分布如果随机变量X的分布表为X 10P p q其中0<p<1,q=1-p,这一类分布称为0­1分布或两点分布,并记为X~0­1分布或X~两点分布.1.掷均匀硬币一次,随机变量为( )A.掷硬币的次数B.出现正面向上的次数C.出现正面向上的次数或反面向上的次数D.出现正面向上的次数与反面向上的次数之和B[掷一枚硬币,可能出现的结果是正面向上或反面向上,以一个标准如正面向上的次数来描述这一随机试验,那么正面向上的次数就是随机变量ξ,ξ的取值是0,1.A项中,掷硬币的次数就是1,不是随机变量;C项中的标准模糊不清;D项中,出现正面向上的次数和反面向上的次数的概率的和必是1,对应的是必然事件,所以不是随机变量.] 2.设离散型随机变量ξ的分布列如下:ξ-1012 3P 0.100.200.100.200.40 Pξ0.40 [P(ξ<1.5)=P(ξ=-1)+P(ξ=0)+P(ξ=1)=0.10+0.20+0.10=0.40.] 3.设某项试验的成功率是失败率的2倍,用随机变量X描述一次试验成功与否(记X=0为试验失败,记X=1为试验成功),则P(X=0)等于________.1 3[设试验失败的概率为p,则2p+p=1,∴p=13.]随机变量的概念【例1】(1)国际机场候机厅中2019年5月1日的旅客数量;(2)2019年1月1日至5月1日期间所查酒驾的人数;(3)2019年6月1日某某到的某次列车到站的时间;(4)体积为1 000 cm3的球的半径长.[思路探究] 利用随机变量的定义判断.[解] (1)旅客人数可能是0,1,2,…,出现哪一个结果是随机的,因此是随机变量.(2)所查酒驾的人数可能是0,1,2,…,出现哪一个结果是随机的,因此是随机变量.(3)列车到达的时间可在某一区间内任取一值,是随机的,因此是随机变量.(4)球的体积为1 000 cm3时,球的半径为定值,不是随机变量.随机变量的辨析方法(1)随机试验的结果具有可变性,即每次试验对应的结果不尽相同.(2)随机试验的结果具有确定性,即每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.如果一个随机试验的结果对应的变量具有以上两点,则该变量即为随机变量.1.(1)下列变量中,是随机变量的是________.(填上所有正确的序号)①某人掷硬币1次,正面向上的次数;②某音乐歌曲《小苹果》每天被点播的次数;③标准大气压下冰水混合物的温度;④你每天早晨起床的时间.(2)一个口袋中装有10个红球,5个白球,从中任取4个球,其中所含红球的个数为X,则X的可能取值构成集合________.事件{X=k}表示取出________个红球,________个白球,k=0,1,2,3,4.(1)①②④(2){0,1,2,3,4} k4-k[(1)①②④中每个事件的发生是随机的,具有可变性,故①②④是随机变量;标准大气压下冰水混合物的温度为0 ℃,是必然的,不具有随机性.(2)由题意可知,X的可能取值为0,1,2,3,4.{X=k}表示取出的4个球中含k个红球,4-k个白球.]随机变量的分布列及应用【例2】ξ表示取出的3只球中的最大,写出随机变量ξ的概率分布.[思路探究] 由本例中的取球方式可知,随机变量ξ与球的顺序无关,其中球上的最大只有可能是3,4,5,可以利用组合的方法计算其概率.[解] 随机变量ξ的可能取值为3,4,5.当ξ=3时,即取出的三只球中最大为3,则其他两只球的编号只能是1,2,故有P(ξ=3)=C22C35=110;当ξ=4时,即取出的三只球中最大为4,则其他两只球只能在编号为1,2,3的3只球中取2只,故有P(ξ=4)=C23C35=310;当ξ=5时,即取出的三只球中最大为5,则其他两只球只能在编号为1,2,3,4的4只球中取2只,故有P(ξ=5)=C24C35=610=35.因此,ξ的分布列为ξ34 5P11031035利用分布列及其性质解题时要注意以下两个问题:(1)X的各个取值表示的事件是互斥的.(2)不仅要注意∑i=1np i=1,而且要注意p i≥0,i=1,2,…,n.2.设随机变量ξ的概率分布为P⎝⎛⎭⎪⎫ξ=k5=ak(k=1,2,3,4,5).求:(1)常数a的值;(2)P ⎝ ⎛⎭⎪⎫ξ≥35; (3)P ⎝ ⎛⎭⎪⎫110<ξ<710.[解] 题目所给的ξ的概率分布表为ξ 15 25 35 45 55 Pa2a3a4a5a(1)由a +2a +3a +4a +5a =1,得a =15.(2)P ⎝ ⎛⎭⎪⎫ξ≥35=P ⎝ ⎛⎭⎪⎫ξ=35+P ⎝ ⎛⎭⎪⎫ξ=45+P ⎝ ⎛⎭⎪⎫ξ=55=315+415+515=45或P ⎝⎛⎭⎪⎫ξ≥35=1-P ⎝⎛⎭⎪⎫ξ≤25=1-⎝ ⎛⎭⎪⎫115+215=45.(3)因为110<ξ<710,所以ξ=15,25,35.故P ⎝ ⎛⎭⎪⎫110<ξ<710=P ⎝ ⎛⎭⎪⎫ξ=15+P ⎝ ⎛⎭⎪⎫ξ=25+P ⎝ ⎛⎭⎪⎫ξ=35=a +2a +3a =6a =6×115=25.随机变量的可能取值及试验结果[1.抛掷一枚质地均匀的硬币,可能出现正面向上、反面向上两种结果.这种试验结果能用数字表示吗?[提示] 可以.用数字1和0分别表示正面向上和反面向上.2.在一块地里种10棵树苗,设成活的树苗数为X ,则X 可取哪些数字? [提示] X =0,1,2,3,4,5,6,7,8,9,10.3.抛掷一枚质地均匀的骰子,出现向上的点数为ξ,则“ξ≥4”表示的随机事件是什么?[提示] “ξ≥4”表示出现的点数为4点,5点,6点.【例3】 写出下列随机变量可能取的值,并说明随机变量所取的值和所表示的随机试验的结果.(1)袋中有大小相同的红球10个,白球5个,从袋中每次任取1个球,直到取出的球是白球为止,所需要的取球次数;(2)从标有1,2,3,4,5,6的6X卡片中任取2X,所取卡片上的数字之和.[思路探究] 分析题意→写出X可能取的值→分别写出取值所表示的结果[解] (1)设所需的取球次数为X,则X=1,2,3,4,…,10,11,X=i表示前i-1次取到红球,第i次取到白球,这里i=1,2, (11)(2)设所取卡片上的数字和为X,则X=3,4,5, (11)X=3,表示“取出标有1,2的两X卡片”;X=4,表示“取出标有1,3的两X卡片”;X=5,表示“取出标有2,3或标有1,4的两X卡片”;X=6,表示“取出标有2,4或1,5的两X卡片”;X=7,表示“取出标有3,4或2,5或1,6的两X卡片”;X=8,表示“取出标有2,6或3,5的两X卡片”;X=9,表示“取出标有3,6或4,5的两X卡片”;X=10,表示“取出标有4,6的两X卡片”;X=11,表示“取出标有5,6的两X卡片”.用随机变量表示随机试验的结果问题的关键点和注意点(1)关键点:解决此类问题的关键是明确随机变量的所有可能取值,以及取每一个值时对应的意义,即一个随机变量的取值可能对应一个或多个随机试验的结果.(2)注意点:解答过程中不要漏掉某些试验结果.3.写出下列各随机变量可能取的值,并说明随机变量所取的值表示的随机试验的结果.(1)在2018年大学的自主招生中,参与面试的5名考生中,通过面试的考生人数X;(2)射手对目标进行射击,击中目标得1分,未击中目标得0分,该射手在一次射击中的得分用ξ表示.[解] (1)X可能取值0,1,2,3,4,5,X=i表示面试通过的有i人,其中i=0,1,2,3,4,5.(2)ξ可能取值为0,1,当ξ=0时,表明该射手在本次射击中没有击中目标;当ξ=1时,表明该射手在本次射击中击中目标.1.本节课重点是随机变量的概念及随机变量的分布列及其性质,以及两点分布,难点是随机变量的取值及概率.2.判断一个试验是否为随机试验,依据是这个试验是否满足以下三个条件:(1)试验在相同条件下是否可以重复;(2)试验的所有可能结果是否是明确的,并且试验的结果不止一个;(3)每次试验的结果恰好是一个,而且在一次试验前无法预知出现哪个结果.3.本节课的易错点:在利用分布列的性质解题时要注意:①X=xi的各个取值所表示的事件是互斥的;②不仅要注意i=1np i=1,而且要注意0≤p i≤1,i=1,2,…,n.1.判断(正确的打“√”,错误的打“×”)(1)随机变量的取值可以是有限个,也可以是无限个.( )(2)在概率分布列中,每一个可能值对应的概率可以为任意的实数.( )(3)概率分布列中每个随机变量的取值对应的概率都相等.( )(4)在概率分布列中,所有概率之和为1.( )[解析] (1)√因为随机变量的每一个取值,均代表一个试验结果,试验结果有限个,随机变量的取值就有有限个,试验结果有无限个,随机变量的取值就有无限个.(2)×因为在概率分布列中每一个可能值对应随机事件的概率均在[0,1]X围内.(3)×因为分布列中的每个随机变量能代表的随机事件,并非都是等可能发生的事件.(4)√由分布列的性质可知,该说法正确.[答案] (1)√(2)×(3)×(4)√2.下列叙述中,是随机变量的为( )A.某人早晨在车站等出租车的时间B.把一杯开水置于空气中,让它自然冷却,每一时刻它的温度C.射击十次,命中目标的次数D .袋中有2个黑球,6个红球,任取2个,取得1个红球的可能性 C [根据随机变量的含义可知,选C.] 3.随机变量η的分布列如下:则x 0 0.55 [由分布列的性质得 0.2+x +0.35+0.1+0.15+0.2=1,解得x =0.故P (η≤3)=P (η=1)+P (η=2)+P (η=3)=0.2+0.35=0.55.] 4.袋中有相同的5个球,其中3个红球,2个黄球,现从中随机且不放回地摸球,每次摸1个,当两种颜色的球都被摸到时,即停止摸球,记随机变量X 为此时已摸球的次数,求随机变量X 的概率分布列.[解] 随机变量X 可取的值为2,3,4, P (X =2)=C 12C 13C 12C 15C 14=35;P (X =3)=A 22C 13+A 23C 12C 15C 14C 13=310;P (X =4)=A 33C 12C 15C 14C 13C 12=110;所以随机变量X 的概率分布列为:。

第二章随机变量PPTppt文档

第二章随机变量PPTppt文档
{X 2} 表示掷出的点数大于2这一随机事件.
我们还可以定义其它的随机变量,例如定义:
Yቤተ መጻሕፍቲ ባይዱ
1, 0,
x 2, x 2,
Z
1, 0,
x 6, x 6.
例3 上午 8:00~9:00 在某路口观察,令X为该时间 间隔内通过的汽车数,则X就是一个随机变量.它的 取值为 0,1,…;{X1000}表示通过的汽车数小于 1000辆这一随机事件;{X 500}表示通过的汽车数大于 等于500辆这一随机事件.
定义函数:
X()10,,
1, 2,
定义1 设随机试验E的样本空间是Ω,如果对每一样 本点 都有唯一的一个实数 X ( ) 与之对应,
这样就得到一个定义在Ω上的实值单值函数 XX()
我们称之为定义在Ω上的一个随机变量.
随机变量作为样本点的函数,有两个基本特点:
变异性、随机性
例2 掷一颗骰子,令X表示出现的点数,则X就是一 个随{X机变3}量表.示它掷的出所的有点可数能不取超值过为3这1,一2随,机3,事4件,;5,6;
则随机变量 X 服从 0-1 分布,分布律为
X
0
1
Pk
0.55 0.45
例: 商店里有 10 张同类 CD 片,其中 6 张为一级品,3
张为二级品,1 张为不合格品.顾客购买时任取其中一
张,求取得合格品的概率.
1, 取得合格品
解 令 X 0, 否则, 则 X 服从 0-1 分布,
其分布律为
• 例:设一汽车在开往目的地的道路上需经过四个信号灯, 每个信号灯以1/2的概率允许或禁止汽车通过.以X表示汽 车首次停下时,它已通过的信号灯数(设各信号灯的工作是 相互独立的),求X的分布律.

随机变量及其概率分布讲义

随机变量及其概率分布讲义

第二章随机变量及其概率分布内容简介1.本章引入随机变量及其分布函数概念,讨论了离散型和连续型两种随机变量,介绍了几种常用的随机变量。

2.本章重点内容包括:离散型随机变量及其分布律,连续型随机变量及其概率密度,二项分布与正态分布。

内容讲解§2.1离散型随机变量1.随机变量的概念(1)引入随机变量的理由:① “常量”到“变量”;② 全面研究随机试验的需要。

(2)如何引入:一类:随机试验的结果用数量表示的,直接数量化。

如:掷骰子,设出现的点数为随机变量X,则X=1,2,3,4,5,6分别表示事件“出现一点”,“出现二点”,…,“出现六点”。

另一类:试验结果不是用数量表示的,如:掷硬币,双方比赛的结果等,可以人为赋值,如掷硬币,设结果为随机变量Y,“出现正面”用“Y=1”表示,“出现反面”用“Y=0”表示。

如果双方比赛结果使用记分法,可以用分数表示,“Z=3”表示“胜”,“Z=1”表示“平”,“Z=0”表示“负”,等等。

(3)定义:设E是随机试验,样本空间为Ω,如果对于每一个样本点ω∈Ω,有一个实数X(ω)与之对应,则称X=X(ω)为随机变量,记做X, Y, Z,…。

(4)解释:① 随机变量不是普通变量,它的取值不是任意的,它是以一定的可能性(概率)取某一个值的,即具有随机性,因此称为“随机变量”;② 在一次随机试验中,可以根据不同的需要来定义不同的随机变量。

③ 引入随机变量后,可用随机变量来描述事件,如掷骰子,设出现的点数为随机变量X,则“出现4点”可表示为{X=4},“不少于4点”可表示为{X≥4},等等。

所以,其概率可表示为P{X=4}=1/6, P{X≥4}=1/2。

2.离散型随机变量及其分布律(1)离散型随机变量定义:若随机变量X只取有限多个或可列无限多个值,则称X为离散型随机变量。

如掷骰子出现的点数,医院门诊一天接待的患者数,某停车场内停放的车辆数,等等,都是离散型随机变量。

(2)离散型随机变量的分布律:设X为离散型随机变量,可能取值为x1,x2,…,x k,…,且P{X =x k }=p k,k=1,2,…,则称{ p k }为X的分布律(或分布列,概率分布)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解 : 由几何概率的计算不难求出X的分布函数 当x<0时
所以:
上一页 下一页 返回
上一页 下一页 返回
第二节 离散型随机变量及其分布
如果随机变量所有的可能取值为有限个或可列无 限多个,则称这种随机变量为离散型随机变量。
设离散型随机变量X的可能取值为xk (k=1,2,…),事

发生的概率为pk ,即
总计
观察到的次数 Mk 57 203 383 525 532 408 273 139 45 27 16 2608
频率
0.022 0.078 0.147 0.201 0.204 0.156 0.105 0.053 0.017 0.010 0.006 0.999
按泊松分布
计算的概率 0.021 0.081 0.156 0.201 0.195 0.151 0.097 0.054 0.026 0.011 0.007 1.000
(2)各小块是否放出粒子,是相互独立的。
上一页 下一页 返回
在这两条假定下,1秒内这一放射性物质放出k个粒 子这一事件,可近似看作该物质的n个独立的小块中, 恰有k小块放出粒子。
放出k个粒子的概率:
其中P{X=k}是随n而变的,它是一个近似式。 把物质无限细分, 得到 P{X=k} 的精 确式,即
上一页 下一页 返回
例5: 有同类设备300台,各台工作状态相互独立。已 知每台设备发生故障的概率为0.01,若一台设备发生故 障需要一人去处理,问至少需要配备多少工人,才能保 证设备发生故障而不能及时修理的概率小于0.01? 解: 设X表示同一时刻发生故障的设备台数,依题意知 X~(300,0.01),若配备N位维修人员,所需解决的问题是
泊松定理 设 λ>0是一常数,n是任意整数,设npn=λ,则 对任意一固定的非负整数k,有
证 明
上一页 下一页 返回
从而
定理的条件npn=λ,意味着n很大时候pn必定很小。 因此当n很大,p很小时有近似公式
其中λ=np。
在实际计算中,当
时用
作为
的近似值效果很好。
而当
时效果更佳。
(λ=np)
的值有表可查。
确定最小的N,使得:P{X>N}<0.01 (λ=np=3)
查表可知,满足上式最小的N是8。 至少需配备8个工人才能满足要求。 上一页 下一页 返回
泊松(Poisson)分布 设随机变量X的所有可能取值为0,1,,而取各值
的概率为
其中λ>0为常数,则称X服从参数为的泊松分布,记 为X~ ()。
由泊松定理知
其中
上一页 下一页 返回
第三节 连续随机变量及其分布
定义3: 设随机变量X的分布函数为F(x),若存在非负 函数f(t),使得对于任意实数x,有
则称X为连续型随机变量,称f(t)为X的概率密度函数, 简称概率密度或分布密度。 概率密度f(x)具有以下性质:
(4)若x为f(x)的连续点,则有
称为随机变量X的概率或分布律。
分布律常用表格 X 形式表示如下: pk
x1 x2 … xk… p1 p2 … pk…
上一页 下一页 返回
分布律的两条基本性质:
上一页 下一页 返回
X 0 12
p
a
(1)确定常数a的值;(2)求X的分布函数
解:(1)由分布律的性质知
因此
上一页 下一页 返回
(2)由分布函数计算公式易得X的分布函数为:
上一页 下一页 返回
分析推导放射的粒子数为何服从泊松分布 考虑单位时间1秒内放射出的粒子数X。 设想把体积为V的放射性物质分割为n份相同体积 △V 的小块,并假定:
(1)对于每个小块,在1秒内放出一个粒子数的概率p为
其中μ>0是常数(与n无关且与每小块的位置无关)。
在1秒内放出两个或两个以上粒子的概率为0
上一页 下一页 返回
在n重贝努里试验中,假设A在每次试验中出现 的概率为p,若以X表示n次试验中A出现的次数。那 么由二项概率公式得X的分布律为:
即X服从二项分布。 当n=1时,二项分布化为: P{X=k}=pk(1-p)1-k k=0,1 即为(0-1)分布
(0-1)分布可用b(1,p)表示。
上一页 下一页 返回
第二章 随机变量
第一节 随机变量及其分布函数 第二节 离散型随机变量及其分布 第三节 连续型随机变量及其分布 第四节 随机变量函数的分布
第一节 随机变量及其分布函数
定义1:
定义2:设X是一随机变量,x为任意实数,函数
称为随机变量X的分布函数。
上一页 下一页 返回
证明:
上一页 下一页 返回
上一页 下一页 返回
由概率的 连续性得:
上一页 下一页 返回
例1: 口袋里装有3个白球2个红球,从中任取三个球, 求取出的三个球中的白球数的分布函数 解: 设X表示取出的3个球中的白球数。X的可能 取值为1,2,3。而且由古典概率可算得
上一页 下一页 返回
于是,X的分布函数为:
上一页 下一页 返回
例2: 考虑如下试验:在区间[0,1]上任取一点,记录它 的坐标X。那么X是一随机变量,根据试验条件可以认为 X取到[0,1]上任一点的可能性相同。求X的分布函数。
例4: 某交互式计算机有10个终端,这些终端被各个 单位独立使用,使用率均为0.7,求同时使用的终端不 超过半数的概率。 解 : 设X表示10个终端中同时使用的终端数,则 X~b(10,0.7)。所求的概率为 :
在涉及二项分布的概率计算时,直接计算很困难时, 采用了近似计算。下面给出近似公式:
上一页 下一页 返回
上一页 下一页 返回
两点分布 若在一次试验中X只可能取x1 或x2 两值(x1<x2),
它的概率分布是
则称X服从两点分布。 当规定x1=0,x2=1时两点分布称为(0-1)分布。
简记为X~(0-1)分布。
X
0
1
pk
1-p
p
上一页 下一页 返回
二项分布 若离散型随机变量X的分布律为
其中0<p<1, 称X服从参数为n,p的二项分布,记为 X~b(n,p)。
上式给出的概率满足:pk=P{X=k} 0, 且
上一页 下一页 返回
例6: 放射性物质在规定的一段时间内,其放射的粒子 数X服从泊松分布。罗瑟福和盖克观察与分析了放射
性物质放出的粒子个数的情况。他们做了2608次观
察(每次时间为7.5秒),整理与分析如表所示:
上一页 下一页 返回
粒子数k
0 1 2 3 4 5 6 7 8 9
相关文档
最新文档