概率论与数理统计第二章笔记
自考 概率论与数理统计 重难点笔记资料

高等教育自学考试《概率论与数理统计》重难点笔记资料 课程代码:04183第一章 随机事件与概率一.随机事件关系与运算1!0,)!(!!!,)!(!0===-==-=C C C A A n n n r n nn rn r n r n :,n r n n 组合排列二.概率P(A) 1.P(A)概率特征)()31)(,0)()21)(0)111∑∞=∞===Ω=≤≤K KK kA A P ,P(P P A P 事件互不相容时φ2. 古典概型3.概率加法公式P(A+B)=P(A)+P(B)- P(AB)当A 、B 互斥时, P(A+B)=P(A)+P(B) 事件的独立性:定义:P(AB)=P(A)P(B)性质:.P(A)>0,,则P(B)=P(B/A); P(B)>0则P(A)=P(A/B) P(B —A)=P(B)--P(AB)P (A--B )==P (AB )=P (A--AB )=P (A )--P (AB )基本事件总数所包含的基本事件数A A P =)(P(A+B+C)=1--P(A+B+C)=1--P(A)P(B)P(C) P(AB)=P(AUB)=1-P(AUB)=1-(P(A)+P(B)) P(A)=1-P(A4.条件概率公式5.概率的乘法公式6.全概率公式:从原因计算结果7.Bayes 公式:从结果找原因)()()|(B P AB P B A P =)|()()(B A P B P AB P =)|()(A B P A P =∑==nk k k B A P B P A P 1)|()()(∑==nk kki i k B A P B P B A P B P A B P 1)|()()|()()|()()()|(A P AB P A B P =)/()/()()(AB C P A B P A P ABC P =第二章随机变量及其概率分布4/ 13分布函数对离散型随机变量对连续型随机变量分布函数与密度函数的重要关系:“一般正态分布函数F(x)”转换为“标准正态分布函数)(x Φ”的关系 设X~N (δμ2,)则1.2.3.连续型随机变量函数的概率分布定理:记x=h(y)为y=g(x)的反函数,则Y=g(X)的概率密度:⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<<'=其他y y h y h y f f X Y ,0),())(()(βα1) 设X~U(-2,2ππ),令Y=tanX,求Y 的概率密度柯西分布:+∞<<-∞+='=y y h y h y y f f X Y ,111)())(()(2π 2)设X~N(σμ2,),求eX的概率密度对数正态分布:⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤>-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤>•=-0,00,2)(ln 210,0,0,1)(ln )(,22y y y y y y y y y e f fX Yσμσπ ∑≤==≤=xk k X P x X P x F )()()(⎰∞-=≤=x dtt f x X P x F )()()(⎰∞-=≤=xdt t f x X P x F )()()()()('x f x F =3直接变换法:[])()(21)()(y y yy y ff F fXXY Y-+='=e e yx x 的的反函数为y y 的反函数为反y 2ln 2,,,,,ln -=-===第三章多维随机变量及其概率分布 二元随机变量及其边缘分布 分布规律的描述方法联合密度函数联合分布函数离散联合分布函数的概率:{}0),(),(),(),(,112112222121≥+--=≤<≤<y x y x y x y x y y x x F F F F Y X P性质1),(,0),(),(),(=+∞+∞=-∞-∞=-∞=-∞F F x F y F 离散边缘分布律:{}{}∑∑===⋅===⋅ijji pijY P j p pij X P pi y x1...2,1,,0,0=⋅=⋅=≥⋅≥⋅∑∑jij p pi j i j p pi联合密度二维边缘密度二维连续随机变量的分布 1.均匀分布(X,Y)~U D1)设D 为平面上的有界区域,S 表面积⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤+−−→−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤≤--−−→−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧∈=其他,其他o d x c b x a c d a b 其他D y x S y x f R yx R 圆形矩形,01,,,))((1,0),(,1),(2222π),(y x f ),(y x F 0),(≥y x f 1),(=⎰⎰+∞∞-+∞∞-dxdy y x f 1),(0≤≤y x F },{),(y Y x X P y x F ≤≤=+∞<<∞-=⎰+∞∞-x ,,dy y x f x f ),()(+∞<<-∞=⎰+∞∞-y dx y x f y f Y ,,),()(}{}{},{j Y P i X P j Y i X P =====2.正态分布),,,,(~),(222121ρσσμμN Y Xey y x f y x x ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧+--------=σμσσσρρσπσμμρμ222212121212)2(121),())((2)()1(21221离散型随机变量的独立性)()(),(y FY x Fx y x F =连续型随机变量的独立性第四章 随机变量的数字特征数学期望离散型随机变量,数学期望定义连续型随机变量,数学期望定义期望性质:● E(a)=a ,其中a 为常数● E(a+bX)=a+bE(X),其中a 、b 为常数 , ● E(CX)=CE(X),其中C 为常数● E(X+Y)=E(X)+E(Y),X 、Y 为任意随机变量 ● E(XY)=E(X)E(Y),X,Y 相互独立 方差的性质D(a)=0,其中a 为常数D(a+bX)=b 2(X),其中a 、b 为常数D(X+Y)=D(X)+D(Y) 当X 、Y 相互独立时随机变量g(X)的数学期望常用公式:二维随机变量的期望 离散)()(),(y f x f y x f Y X =∑+∞-∞=⋅=k kkP xX E )(⎰+∞∞-⋅=dxx f x X E )()(⎰∑+∞∞-=⇔=dx x fx x g X g E p x g X g E k k k )()()]([)())((ijji Jii i j ij i i i py j p y Y E p x pi x X E ∑∑∑∑∑∑=⋅==⋅=)()()()()(Y E X E Y X E +=+∑∑=i j ij j i p y x XY E )()()()(,Y E X E XY E Y X =独立时与当连续 g(X)∑⎰⎰∑=⇔=jij jiidxdy y x f y x g Y X G E p yx g Y X g E ,),(),()],([),()],([方差 定义式 离散:⋅-=∑=Pi X E xX D ni i21))(()(连续常用计算式常用公式协方差与相关系数⎰⎰--=dxdy y x f Y E Y X E x Y X Cov ),())())(((),(协方差Cov(X,Y)的性质当X 与Y 相互独立时,则Cov(X,Y)=0相关系数XY ρ的性质⎰⎰⎰⎰==dxdyy x yf Y E dxdy y x xf X E ),()(),()(dxdyy x xyf XY E ⎰⎰=),()(()⎰+∞∞-⋅-=dx x f X E x X D )()()(2[]22)()()(X E X E X D -=))}())(({(2)()()(Y E Y X E X E Y D X D Y X D --++=+)()()(Y D X D Y X D +=+)()()(),(Y E X E XY E Y X Cov -=)()(),(Y D X D Y X Cov XY=ρ[][]{})()()()()(Y E X E XY E Y E Y X E X E -=--())()()(),(22X D X E X E X X Cov =-=),(),(Y X abCov bY aX Cov =),(),(),(Z Y Cov Z X Cov Z Y X Cov +=+独立与相关独立必定不相关 相关必定不独立 不相关不一定独立标准正态分布的概率计算公式)()()(a a Z P a Z P Φ=<=≤)(1)()(a a Z P a Z P Φ-=>=≥)()()(a b b Z a P Φ-Φ=≤≤1)(2)()()(-Φ=-Φ-Φ=≤≤-a a a a Z a P一般正态分布的概率计算一般正态分布的概率计算公式第五章 大数定律及中心极限定理1.切比雪夫不等式:设随机变量X 的期望E(X)及方差D (X )存在,则对任意小正数a>0,{}{}22)(1)()()(aX D a X E X P a X D a X E X P -≥<-↔≤≥- 2.独立同分布序列的中心极限定理{})(21)(212lim lim lim x dt x n n X P x Y P x xt n i i n n n n n eF Φ==⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=≤=⎰∑∞---∞→∞→∞→πσμ3.棣莫费-拉普拉斯中心极限定理)1,0(~),(~2N X Z N X σμσμ-=⇔()()(σμ-Φ=<=≤a a X P a X P )(1)()(σμ-Φ-=>=≥a a X P a X P )()()(σμσμ-Φ--Φ=≤≤a b b X a P)(2122lim x dt x mpq np Z p e t x n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--∞-∞→⎰ 第六章 统计量及其抽样分布 样本方差,)(11212∑=--=ni i x x n s样本标准差2s s = 统计量样本K样本K卡方分布t 分布F 分布正态总体条件下样本均值的分布:样本方差的分布:两个正态总体的方差之比)(~)1,0(~212n X N X ni i χ∑=,则若())(~1),,(~21222n Y N Y ni iχμσσμ∑=-则若),(~//),(~),(~21212212n n F n V n U n V n U 则若χχ),(~2n N X σμ)1,0(~/N nX σμ-)1(~)1(222--n S n χσ)1(~/--n t ns X μ则若),(~),1,0(~2n Y N X χ)(~/n t nY X第七章 参数估计点估计:参数的估计值为一个常数最大似然估计P147似然函数单个正态总体参数的置信区间第八章 假设检验假设检验的步骤① 根据具体问题提出原假设H0和备择假设H1② 根据假设选择检验统计量,并计算检验统计值③ 看检验统计值是否落在拒绝域,若落在拒绝域则拒绝原假设,否则就不拒绝原假设。
概率论与数理统计第二章笔记

概率论与数理统计第二章笔记一、引言概率论与数理统计是数学中的一个重要分支,它研究的是随机现象的规律性和统计规律性。
在第二章中,我们将深入探讨随机变量及其分布,以及随机变量的数字特征。
二、随机变量及其分布1. 随机变量的定义及分类在概率论与数理统计中,随机变量是描述随机现象数值特征的变量。
根据随机变量可取的值的性质,可以分为离散随机变量和连续随机变量。
离散随机变量只取有限个或无限可数个值,而连续随机变量则可以取在一定范围内的任意一个值。
2. 随机变量的分布及特征随机变量的分布是描述其取值的概率规律。
对于离散随机变量,常见的分布包括二项分布、泊松分布等;对于连续随机变量,则有均匀分布、正态分布等。
通过对随机变量的分布进行分析,可以推导出其数字特征,如均值、方差等。
三、随机变量数字特征1. 随机变量数字特征的意义随机变量的数字特征是对其分布的定量描述,包括均值、方差、标准差等。
这些数字特征可以帮助我们更直观地理解随机变量的分布规律,从而作出合理的推断和决策。
2. 随机变量数字特征的计算对于离散随机变量,其均值、方差的计算可通过对其分布进行加权平均;对于连续随机变量,则需要进行积分计算。
这些计算方法在实际问题中起着重要作用,例如在风险评估、市场预测等方面的应用。
四、总结和回顾概率论与数理统计第二章主要介绍了随机变量及其分布,以及随机变量的数字特征。
通过对离散和连续随机变量的分类和分布进行深入讨论,我们对随机现象的规律性有了更清晰的认识。
通过数字特征的计算,我们可以更准确地描述和解释随机现象的规律,为实际问题的分析和决策提供了有力工具。
个人观点和理解在学习概率论与数理统计第二章的过程中,我深刻认识到随机变量和其分布对于随机现象的定量分析至关重要。
通过对数字特征的计算,我们可以更准确地描述和解释随机现象的规律,这对于我在日常生活和工作中的决策和分析将有着实质性的帮助。
结论概率论与数理统计第二章所介绍的内容为我们提供了深入了解随机现象规律性的基础,并且为日后的学习和实践奠定了坚实的基础。
概率论与数理统计(茆诗松)第二章讲义(PDF)

第二章 随机变量及其分布上一章研究内容: 事件(集合A )→ 概率(数).本章将用函数研究概率,函数是数与数的关系,即需要用数反映事件——随机变量.事件(数)→ 概率(数).§2.1 随机变量及其分布2.1.1.随机变量的概念随机试验的样本点有些是定量的:如掷骰子掷出的点数,电子元件使用寿命的小时数.有些是定性的:如掷硬币正面或反面,检查产品合格或不合格.对于定性的结果也可以规定其数量性质:如掷硬币,正面记为1,反面记为0;检查产品,合格记为1,不合格记为0.随机试验中,可将每一个样本点ω 都对应于一个实数X (ω),称为随机变量(Random Variable ),常用大写英文字母X , Y , Z 等表示随机变量,而随机变量的具体取值通常记为小写英文字母x , y , z .对于随机变量首先应掌握它的全部可能取值:如掷硬币,⎩⎨⎧=反面正面,0,1X ,X 的全部可能取值为0, 1;掷两枚骰子,X 表示掷出的点数之和,X 的全部可能取值为2, 3, 4, … , 12 ;观察某商店一小时内的进店人数X ,X 的全部可能取值为0, 1, 2, … ;电子元件使用寿命,用X 表示使用的小时数,X 的全部可能取值为 ),0[∞+; 一场足球比赛(90分钟),用X 表示首次进球时间(分钟),若为0:0,记X = 100,X 的全部可能取值为 (0, 90 )∪{100};注意:1. 每个样本点都必须对应于一个实数,2.不同样本点可以对应于同一个实数,3.随机变量的每一取值或取值范围都表示一个事件.应掌握将随机变量的取值或取值范围描述为事件,又能将事件用随机变量表达的方法. 例 掷一枚骰子,用X 表示出现的点数,则 X = 1表示出现1点;X > 4表示点数大于4,即出现5点或6点;X ≤ 0为不可能事件.又出现奇数点,即X = 1, 3, 5;点数不超过3,即X ≤ 3. 例 X 表示商店一天中某商品的销售件数(顾客的需求件数), 则 X = 0表示没有销售;X ≤ 10表示销售不超过10件.又销售5件以上(不含5件)即X > 5;若该商店准备了a 件该商品,事件“能满足顾客需要”,即X ≤ a . 例 X 表示一只电子元件的使用寿命(小时), 则 X = 1000表示该元件恰好使用了1000小时,X ≥ 800表示该元件使用寿命在800小时以上. 例 90分钟足球比赛,X 表示首次进球时间(分钟),且0:0时,记X = 100, 则 X = 10表示上半场第10分钟首次进球.又上半场不进球即X > 45;开场1分钟内进球即X ≤ 1.如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.(注:可列个即可以排成一列,一个一个往下数,如非负整数0, 1, 2, 3, … )离散型随机变量的全部可能取值是实数轴上一些离散的点,而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并,如电子元件使用寿命X (小时),全部可能取值是),0[∞+.下面按离散型和连续型分别进行讨论.2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率.定义 如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.设离散型随机变量X 的全部可能取值为x 1, x 2, …, x k , …,则X 取值x k 的概率p k = p (x k ) = P {X = x k }, k = 1, 2, …… 称为离散型随机变量的概率分布函数(Probability Distribution Function ,PDF ),简称概率分布或概率函数.直观上,又写为L LLL)()()(2121k kx p x p x p Px x x X 或 ⎟⎟⎠⎞⎜⎜⎝⎛L L L L)()()(~2121k k x p x p x p x x x X , 称为X 的概率分布列.如掷一枚骰子,X 表示出现的点数,X 的分布列为616161616161654321PX . 概率函数基本性质:(1)非负性 p (x k ) ≥ 0 , k = 1, 2, ……; (2)正则性1)(1=∑∞=k kxp .这是因为事件X = x 1 , X = x 2 , … , X = x k , … 是一个完备事件组, 故P {X = x 1} + P {X = x 2} + … + P {X = x k } + … = P (Ω) = 1,即p (x 1) + p (x 2) + … + p (x k ) + … = 1. 例 设盒中有2个红球3个白球,从中任取3球,以X 表示取得的红球数.求X 的分布列. 解:X 的全部可能取值0, 1, 2 ,样本点总数为1035=⎟⎟⎠⎞⎜⎜⎝⎛=n ,X = 0表示“取到3个白球”,所含样本点个数为1330=⎟⎟⎠⎞⎜⎜⎝⎛=k ,有1.0101)0(==p , X = 1表示“取到1个红球2个白球”,所含样本点个数为612231=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有6.0106)1(==p , X = 2表示“取到2个红球1个白球”,所含样本点个数为322132=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有3.0103)2(==p . 故X 的分布列为3.06.01.0210P X.求离散型随机变量X 的概率分布步骤: (1)找出X 的全部可能取值,(2)将X 的每一取值表示为事件, (3)求出X 的每一取值的概率.例 现有10件产品,其中有3件不合格.若不放回抽取,每次取一件,直到取得合格品为止.用X 表示抽取次数,求X 的概率分布. 解:X 的全部可能取值1, 2, 3, 4 ,X = 1表示“第1次就取得合格品”,有107)1(=p , X = 2表示“第2次取得合格品且第1次是不合格品”,有30797103)2(=⋅=p , X = 3表示“第3次取得合格品且前两次是不合格品”,有12078792103)3(=⋅⋅=p , X = 4表示“第4次取得合格品且前三次是不合格品”,有1201778192103)4(=⋅⋅⋅=p , 故X 的分布列为120112073071074321PX . 例 上例若改为有放回地抽取,又如何? 解:X 的全部可能取值1 , 2 , … , n , … ,7.0107)1(==p ,21.0107103)2(=⋅=p ,7.03.0)3(2×=p ,…,7.03.0)(1×=−k k p ,…, 故X 的概率函数为L ,2,1,7.03.0)(1=×=−k k p k ;X 的分布列为LL L L 7.03.07.03.021.07.032112××−k PkX .例 若离散型随机变量的概率函数为kCk p =)(,k = 1, 2, 3, 4,且C 为常数. 求:(1)C 的值,(2)P {X = 3},(3)P {X < 3}.解:(1)由正则性知:1432)4()3()2()1(=+++=+++CC C C p p p p ,即11225=C ,故2512=C .(2)254)3(}3{===p X P , (3)25182562512)2()1(}3{=+=+=<p p X P . 2.1.3.随机变量的分布函数连续型随机变量在单个点取值概率为零,如电子元件使用寿命恰好为1000小时这个事件的概率就等于零,因此连续型随机变量不能考虑概率函数.为了用单独一个变量表示一个区间,特别地取区间 (−∞, x ].定义 随机变量X 与任意实数x ,称F (x ) = P {X ≤ x },−∞ < x < +∞为X 的累积分布函数(Cumulative Distribution Function ,CDF ),简称分布函数.P {a < X ≤ b } = P {X ≤ b } − P {X ≤ a } = F (b ) − F (a ),P {X > a } = 1 − P {X ≤ a } = 1 − F (a ),由概率的连续性知)0()(lim }{lim }{−==≤=<−−→→a F x F x X P a X P ax ax ,且P {X = a } = P {X ≤ a } − P {X < a } = F (a ) − F (a – 0),可见X 在任一区间上或任一点取值的概率都可用分布函数表示. 例 已知随机变量X 的分布列为3.05.02.0210PX ,求X 的分布函数.解:X 的全部可能取值为0, 1, 2,当x < 0时,F (x ) = P {X ≤ x } = P (∅) = 0, 当0 ≤ x < 1时,F (x ) = P {X ≤ x } = p (0) = 0.2,当1 ≤ x < 2时,F (x ) = P {X ≤ x } = p (0) + p (1) = 0.7, 当x ≥ 2时,F (x ) = P {X ≤ x } = P (Ω ) = 1,故⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.2,1,21,7.0,10,2.0,0,0)(x x x x x F若离散型随机变量的全部可能取值为x 1, x 2, ……,概率函数p (x k ) = p k ,k = 1, 2, ……,则分布函数∑≤=≤=xx kk xp x X P x F )(}{)(.且离散型随机变量的分布函数F (x )是单调不减的阶梯形函数,X 的每一可能取值x k 是F (x )的跳跃点,跳跃高度是相应概率p (x k ).例 已知某离散型随机变量X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤−−<=,5,1,52,6.0,20,4.0,01,3.01,0)(x x x x x x F 求X 的分布列. 解:X 的全部可能取值是F (x )的跳跃点,即 −1, 0, 2, 5,跳跃高度依次为:p (−1) = 0.3 − 0 = 0.3; p (0) = 0.4 − 0.3 = 0.1; p (2) = 0.6 − 0.4 = 0.2; p (5) = 1 − 0.6 = 0.4.故X 的分布列为4.02.01.03.05201PX −.分布函数的基本性质:(1)单调性,F (x ) 单调不减,即x 1 < x 2时,F (x 1) ≤ F (x 2); (2)正则性,F (−∞) = 0,F (+∞) = 1;(3)连续性,F (x ) 右连续,即)()(lim 00x F x F x x =+→. 证:(1)当x 1 < x 2时,{X ≤ x 1} ⊂ {X ≤ x 2},有F (x 1) ≤ F (x 2);(2)F (−∞) = P {X < −∞} = P (∅) = 0,F (+∞) = P {X < +∞} = P (Ω ) = 1;(3)任取单调下降且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n ≤=≤=≤∞=∞→I ,根据概率的连续性知}{}{}{lim 01x X P x X P x X P n n n n ≤=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→I ,即)()(lim 00x F x F x x =+→. 但F (x )不一定左连续,任取单调增加且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n <=≤=≤∞=∞→U ,得}{}{}{lim 01x X P x X P x X P n n n n <=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→U , 故}{)(}{)(lim 0000x X P x F x X P x F x x =−=<=−→.2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点,连续型随机变量的全部可能取值是实数区间.但连续型随机变量在单独一个点取值的概率为0,其概率函数无实际意义,对于连续随机变量通常考虑其在某个区间上取值的概率,这就需要讨论分布函数.连续型随机变量的分布函数是连续函数. 注意:概率为0的事件不一定是不可能事件.定义 随机变量X 的分布函数F (x ),若存在函数p (x ),使 ∫∞−=xdu u p x F )()(,则称X 为连续型随机变量,p(x )为X 的概率密度函数(可以理解为:p (u )为概率密度,p (u )du 为X 在该小区间内取值的概率,∫∞−x 为从−∞ 到x 无限求和.几何意义:在平面上作出密度函数p (x )的图形,则阴影部分的面积即为F (x )的值.密度函数基本性质:(1)非负性 p (x ) ≥ 0;(2)正则性 1)(=∫∞+∞−dx x p .因)()(x F du u p x =∫∞−,有1)()(=+∞=∫∞+∞−F dx x p .连续型随机变量的性质:设连续型随机变量X 的概率密度函数为p (x ),分布函数为F (x ),则有 (1)∫=−=≤<21)()()(}{1221x x dx x p x F x F x X x P ;(2)当p (x ) 连续时,p (x ) = F ′(x ); 因∫∞−=x du u p x F )()(,当p (x ) 连续时,有)(])([)(x p du u p x F x=′=′∫∞−(3)X 在单独一个点取值的概率为0,其分布函数为连续函数;(4)P {x 1 < X ≤ x 2} = P {x 1 ≤ X ≤ x 2} = P {x 1 < X < x 2} = P {x 1 ≤ X < x 2},即连续型...随机变量在某区间内的概率与区间开闭无关,离散型则不成立;(5)只在有限个点上取值不相同的密度函数对应于同一个分布函数,一般,只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数.例 设F (x ) = A + B arctan x 为某连续型随机变量X 的分布函数. 求:(1)A , B ; (2)}31{≤≤−X P ; (3)密度函数p (x ). 解:(1)由正则性 F (−∞) = 0,F (+∞) = 1,得:02π)arctan (lim =−=+−∞→B A x B A x ,12π)arctan (lim =+=++∞→B A x B A x ,故21=A ,π1=B ;(2)x x F arctan π121)(+=,得1274ππ1213ππ121)1()3(}31{=⎥⎦⎤⎢⎣⎡⎟⎠⎞⎜⎝⎛−⋅+−⎟⎠⎞⎜⎝⎛⋅+=−−=≤≤−F F X P . (3)密度函数)1π(1)()(2x x F x p +=′=.例 已知⎩⎨⎧<<−=,,0,10),()(32其它x x x C x p是某连续型随机变量X 的密度函数,求:(1)C , (2)}211{<<−X P , (3)分布函数F (x ).解:(1)由正则性:1)(=∫∞+∞−dx x p ,得1120)4131()43()(10431032==−−=−=−∫C C x x C dx x x C ,故C = 12;(2)165)641241(12)43(12)(12)(}211{2104321032211=−=−=−==<<−∫∫−x x dx x x dx x p X P ;(3)X 的全部可能取值为 [0, 1],分段点0, 1,当x < 0时,0)()(==∫∞−xdu u p x F ,当0 ≤ x < 1时,4304303234)43(12)(12)()(x x u u du u u du u p x F xxx−=−=−==∫∫∞−,当x ≥ 1时, 1)(12)()(132=−==∫∫∞−du u u du u p x F x,故⎪⎩⎪⎨⎧≥<≤−<=.1,1,10,34,0,0)(43x x x x x x F例 已知⎩⎨⎧<<−=,,0,11|,|)(其它x x x p是某连续型随机变量X 的密度函数,求分布函数F (x ).解:分段点−1, 0, 1,当x < −1时,0)()(==∫∞−xdu u p x F ;当−1 ≤ x < 0时, 212122)()()(22121x x u du u du u p x F xxx−=+−=−=−==−−∞−∫∫; 当0 ≤ x < 1时,21221022)()()(220212001x x u u udu du u du u p x F xxx+=++=+−=+−==−−∞−∫∫∫;当x ≥ 1时, 1)()()(101=+−==∫∫∫−∞−udu du u du u p x F x.故⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤+<≤−−<=.1,1,10,21,01,21,0,0)(22x x x x xx x F§2.2 随机变量的数学期望对于随机变量,还应当掌握反映其平均值、分散程度等的指标,这就需要引入数学期望和方差等概念. 2.2.1.数学期望的概念例 甲、乙两个射击选手,在射击训练中甲射了10次,其中3次10环,1次9环,4次8环,2次7环;乙射了15次,其中2次10环,9次9环,2次8环,2次7环.问谁的表现更好? 分析:比较他们射中的平均环数甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环,平均每次射中5.81085=环; 乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环,平均每次射中73.815131=&环. 故乙的表现更好.一般地,若在n 次试验中,出现了m 1次x 1,m 2次x 2,…,m k 次x k ,(其中m 1 + m 2 + … + m k = n ),则平均值为∑==+++ki i i k k n mx n x m x m x m 12211L ,即平均值等于取值与频率乘积之和.因n 很大时,频率稳定在概率附近,即平均值将稳定在取值与概率乘积之和附近. 2.2.2.数学期望的定义定义 设离散型随机变量X 的分布列是⎟⎟⎠⎞⎜⎜⎝⎛L L L L )()()(~2121k kx p x p x p x x x X ,如果级数∑∞=1)(k k k x p x 绝对收敛,则称之为X 的数学期望(Expectation ),记为E (X ). 数学期望的实际意义是反映随机变量的平均取值,是其全部可能取值以相应概率为权数的加权平均.如X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−2.04.01.03.04102,则E (X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6. 例 某人有4发子弹,现在他向某一目标射击,若命中目标就停止射击,否则直到子弹用完为止.设每发子弹命中率为0.4,以X 表示射击次数,求E (X ). 解:先求X 的分布列,X 的全部可能取值为1, 2, 3, 4,X = 1,第一枪就命中, p (1) = 0.4;X = 2,第一枪没有命中,第二枪命中,p (2) = 0.6 × 0.4 = 0.24; X = 3,前两枪没有命中,第三枪命中,p (3) = 0.6 2 × 0.4 = 0.144; X = 4,前三枪没有命中, p (4) = 0.6 3 = 0.216.则X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛216.0144.024.04.04321,故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176.例 若X 的概率函数为L ,2,1,21)2(==⎟⎟⎠⎞⎜⎜⎝⎛−k kp k k,求E (X ). 解:因∑∑∞=∞=−=⋅−11)1(21)2(k kk k k k k 收敛但不是绝对收敛,故E (X ) 不存在.离散型随机变量的数学期望是取值乘概率求和:∑∞=1)(k k k x p x ,类似可定义连续型随机变量的数学期望是取值乘密度积分:∫+∞∞−dx x xp )(.定义 设连续型随机变量X 的密度函数为p (x ).如果广义积分∫+∞∞−dx x xp )(绝对收敛,则称之为X 的数学期望,记为E (X ).例 已知连续型随机变量X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其它x x x p 求E (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xp X E . 例 已知X 的密度函数为⎩⎨⎧<<+=.,0,20,)(其它x bx a x p 且32)(=X E ,求a , b . 解:由正则性得122)2()()(2220=+=⋅+=+=∫∫∞+∞−b a x b ax dx bx a dx x p ,又32382)32()()()(20322=+=⋅+⋅=+==∫∫∞+∞−b a x b x a dx bx a x dx x xp X E ,故21,1−==b a . 例 已知X 的密度函数为+∞<<∞−+=x x x p ,)1π(1)(2,求E (X ).解:因+∞∞−+∞∞−+∞∞−+∞∞−+=⋅+=+=∫∫∫)1ln(π21)(21)1π(1)1π()(2222x x d x dx x x dx x xp 发散, 故E (X )不存在. 2.2.3.数学期望的性质设X 为随机变量,g (x ) 为函数,则称Y = g (X ) 为随机变量函数,Y 也是一个随机变量.下面不加证明地给出随机变量函数的数学期望计算公式.定理 设X 为随机变量,Y = g (X ) 为随机变量函数,则(1)若X 为离散型随机变量,概率函数为p(x k ), k = 1, 2, …,则∑∞===1)()()]([)(k k k x p x g X g E Y E ;(2)若X 为连续型随机变量,密度函数为p (x ),则∫+∞∞−==dx x p x g X g E Y E )()()]([)(.数学期望具有以下性质:(1)常数的期望等于其自身,即E (c ) = c ;(2)常数因子可移到期望符号外,即E (aX ) = a E (X );(3)随机变量和的期望等于期望的和,即E [g 1 (X ) + g 2 (X )] = E [g 1 (X )] + E [g 2 (X )]. 证明:(1)将常数c 看作是单点分布p (c ) = 1,故E (c ) = c p (c ) = c ;(2)以连续型为例加以证明,)()()()(X aE dx x xp a dx x axp aX E ===∫∫+∞∞−+∞∞−;(3)以连续型为例加以证明,∫∫∫+∞∞−+∞∞−+∞∞−+=+=+dx x p x g dx x p x g dx x p x g x g X g X g E )()()()()()]()([)]()([212121= E [g 1 (X )] + E [g 2 (X )].由性质(2)、(3)知随机变量线性组合的期望等于期望的线性组合,可见数学期望具有线性性质. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−3.04.01.02.02101, 求E (2X +1),E (X 2).解:E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6;E (X 2) = 1 × 0.2 + 0 × 0.1 + 1 × 0.4 + 4 × 0.3 = 1.8. 例 已知圆的半径X 是一个随机变量,密度函数为⎪⎩⎪⎨⎧<<=.,0,31,21)(其他x x p 求圆面积Y 的数学期望. 解:圆面积Y = π X 2,故3π1332π21π)(π)(3133122=⋅=⋅==∫∫∞+∞−xdx x dx x p x Y E . 例 设国际市场对我国某种出口商品的需求量X (吨)的密度函数为⎪⎩⎪⎨⎧<<=.,0,40002000,20001)(其他x x p 设每售出一吨,可获利3万美元,但若销售不出,每积压一吨将亏损1万美元,问如何计划年出口量,能使国家获利的期望最大.解:设计划年出口量为a 吨,每年获利Y 万美元.当X ≥ a 时,销售a 吨,获利3a 万美元;当X < a 时,销售X 吨,积压a − X 吨,获利3X − (a − X ) = 4X − a 万美元;即⎩⎨⎧<≤−≤≤==.2000,4,4000,3)(a X a X X a a X g Y则4000200024000200020003)2(2000120001320001)4()()()(aa a a x a ax x dx a dx a x dx x p x g Y E +−=⋅+⋅−==∫∫∫+∞∞− 8250)3500(10001400071000122+−−=−+−=a a a , 故计划年出口量为3500吨时,使国家获利的期望最大.§2.3 随机变量的方差与标准差数学期望反映平均值,方差反映波动程度.如甲、乙两台包装机,要求包装重量为每袋500克,现各取5袋,重量为甲:498,499,500,501,502; 乙:490,495,500,505,510.二者平均值相同都是500克,但显然甲比乙好.此时比较的是它们的偏差(即取值与平均值之差).偏差:甲:−2,−1,0,1,2;乙:−10,−5,0,5,10. 2.3.1.方差的定义定义 随机变量X 与其数学期望E (X ) 之差X − E (X ) 称为偏差.偏差有大有小,可正可负,比较时需要去掉符号,但绝对值函数进行微积分处理不方便,因此考虑偏差平方的数学期望.定义 随机变量X ,若E [X − E (X )]2存在,则称之为X 的方差(Variance ),记为Var (X ) 或D (X ).即Var (X ) = E [X − E (X )]2.显然方差Var (X ) ≥ 0,称)Var(X 为X 的标准差(Standard Deviation ).在实际问题中,标准差与随机变量有相同的量纲.方差与标准差反映波动程度.方差越大,取值越分散;方差越小,取值越集中. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求E (X ), Var (X ).解:E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2;Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p求E (X ), Var (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xf X E ; 181949821949842)98382()()32()Var(1023410232=+−=⎟⎠⎞⎜⎝⎛+−=+−=−=∫∫∞+∞−x x x dx x x x dx x p x X .例 已知X 的全部可能取值为0, 1, 2,且E (X ) = 1.3,Var (X ) = 0.81.求X 的分布列.解:设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛c b a 210,由正则性得:a + b + c = 1,且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3,Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81, 解得a = 0.3,b = 0.1,c = 0.6,故X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛6.01.03.0210.2.3.2. 方差的性质方差具有以下性质:(1)方差计算公式:Var (X ) = E (X 2) − [E (X )]2; (2)常数的方差等于零,即Var (c ) = 0;(3)设a , b 为常数,则Var (a X + b ) = a 2 Var (X ). 证:(1)Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2.= E (X 2) − [E (X )]2;(2)Var (c ) = E [c − E (c )]2 = E (c − c )2 = E (0) = 0;(3)Var (a X + b ) = E [(a X + b ) − E (a X + b )]2 = E [a X + b − a E (X ) − b ]2 = a 2 E [X − E (X )]2 = a 2 Var (X ). 由性质(1),显然有以下推论:推论 对于随机变量X ,如果E (X 2) 存在,则E (X 2) ≥ [E (X )]2.以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差.通常用公式计算比直接用定义计算方差要方便. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求Var (X ).解:前面已求得E (X ) = 2.2,因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4, 故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p 求Var (X ).解:前面已求得32)(=X E , 因21422)(141022=⋅=⋅=∫x xdx x X E , 故1813221)]([)()Var(222=⎟⎠⎞⎜⎝⎛−=−=X E X E X . 对于随机变量X ,若方差Var (X ) 存在,且Var (X ) > 0.令)Var()(*X X E X X −=,有0)]()([)Var(1)]([)Var(1)Var()(*)(=−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=X E X E X X E X E X X X E X E X E ; 1)Var()Var(1)](Var[)Var(1)Var()(Var *)Var(==−=⎟⎟⎠⎞⎜⎜⎝⎛−=X X X E X X X X E X X .称X *为X 的标准化随机变量.2.3.3. 切比雪夫不等式方差反映随机变量的分散程度,切比雪夫不等式给出其定量标准.切比雪夫不等式表明大偏差概率的上限与方差成正比.定理 设X 为随机变量,且方差Var (X ) 存在,则对于任何正数ε ,都有2)Var(}|)({|εεX X E X P ≤≥−.证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫≥−=≥−εε|)(|)(}|)({|X E x dx x p X E X P ,且∫∞+∞−−=−=dx x p X E x X E X E X )()]([)]([1)Var(22222εεε,故222|)(|22)Var()()]([)()]([}|)({|εεεεεX dx x p X E x dx x p X E x X E X P X E x =−≤−≤≥−∫∫∞+∞−≥−,得证.注:切比雪夫不等式的等价形式2)Var(1}|)({|εεX X E X P −≥<−.如随机变量X 的数学期望为E (X ) = 10,方差Var (X ) = 1,则由切比雪夫不等式可得43211}2|10{|}128{2=−≥<−=<<X P X P . 例 设随机变量X 的全部可能取值为),0[∞+,且数学期望E (X ) 存在,试证:对任何正数a ,都有)(1}{X E aa X P ≤≥. 证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫+∞=≥a dx x p a X P )(}{,且∫∫+∞+∞∞−==0)()(1)(1dx x p a x dx x xp a X E a ,故)(1)()(}{0X E adx x p a x dx x p a x a X P a =≤≤≥∫∫+∞+∞,得证.定理 设随机变量X 的方差存在,则Var (X ) = 0的充分必要条件是存在常数b ,使得X 几乎处处收敛于b ,即P {X = b } = 1.证:充分性,设存在常数b ,使得P {X = b } = 1,有P {X ≠ b } = 0,即E (X ) = b P {X = b } = b ,故Var (X ) = E [X − E (X )]2 = E (X − b )2 = 0 × P {X = b } = 0; 必要性,设X 的方差Var (X ) = 0,因事件U +∞=+∞→⎭⎫⎩⎨⎧≥−=⎭⎬⎫⎩⎨⎧≥−=>−11|)(|lim 1|)(|}0|)({|n n n X E X n X E X X E X ,则01)Var(lim 1|)(|lim 1|)(|}0|)({|21=⎟⎠⎞⎜⎝⎛≤⎭⎬⎫⎩⎨⎧≥−=⎟⎟⎠⎞⎜⎜⎝⎛⎭⎬⎫⎩⎨⎧≥−=>−+∞→+∞→+∞=n X n X E X P n X E X P X E X P n n n U , 可得P {| X − E (X )| > 0} = 0,即P {| X − E (X )| = 0} = 1,取b = E (X ),有b 为常数, 故P {X = b } = 1.注:如果P {X = b } = 1,记为X = b , a.e.(或a.s.),称为X = b 几乎处处成立(或几乎必然成立).这里,a.e.就是almost everywhere 的缩写,a.s.就是almost surely 的缩写.意味着不成立的情况是一个测度(或概率)等于零的集合(或事件).§2.4 常用离散分布对于一个给定的函数,只要满足概率函数的两条基本性质:非负性、正则性,都可以成为某个离散随机变量的概率函数.但绝大多数在实际工作中并不常见,下面是几种常用的概率函数. 2.4.1.两点分布与二项分布一.两点分布两点分布只可能在两个点取值,通常就是0或1.定义 随机变量的可能取值只有两个:0或1,且概率函数为p (0) = 1 − p ,p (1) = p , 其中0 < p < 1,称X 服从两点分布(Two-point Distribution )或0-1分布,记为X ~ (0-1).分布列为⎟⎟⎠⎞⎜⎜⎝⎛−p p110. 两点分布实际背景是一次伯努利试验.通常描述为:X 表示一次伯努利试验中事件A 发生的次数.非负性:p (0) = 1 − p > 0,p (1) = p > 0; 正则性:(1 − p ) + p = 1. 两点分布的数学期望为E (X ) = 0 × (1 − p ) + 1 × p = p .又因E (X 2 ) = 02 × (1 − p ) + 12 × p = p ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p ).二.二项分布在n 重伯努利试验中,以X 表示事件A 的发生次数,则X 的全部可能取值为0, 1, 2, …, n ,且kn k p p k n k X P −−⎟⎟⎠⎞⎜⎜⎝⎛==)1(}{. 定义 若离散型随机变量X 的概率函数为kn k p p k n k p −−⎟⎟⎠⎞⎜⎜⎝⎛=)1()(, k = 0, 1, 2, …, n ;0 < p < 1, 则称X 服从二项分布(Binomial Distribution ),记为X ~ b (n , p ).二项分布的实际背景是n 重伯努利试验. 当n = 1时,二项分布就是两点分布.非负性:0)1()(>−⎟⎟⎠⎞⎜⎜⎝⎛=−kn k p p k n k p ; 正则性:1)]1([)1()(11=−+=−⎟⎟⎠⎞⎜⎜⎝⎛=∑∑=−=nnk k n k nk p p p p k n k p . 例 掷三枚硬币,X 表示正面朝上的次数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3 ,将掷每一枚硬币看作一次试验.每次试验两种结果:正面A ,反面A ;每次试验相互独立;每次试验概率5.0)(=A P . 即n 重伯努利试验,n = 3,5.0=p ,有X ~ b (3, 0.5),p (0) = 0.5 3 = 0.125,375.05.05.013)1(21=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 375.05.05.023)2(12=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (3) = 0.5 3 = 0.125.例 现有5台机床,每台机床一小时内平均开动18分钟,且是否开动相互独立,以X 表示同一时刻开动的机床数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3, 4, 5 ,将每台机床是否开动看作一次试验.每次试验两种结果:开动A ,不开动A ;每次试验相互独立;每次试验概率P (A ) = 0.3. 即n 重伯努利试验,n = 5,p = 0.3,有X ~ b (5, 0.3).p (0) = 0.7 5 = 0.16807,36015.07.03.015)1(41=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 3087.07.03.025)2(32=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 1323.07.03.035)3(23=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 02835.07.03.045)4(14=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (5) = 0.3 5 = 0.00243 .一般地,如果随机变量X 服从二项分布,概率函数值p (k ) 将随着k 的增加,先逐渐增加,达到最大值后,又逐渐减少.通常,一个随机变量X 的概率函数或密度函数的最大值点称为X 的最可能值.二项分布b (n , p )的最可能值为⎩⎨⎧+−++++=.)1(,1)1()1(,)1(],)1[(0是正整数时当或不是正整数时当p n p n p n p n p n k 这里[x ]表示不超过x 的最大整数.如[2.3] = 2,[3.14] = 3,[−1.2] = −2.证:若X ~ b (n , p ),有n k p p k n k n p p k n k p k n k kn k ≤≤−−=−⎟⎟⎠⎞⎜⎜⎝⎛=−−0,)1()!(!!)1()(, 则11)1()!1()!1(!)1()!(!!)1()(+−−−−+−−−−−=−−k n k k n k p p k n k n p p k n k n k p k p ⎟⎠⎞⎜⎝⎛+−−−⋅−−−=−−11)1()!()!1(!1k n p k pp p k n k n k n k)1()1()1()!()!1(!1+−−+⋅−−−=−−k n k k p n p p k n k n k n k , 当k < (n + 1) p 时,有p (k ) > p (k − 1);当k > (n + 1) p 时,有p (k ) < p (k − 1).如果(n + 1) p 不是正整数,取k 0 = [(n + 1) p ],有k 0 < (n + 1) p ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > (n + 1) p ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果(n + 1) p 是正整数,取k 0 = (n + 1) p ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值.如X ~ B (3, 0.5),有(n + 1) p = 4 × 0.5 = 2是正整数,最可能值k 0 = 2或1;X ~ B (5, 0.3),有(n + 1) p = 6 × 0.3 = 1.8不是正整数,最可能值k 0 = [1.8] = 1.三.二项分布的数学期望和方差组合数公式⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=−⋅−−⋅=−⋅=⎟⎟⎠⎞⎜⎜⎝⎛11)!()!1()!1()!(!!k n k n k n k n k n k n k n k n , (n ≥ k > 0). 二项分布b (n , p )的数学期望为∑∑∑=−−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅⋅=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k kn k nk k n k p p k n np p p k n k n k p p k n k X E 1110)1(11)1(11)1()( = np [ p + (1 − p )]n − 1 = np .又因∑∑∑=−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k k n k nk k n k p p k n k p p k n k k p p k n k X E 002022)1()1(11)()1()( )()1(22)1()1()(22X E p p k n k k n n k k nk k n k+−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=∑=− np p p k n pn n nk kn k +−⎟⎟⎠⎞⎜⎜⎝⎛−−−=∑=−−222)1(22)1( = n (n − 1) p 2 [ p + (1 − p )]n − 2 + np = (n 2 − n ) p 2 + np ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n 2 − n ) p 2 + np − (np )2 = − np 2 + np = np (1 − p ).2.4.2.泊松分布一.泊松分布泊松分布是一种理论推导的极限分布(成立的条件和推导过程见附录). 定义 若随机变量X 的概率函数为λλ−=e !)(k k p k, k = 0, 1, 2, …… ;λ > 0,则称X 服从参数为 λ 的泊松分布(Poisson’s Distribution ),记为X ~ P (λ).泊松分布的实际背景是已知平均发生次数为常数λ ,实际发生次数的概率分布.如足球比赛进球数,商店进店人数,电话接听次数等.非负性:λ > 0时,0e !>−λλk k;正则性:1e e e !=⋅=⋅−∞=−∑λλλλk kk .例 已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布,求比分为0:0, 1:0以及总进球数超过5个的概率.解:因X ~ P(2.5),则3.2e !3.2)(−=k k p k , k = 0, 1, 2, …….比分0:0,即X = 0,100.0e e !03.2)0(3.23.20===−−p (查表);比分1:0,即X = 1,231.0100.0331.0e 3.2e !13.2)1(3.23.21=−===−−p (查表);总进球数超过5个,即X > 5,030.0970.01e !3.21e!3.2}5{53.263.2=−=−==>∑∑=−∞=−k k k k k k X P (查表). 例 已知某公用电话每小时内打电话的人数X 服从参数为λ = 8的泊松分布.求某一小时内无人打电话的概率,恰有10人打电话的概率,至少有10人打电话的概率.解:因X ~ P(8),有8e !8}{−==k k X P k . 无人打电话的概率0003.0e e !08}0{880====−−X P ,恰有10人打电话的概率099.0717.0816.0e !108}10{810=−===−X P (查表),至少有10人打电话的概率283.0717.01}9{1e !8}10{108=−=≤−==≥∑∞=−X P k X P k k (查表). 例 已知某商店一天中某种贵重商品的销售件数X 服从泊松分布P (7),问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要?解:设准备了a 件该商品,X ~ P(7),则7e !7)(−=k k p k .事件“满足顾客需要”,即X ≤ a ,有P {X ≤ a } ≥ 0.999,故查表可得a = 16. 泊松分布P (λ )的最可能值为⎩⎨⎧−=.,1,],[0是正整数时当或不是正整数时当λλλλλk 证:若X ~ P(λ),有L ,2,1,0,e !)(==−k k k p kλλ,故k k k k k k k k p k p k k k k−⋅−=⎟⎠⎞⎜⎝⎛−⋅−=−−=−−−−−−−−−λλλλλλλλλλe )!1(1e )!1(e)!1(e !)1()(111,当k < λ 时,有p (k ) > p (k − 1);当k > λ 时,有p (k ) < p (k − 1).如果λ 不是正整数,取k 0 = [λ ] ,有k 0 < λ ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > λ ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果λ 是正整数,取k 0 = λ ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值. 二.泊松分布的数学期望和方差泊松分布P (λ )的数学期望为λλλλλλλλλλλ=⋅=−⋅=−=⋅=−∞=−−∞=−∞=−∑∑∑e e )!1(e e)!1(e!)(111k k k kk kk k k k X E ,即泊松分布的参数 λ 反映平均发生次数.又因)()!2(e e!e!)(e!)(222222X E k k k k k k k k X E k k k kk kk k+−⋅=⋅+⋅−=⋅=∑∑∑∑∞=−−∞=−∞=−∞=−λλλλλλλλλ= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ .三.二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题.下面的定理说明了二者之间的联系,泊松分布是二项分布的一种极限分布. 定理 (泊松定理)在n 重伯努利试验中,记事件A 在每次试验中发生的概率为与试验次数n 有关的数p n ,如果当n → +∞ 时,有n p n → λ ,则λλ−−+∞→=−⎟⎟⎠⎞⎜⎜⎝⎛e !)1(lim k p p k n k k n n k n n . 证:记λ n = n p n ,有λλ=+∞→n n lim ,因nk n n n kn n k n n n n n n p )(11)1(−−⋅−−−⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛−=−λλλλ,且e 1lim =⎟⎠⎞⎜⎝⎛−+−+∞→nnn n n λλ,λλ−=−−+∞→n k n n n )(lim , 则λλλλ−−−⋅−+∞→−+∞→=⎟⎠⎞⎜⎝⎛−+=−e 1lim )1(lim )(n k n n n n k n n n n n n p ,又因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛n k n k n k k n n n k n k 1111!!)1()1(L L ,且11111lim =⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−+∞→n k n n L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→−+∞→n k n p p k n p p k n k n nk n k n k n n k n n 1111)1(!lim )1(lim L λλ−+∞→−+∞→+∞→=⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅=e !1111lim )1(lim !)(lim k n k n p k np k n k n n n k n n L . 此定理表明对于二项分布b (n , p ),当n 很大,p 很小时,可用泊松分布P (λ ) 近似,其中λ = n p .例 某地区每年人口意外死亡率为0.0001,现有60000人投保人身意外保险,求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率.解:设X 表示“一年内因投保人意外死亡而赔付的人数”,X ~ B (60000, 0.0001).则5999289999.00001.0860000}8{××⎟⎟⎠⎞⎜⎜⎝⎛==X P ,∑=−××⎟⎟⎠⎞⎜⎜⎝⎛=≤50600009999.00001.060000}5{k kk k X P , 但显然计算很繁琐,为便于计算,用泊松分布近似.因n = 60000很大,p = 0.0001很小,λ = np = 6,有)6(~P X &,故103.0744.0847.0e !86}8{68=−=≈=−X P ,446.0e !6}5{506=≈≤∑=−k k k X P .2.4.3. 超几何分布一.超几何分布在N 件产品中,有M 件次品,从中不放回地取n 件,以X 表示取得的次品数.设X 取值为k ,一方面,显然有k ≤ n 且k ≤ M ,即k ≤ min{n , M },另一方面,有k ≥ 0且n − k ≤ N − M ,可得k ≥ M + n − N ,即k ≥ max{0, M + n − N }.这样X 的全部可能取值为l , l + 1, …, L ,其中l = max{0, M + n − N },L = min{n , M },且⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛==n N k n M N k M k X P }{.定义 若随机变量X 的概率函数为⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=n N k n M N k M k p )(,k = l , l + 1, …, L ,l = max(0, n + M − N ),L = min(M , n ),M < N ,n < N , 则称X 服从超几何分布(Hypergeometric Distribution ),记为X ~ h (n , N , M ).超几何分布的实际背景是古典概型中的不放回抽样检验问题. 注:有放回检验抽样问题对应的是二项分布.非负性:0>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛n N k n M N k M ;正则性:10=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑∑==n N n N n N k n M N k M n N k n M N k M Ll k L k .注:比较(1 + x )M(1 + x )N − M与(1 + x )N中x n的系数可以证明⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑=n N k n M N k M Ll k .例 一袋中有3个红球,2个白球,不放回地取出3个球,X 表示取得的红球数.求X 的概率分布.解:不放回抽样,N = 3,M = 2,n = 3,则X ~ h (3, 5, 3).故X 的全部可能取值为1, 2, 3, (l = max (0, n + M − N ) = 1,L = min(n , M ) = 3),3.0352213}1{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,6.0351223}2{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,1.0350233}3{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P . 超几何分布h (n , N , M )的最可能值为⎪⎩⎪⎨⎧+++−++++++++++++=.21)1(,121)1(21)1(,21)1(],21)1[(0是正整数时当或不是正整数时当N M n N M n N M n N M n N M n k证:若X ~ h (n , N , M),有)!()!()!()!(!!1)(k n M N k n M N k M k M n N n N k n M N k M k p +−−−−⋅−⋅⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=, 故p (k ) − p (k − 1))!1()!1()!1()!1()!(!)!()!()!(!)!(!−+−−+−+−−⎟⎟⎠⎞⎜⎜⎝⎛−−+−−−−⎟⎟⎠⎞⎜⎜⎝⎛−=k n M N k n k M k n N M N M k n M N k n k M k n N M N M)]()1)(1[()!()!1()!1(!)!(!k n M N k k n k M k n M N k n k M k n N M N M +−−−+−+−+−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=)]2()1)(1[()!()!1()!1(!)!(!+−+++−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=N k n M k n M N k n k M k n N M N M .当21)1(+++<N M n k 时,有p (k ) > p (k − 1);当21)1(+++>N M n k 时,有p (k ) < p (k − 1). 如果21)1(+++N M n 不是正整数,取21)1[(0+++=N M n k ,有21)1(0+++<N M n k ,即p (k 0) > p (k 0 − 1);且21)1(10+++>+N M n k ,即p (k 0 + 1) < p (k 0).故p (k 0) 为最大值.如果21)1(+++N M n 是正整数,取21)1(0+++=N M n k ,即p (k 0) = p (k 0 − 1),故p (k 0) 和p (k 0 − 1) 都是最大值. 二.超几何分布的数学期望和方差超几何分布h (n , N , M )的数学期望为N nM n N k n M N k M N nM n N n N k n M N k M k M k n N k n M N k M k X E Ll k L lk L l k =⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=∑∑∑===11111111)(, 又因∑∑∑===⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=L lk L l k Ll k n N k n M N k M k n N k n M N k M k k n N k n M N k M k X E )()(222 ∑=+⎟⎟⎠⎞⎜⎜⎝⎛−−−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=Llk X E n N n n N N k n M N k M k k M M k k )(22)1()1(22)1()1()(2N nM N N M M n n N nM n N k n M N k M N N M M n n Ll k +−−−=+⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−−−=∑=)1()1()1(2222)1()1()1(, 故方差为)1())(()1()1)(1()]([)()Var(222222−−−=−+−−−=−=N N n N M N nM N M n N nM N N M n nM X E X E X . 为了便于记忆,可将超几何分布与二项分布的数学期望和方差进行比较.二项分布b (n , p ):数学期望E (X ) = np ,方差Var (X ) = np (1 − p );超几何分布h (n , N , M ):数学期望N M nX E =)(,方差11)Var(−−⎟⎠⎞⎜⎝⎛−=N n N N M N M n X ; 可见分布h (n , N , M )中的N M 相当于二项分布b (n , p )中的p ,方差修正因子为1−−N nN . 三.超几何分布的二项近似直观上,当抽样个数n 远小于M 及N − M 时,不放回抽样问题可近似看作有放回抽样问题,也就是此时超几何分布可用二项分布近似.定理 如果当N → +∞ 时,p NM→, (0 < p < 1),则k n k N p p k n n N k n M N k M −+∞→−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛)1(lim . 证:因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛N n N n N n n N N N n N n 1111!!)1()1(L L , 且⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛M k M k M k M k 1111!L ,⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−=⎟⎟⎠⎞⎜⎜⎝⎛−−−M N k n M N k n M N k n M N kn 1111)!()(L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→+∞→N n N n N M N k n M N k n M N M k M k M n N k n M N k M n k n k N N 1111!1111)!()(1111!lim lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅−=−+∞→N n N M N k n M N M k M N M N M k n k n nk n k N 111111111111)()!(!!lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛=+∞→−+∞→N n N M N k n M N M k M N M N M k n N kn k N 111111111111lim 1lim L L L。
《概率论与数理统计》第二章1234节

以不是数;而普通函数是定义在实数域上的。 2. 随机变量函数的取值在试验之前无法确定,有一定
的概率;而普通函数却没有。
三、随机变量的分类
离散型随机变量 随机变量 非离散型随机变量 连续型随机变量
其它
第二、三节
第二章
离散型随机变量及其分布律
U{ X = 2 }U{ 2 < X < x }
则 F(x) = P{X = - 1}+ P{X = 2} = 0.4
④当 x³
3 时,{X £
x}为必然事件,
F ( x) 1
则 F(x) = 0.1+ 0.3 + 0.6 = 1
所以
F ( x)
=
ìïïïïïíïïïïïî
0, 0.1, 0.4, 1,
两次,由于 P{X < 2} ? 0.003 很小,故怀疑“命中率
0.02”是否为真,即他的命中率不到0.02。
注:二项分布是最重要的离散型概率分布之一,当
n = 1 时,即为(0—1)分布;当 n很大,p很小时,
二项分布近似于下面介绍的泊松分布。
Ⅲ. 泊松分布 定义1. 设随机变量X 所有可能取的值为0,1,2,…,而
2. 二项分布
引例:某人打靶单发命中率为
击3次,求恰好命中2发的概率。 解 表示“第i次命中 ” 表示“恰好命中两次”
现独立重复射
由此可得: n重伯努利试验中,“事件 恰好发生k次”,即
的概率为:
定义2.如果随机变量 的分布律为
其中 布,记为
容易验证
则称 服从参数为 的二项分 由二项式定理
特别,当 时,二项分布为 这就是(0—1)分布,常记为
概率论与数理统计笔记(重要公式)

r = A 中样本点数 / Ω 中样本点总数 n
= A 所包含的基本事件数 / 基本事件总数 条件概率:
对偶律: A B = A B , P ( AB ) 设 A, B 是两个事件, 且 P(B)>0, 称 P(A|B)= 为 贝叶斯公式: P( B) 在事件 B 发生条件下事件 A 发生的条件概率。显然, 当 P(A)>0 时,P(B|A)=
二项分布 X ~ B(n, p): 指数分布 X ~ E(λ) 若随机变量 X 只取两个可能值 0, 1, …, n, 而 X 的分布律为 e x x 0 若随机变量 X 的概率密度为 f ( x) k k nk pk =P {X= xk }= Cn p q , k=0, 1, 2, …, n, x0 0
设 X 为离散型随机变量, 可能取值为 x1, x2, …, xk, … 且 P 概率密度的性质: (1) f(x)≥0 {X= xk }= pk, k=1, 2, …, 则称{pk}为 X 的分布律 表格形式: f ( x)dx =1 (2) X x1, x2, …, xk, … b P p1, p2, …, pk, … (3) P{a<X≤b}= F(b)-F(a)= f ( x)dx , a≤b a {pk}性质: (4) 设 x 为 f(x)的连续点,则 F’(x)存在,且 (1) pk≥0, k=1, 2, … F’(x)= f(x) (2) pk =1 均匀分布 X ~ U (a, b) k 1 若随机变量 X 的概率密度为 在求离散型随机变量的分布律时,首先要找出其所有可能 1 , a≤x≤b 的取值,然后再求出每个值相应的概率 ba f(x) = 在实际应用中,有时还要求“X 满足某一条件”这样事件的 概率, 求法就是把满足条件的 xk 所对应的概率 pk 相加可得 0, 其他 则称 X 服从区间[a,b]上的均匀分布,其分布函数为 其分布函数 F(x) = pk xk x 0, x≤a 0-1 分布: xa F(x) = , a<x<b 若随机变量 X 只取两个可能值 0, 1,且 ba P {X=1}=p, P{X=0}=q 1, x≥b 其中 0<p<1, q=1-p, 则称 X 服从 0-1 分布. X 的分布律为 设 X ~ U (a, b), a≤c<d≤b,即[a,b] [c,d],则 X 0 1 d c P{c≤X≤d}= P q p ba
概率论第二章知识点

第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =两点分布的方差:()(1)D X p p =-(2)二项分布: 若一个随机变量X 的概率分布由式{}(1),0,1,...,.k k n k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k e k k λλλ-==>=则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k e k k λλλ-==>=泊松分布的期望:()E X λ=泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt -∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度: 均匀分布的期望:()2a bE X +=均匀分布的方差:2()()12b a D X -=(2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩则称X 服从参数为λ的指数分布,记为 X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a ab x f ⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a ab x f指数分布的期望:1()E X λ=指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X 的概率密度为22()21()x f x ex μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()21()x f x ex μσ--=-∞<<+∞正态分布的期望:()E X μ=正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==2222()()x t xx ex e dt ϕφ---∞=⎰标准正态分布表的使用: (1)0()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数:设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
概率论与数理统计(经管类)第二章知识点总结

第二章 随机变量及其概率分布1. 离散型随机变量()01k K K KP X x p p ==≥⎧⎪⎨=⎪⎩∑ 例1 设 ,则3.02.05.01=--=c------------------------------------------------------------------------------------------------ 8.知识点:离散型随机变量的分布律性质下列各表中可作为某随机变量分布律的是( ) A . B .C .D .答案:C解:A 事件概率不可能为负值 B ,D1i iP ≠∑返回:第二章 随机变量及其概率分布------------------------------------------------------------------------------------------------2.常见离散型随机变量(1)0—1分布:设X ~),1(p B ,则应用背景:一次抽样中,某事件A 发生的次数X ~),1(p B ,其中EX X P A P p ====)1()(例2 设某射手的命中率为p ,X 为其一次射击中击中目标的次数,则X ~),1(p B(2)二项分布:设X ~),(p n B ,则()(1),0,1,2,,k k n kn P X k C p p k n -==-=应用背景:n 次独立重复抽样中某事件A 发生的次数X ~),(p n B ,其中()p P A =为事件A 在一次抽样中发生的概率。
例3 某射手的命中率为0.8,X 为其5次射击中命中目标的次数,则X 取的可能值为5,,1,0 ,52()0.80.2k k k P X k C -==,即X ~)8.0,5(B记住:若X ~),(p n B ,则np EX =,)1(p np DX -=------------------------------------------------------------------------------------------------ 9.知识点:事件的关系及二项分布设每次试验成功的概率为)10(<<p p ,则在3次独立重复试验中至少成功一次的概率为( ) A .3)1(1p -- B .2)1(p p - C .213)1(p p C -D .32pp p ++答案:A解: 利用对立事件求解。
概率论与数理统计总结之第二章

第二章 随机变量及其分布第一节 离散型随机变量离散型随机变量:若随机变量的取的值是有限个或可列无限多个,就叫做离散型随机变量 离散型随机变量的分布律:1)等式形式{},1,2,===k k P X x p k 且11∞==∑kk p2)表格形式:分布律性质:1. 0,1,2.....≥=k p k 2. 11∞==∑kk p步骤:1.找到所有可能取值2.算出每种取值的概率3.概率相加为1 方法:1.定取值:取值点就是分断点.2.概率:挨着减.3.三种重要的离散型随机变量: 1.(0-1)分布{}1(1),0,1(01)-==-=<<k k P X k p p k p2.二项分布(,)XB n p1)背景:独立地重复进行n 次实验,成功的次数服从二项分布. 2)若(,)XB n p ,则1(,1)--XB n p定义:若随机变量X 的可能有取值为0.1.2…n,而X 的分布律为()(1),0,1,2,...-==-=k kn k n P X k C p p k n其中01,1<<+=P p q 则称X 服从参数为n,p 的二项分布,记为(,)X B n pn 重伯努利试验伯努利试验:设试验E 只有两个可能结果:A 及A ,则称E 为伯努利试验,设P(A)=p(0<p<1),此时P(A )=1-p. 二项分布的应用:产品的合格与不合格,机器故障等 3.泊松定理:当X 服从二项分布,(,)XB n p ,若:lim 0(为常数),λλ→+∞=>n n np 则有:2lim ()(1),0,1,2,...!()λ--→+∞==-==k kk n knn e P X k C p p k n k泊松分布X ~P(λ)设随机变量X 所以可能取的值为0,1,2,…,而取各个值的概率为{}!λλ-===k k e p P X k k ,k=0,1,2,……其中λ>0是常数,则称X 服从参数为λ的泊松分布,记为X ~P(λ) 泊松分布的应用:某一时段时段内某一事件所发生的次数 第二节 非离散型随机变量:非离散型随机变量取任一指定点的实数值的概率都等于01.分布函数:设X 是一个随机变量,x 是任意实数,函数F(x)=P{X ≤x},(,)∈-∞+∞x 称为X 的分布函数 对于任意实数1x ,2x (1x <2x ),有122121{}{}{}()()<≤=≤-<=-P x X x P X x P X x F x F x随机变量的分布函数:定义:设X 是一个随机变量,对于任意实数x,令{}(),=≤-∞<<+∞F x P X x x 称()F x 为随机变量的概率分布函数,简称分布函数.利用分布函数()=X f x 求各种随机事件的概率: 1.{}()≤=P X a F a2.{}{}11()>=-≤=-P X a P X a F a3. {}(0)lim ()-→<=-=x aP X a F a F a 4. {}{}11(0)≥=-<=--P X a P X a F a5. {}{}{}()(0)==≤-<=--P X a P X a P X a F a F a6. {}{}{}()()<≤=≤-≤=-P a X b P X b P X a F b F a7. {}{}{}(0)(0)≤<=<-<=---P a X b P X b P X a F b F a8. {}{}{}(0)()<<=<-≤=--P a X b P X b P X a F b F a 9.{}{}{}()(0)≤≤=≤-<=--P a X b P X b P X a F b F a2. 分布函数的基本性质: 1) 非负性:0()1≤≤F x2) 规范性:()lim ()0,()lim ()1→-∞→+∞-∞==+∞==x x F F x F F x3) 单调不减性:对任意1212,()()<≤x x F x F x (函的的单调性判断可通过求导:导数大0,增,小于0,减) 4) 右连续性:()(0)lim ()()+→=+=+=x F x F x F x x F x性质2.4可用来确定分布函数中的未知参数.(只要分布函数含有未知参数,就用这两条来推得) 1.2.3.4是一个函数能够成为某一随机变量分布函数的充要条件.(4条共用以判定是否为分布函数)已知X 的分布函数F(x),可求出:{}{}{}()()()1()≤=<≤=->=-P X b F b P a X b F b F a P X b F b第三节 连续型随机变量1. 连续型随机变量及其概率密度定义:若对于随机变量X 的分布函数F(x),存在非负函数f(x),使对于任意实数x 有()()-∞=⎰xF x f t dt,则称X 为连续型随机变量, 概率密度的性质:1.f(x)≥0,(-∞≤≤+∞x )(非负性)2.()1∞-∞=⎰f x dx (规范性)(作用:可用来定义未知参数)(介于()=y f x 与X 轴之间在面积等G .)(1.2是判断一个函数是否是密度函数的充要条件) 3.{}()()(),<≤=-=≤⎰ba P a Xb F b F a f x dx a b(作用:求概率)(落在区间(a.b ]的概率是曲边梯形的积) (不论区间开闭,都一样,离散型无这性质) 4.分布函数()()-∞=⎰x F x f t dt是连续函数.5.连续型随机变量在任意点0x 取值概率0{}0==P X x6.若f(x)在点x 处连续,则有F ′(x)=f(x)(结合变上限积分的求导法则()*()()()-∞'==⎰xf x f t dtF x )(可用于已知分段函数求概率密度) 注意: 1.()()-∞=⎰x F t f t dt()F t 一定连续,但()f t 不一定连续.2. 0()1≤≤F x ()f x 不是概率,概率密度.()∆f x x 是概率.3. ()f x 大小可以反映概率的大小.当()f x 为分段函数时,F(x)也是分段函数,二者有相同的分段点. 均匀分布~(a,b)X U密度函数 1,,()0,其它⎧≤≤⎪-⎨⎪⎩a xb f x b a~(a,b)X U ,≤<≤a c d b ,则()-<<=-d c P c x d b a分布函数0,F(),,0,其它<⎧⎪-⎪≤≤⎨-⎪⎪⎩x a x a x a x b b a指数分布~()λX E密度函数 ,0(),0,0λλ-⎧>=⎨≤⎩x e x f x x分布函数1,0(),0,0λ-⎧->=⎨≤⎩x e x F x x正态分布2~(,)μσX N )密度函数22()21(),,2μσπσ--=-∞<<∞x f x ex标准正态~(0,1)X N概率密度 ()ϕx =2212πx e ,(-∞<<∞x )分布函数()Φx =2212π-∞⎰t xe dt (-∞<<∞x )正态分布曲线的性质:a) 曲线关于直线=x u 对称.对于任何0>h ,有:{}{},-<≤=≤<+P u h X u P u X u hb) 当=x u 取到最大值的时候,1(),2πσ=f u 在σ=±x u 处,曲线有拐点,曲线以x 轴为渐近线.c) 当σ取定,12<u u 时,212222()21()221()21()2μσμσπσπσ----==x x f x ef x e两条曲线可互相沿着X 轴平行移动而得,不改变形状,可见正太分布典线的位置完全由u 决定.d) 当u 取定,12σσ<时,221222()231()2421()21()2μσμσπσπσ----==x x f x ef x e可见,当σ越小,图形越尖锐.σ越大,图形越平缓,可见σ值刻画了正态随机变量取值的分散程度,σ越小分散程度越小,σ越大分散程度越大.其分布函数为:22()21()2μσπσ--=-∞⎰t x F x e dt()ϕx 的图形关于Y 轴对称.()ϕx 在x =0时取得最大值12π.特例:2()-∞=-∞⎰x F x e dx (2=tx )222()()22()212212πππ---∞∞⇒⇒-∞-∞∞⇒⇒-∞⎰⎰⎰t t t ted e dte dt标准正态分布函数的性质: a) ()1()Φ-=-Φx x b) ()()ϕϕ-=x x c)1(0)2Φ=d) {}2()1≤=Φ-P X a a 解决正态分布的步骤:1) 正态标准化. 一般分布:X ~N(μ,2σ)通过线性变换:σ-=x uz 化成标准正态.2) 利用标准正态的对称性 3) 查表计算引理:若X ~N(μ,2σ),其分布函数为F(x),则: 1.{}()()σ-=≤=Φx uF x P X x (从一般正态到标准正态)2.{}{}{}{}()()σσ<≤=≤≤=≤<--=<<=Φ-ΦP a X b P a X b P a X b b ua uP a X b3. {}{}1()σ->=≥=-Φa uP X a P X a第四节 随机变量函数的概率分布1. 离散型随机变量函数的概率分布概率对应 顺序重排2. 连续型随机变量函数的概率分布其概率密度为 '[()](),(),0,其他αβ⎧<<⎪=⎨⎪⎩X Y f h y h y y f y()h y 是根据()=Y g x 所求得的反函数()=x h y()'h y 是对反函数求导。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=
为y= 的值域,,(公式法)
例:某路口红绿灯交替显示30秒,一司机驾车经过该路口,X表示 该司机的等待时间,求X的分布 解:不妨设前30秒为红灯,后30秒为绿灯,切该司机的到达时、刻 为y~U[0,60],由F(x)=P(Xx) (1)当x<0时,F(x)=0 (2)当x=0时,F(x)=P(X=0)=P= (3)当x30时,F(x)=1 (4)当0<x<30时,F(x)=P=P+P === 3、正太分布 定义:若r .v .X密度函数为f(x)=,,则称r .v .X服从参数为和的正态分 布,记作:X~N(,) [注]:1、密度曲线 2、当=0,=1时,N(0,1)称为标准正态分布 设X~N() 考虑F(x)=P(X)=dt 令 得dz= 定理:若r .v .X ~N(),则F(x)= 推论:若r .v . X ~N(),则~N(0,1) 例:设r .v .X ~N(),求P 解:P=P==
P 1—P P 则X服从0—1分布 2.二项分布 例:在n重贝努里试验中,事件A在每次试验中发生的概率为 P(0<p<1),X为事件A发生的次数,则X的分布律为:P(X=K)= K=1.2…..n [分析]:设:事件A在第i次试验中发生 i=1,2,…..n {X=K}= 所以 [注]:1.如果r .v .X 的分布列为 k=0.1……n 则称r .v . X服从参数为n .p 的二项分布,记作X~B(n , p) 2.如何判断? (1)离散型 (2)取值为0.1.2…..n (3)一个试验中出现两个对立的结果 (4)独立性 (5)等可能性 例、求每10个人中至少有2个人生日在一季度的概率。 解:设每10个人中生日在一季度的人数为X~B(10, ) 则所求概率为P(X2) = 1- P(X<2) = 1- P(X=0)-P(X=1) = 13.当n=1时,X~B(1,P)即为0-1分布 二项分布与(0-1)分布的关系: 不妨设为第i次试验中事件A发生的次数,i=1,2,3,……,n. 则~B(1,P),,,……,独立,且X=~B(1,P). 定理:(泊松定理)设r.v.X~ B(n,) 【与n有关】 若n=l,则= 【注】:1.若n充分大,P充分小,只要np较适中,记np=l>0 则 2.若r.v.X的分布列为P(X=k)= ,k=0,1,2,……(l>0),则称 r.v.X服从参数为l X~P(l) 3.泊松分布可以看成二项分布的泊松近似。 4.一般当n20,p0.05时,用泊松近似计算。
第二节 离散型r .v .及其分布
一.基本概念
定义:设X为样本空间的随机变量,若存在一个有限或可列无限集B, 使得P{XB}=1则称X为离散型r . v . 设其所有可列取值为{} K=1.2.3…… n…则=(X=) K=1.2.3…..n…则称为X的概率分布列 [注]:1.概率分布列是描述离散型随机变量的概率分布的方法之一 2.分布列表 X ….. ….. P …… …… 分布矩阵 3.非负性:>0.k=1.2….. 归一性:=1 4.求离散型r . v . 分布列的步骤 Step1:列出r . v . X的所有可能取值 Step2:计算几个取值对应的概率 例:甲乙两队进行比赛,规定谁先赢三局获胜。甲每局获胜概率0.5 X 表示比赛的局数,求X的分布 解:随机变量X的所有可能取值:3.4.5 则P(X=3)=2P(甲胜三局,输0局)=2 P(X=4)=2P(甲前3局赢2局且第4局获胜)=2 P(X=5)=2P(甲前4局赢2局输2局且第5局赢)=2 例:设 X 0 1 2 P 0.2 0.5 0.3 求P(X)=P(X=0)=0.2
第四节 r .v .函数的分布
结论:随机变量X的函数Y=g(X)是一维r .v . 一、离散型 设离散型r .v .X的分布列为,k=1,2,……,n,…… Y=g(X)是一元实值函数,随机变量函数Y=g(X)是一维离散型r .v . 不妨设Y的所有可能取值为,j=1,2,…… 则 例:设 X -1 0 1 2 p 0.1 0.3 0.2 0.4 求:Y=的分布
交通学院
学号1126002026 姓名 吕立正 第二章 随机变量及其分布 §1.随机ห้องสมุดไป่ตู้量与分布函数
课堂笔记
一、随机变量的概念 定义:假设为试验E的样本空间,对任意的都赋予一个实数X()与之 对应,则实值函数X()称为随机变量,一般用X,Y,Z或者 注:1、Z()由唯一确定 2、随机变量X与实数x的区别 3、对实数x,事件{X≤x}有一定的概率,P{X≤x} 二、分布函数 定义:设(, F,P)为概率空间,还为定义在上的随机变量,对任意 xR,一元实值函数F(x)= P{X≤x},称为r,v,X的概率分布函数, 简称分布函数 注:1、F(x)= P{X≤x},xR 2、分布函数是指描述随机变量分布的根本方法 3、分布函数的性质 性质1、(单调性)对任意的,有F()≤F() 注:P()=F(b)-F(a) P()= F(b)-F(a)+P(X=a) P()= F(b)-F(a)+P(X=a)-P(X=b) P()= F(b)-F(a)-P(X=b) P()= F(a) P()=1- F(a) 性质2、(有界性):F(x) 性质3、 性质4、(右连续性) 对任意xR,有F(x+0)=F(x) 证明:设={X x+ } 则且 所以F(x)=P{X x}=P()== 由F(x)的单调性 F(x)=F(x+0) 例:设r.v.X的分布函数为F(x)=A+Barctanx x R 求待定系数A.B 由F(+)=1 F(-)=0 得到 所以A= B=
4.超几何分布 例、设一个盒子中有N个球,其中有M个是黑球,从中不放回地取n个,X 表示取到的黑球的个数。 则X的分布列为:P(X=k)= , k=0,1,2,……,r,其中r=min{M,n} 则称r.v.X服从超几何分布,记作:X~H(n,M,N). 5.几何分布 例、设事件A在每次试验中发生的概率为p(0<p<1),X表示事件A首次发 生时试验的次数,则X的分布列为: P(X=k)=p(1-p)k-1 , k=1,2,3,…… 则称r.v.X服从参数为p的几何分布,记作X~G(p) 【注】:设r.x.X~G(p) 则P{X>m+n|X>m}= P{X>m+n|X>m}=P{X>n} 则称几何分布具有“无记忆性”。 6.负二项分布 例、设事件A在每次试验中发生的概率为p(0<p<1),X表示事件 第r次 发生时试验的次数,则X的分布列为: P(X=k)= , k=r,r+1,r+2,…… 则称r.v.X服从负二项分布 【注】:1.几何分布是负二项分布r=1时的特殊情况。 2.设事件A第一次发生时,试验次数为X1,从A第一次发生后算起, 第二个A发生时试验次数为X2。依次类推,从第r-1个A发生后 算起,第r个A发生时试验次数为Xr,则Xi~G(p),i=1,2, ……,r,且X=~负二项分布。
P(X)=P(X=0)+P(X=1)=0.7 F(X)=P(Xx)= = [注]:5、离散型r .v . X的分布函数 F(x)=P(Xx)= (1) F(x)是阶梯函数 (2) 分段区间是左闭右开区间 (3) 分段点为r . v . X的取值 (4) 在分段点的跳跃高度恰为该点概率 二.几种常用分布 1.(0—1)分布 (两点分布) 例 设事件A在一试验中发生的概率为p(p>0) 一次试验中事件A发生 的次数为X 则X的分布列为 X 0 1
解:Y的所有可能取值为:0,1,4 Y的分布列为 Y 0 1 4 p 0.3 0.3 0.4
X p Y=g(X) 方法二: g() g()
…… …… …… g()
…… …… ……
若g()=g() 在Y的分布列中只要写一个点g(),而所对应的概率为 例,设r,v,X~U[-2,2],y=,求y的分布 解:P(y=0)=P()= P(y=1)=P()= y 0 1 P 二.连续型 设r,v,X的密度函数为,y= 是一元连续实值函数,则人r.v.函数y= 是 一维连续型随机变量 例:r,v,X~N(),求y=ax+b(a0)的分布 解: 若a>0 则=P( )= 由===* =*exp{} =exp{} y=ax+b~N() 若 则=P()=1=-exp{ ==-* =-exp{} y=ax+b~N() 综上所述 y=ax+b~N() 定理:若X~N(),则y=ax+b一定服从正态分布,其中,y=ax+b~ N() 定理:设r,v,X的密度函数,y= 是一元连续实值函数,反函数为 X=,则r.v.函数y= 的密度函数为
第三节 连续型
一 概念 定义:设F(x)是分布函数,若存在一非负可积函数f(x),使得对一切x, 有: ,则称X为连续型r .v .f(x)为r .v .X 的概率密度函数,简称密度函数。 注:1、f(x)0, x(非负性) 2、(归一性) 3、
4、设x为连续型r v,则 5、 6、若r .v .X~,则+ 7、连续型函数是不唯一的。例: 8、连续型r .v.的分布函数一定是连续函数,反之不一定成立。 9、在f(x)的连续点处,有 例: 求:(1)A (2)分布函数F(x) (3)p(x<1) 解:(1),即,得A= (2) (3) = 二 几个常用的分布 1、指数分布 定义:假设r .v .X密度函数,则称r .v .X从参数的指数分布,记作X ~e() 注:1、X ~e(),则 2、指数分布具有无记忆性,即p(x>m+n/x>m)=p(x>n) 例:某设备在t事件段发生故障的次数x(t)服从参数为t的泊松分布, ()0) 求:(1)相邻两次故障之间时间间隔T的分布。 (2)该设备在无故障工作m小时的情况下再无故障工作n小时的 概率。 解:(1) F(t)=P(T =1所以, (2) 2、均匀分布 定义:设r .v .X密度函数为,则称r .v .X服从参数区间的均匀分 布,记作X~U. [注]:1、设X~U,,则 2、若X~U,则F(x)=