概率论与数理统计考研笔记(pdf 10页)

合集下载

考研数学三必背知识点:概率论与数理统计

考研数学三必背知识点:概率论与数理统计

概率论与数理统计必考知识点一、随机事件和概率1、 随机事件及其概率运算律名称 表达式交换律A B B A +=+ BA AB =结合律 C B A C B A C B A ++=++=++)()( ABC BC A C AB ==)()(分配律 AC AB C B A ±=±)( ))(()(C A B A BC A ++=+德摩根律B A B A =+ B A AB +=2、概率的定义及其计算公式名称公式表达式 求逆公式 )(1)(A P A P -= 加法公式 )()()()(AB P B P A P B A P -+=+条件概率公式 )()()(A P AB P A B P =乘法公式 )()()(A B P A P AB P = )()()(B A P B P AB P =全概率公式∑==ni iiA B P A P B P 1)()()(贝叶斯公式 (逆概率公式) ∑∞==1)()()()()(i ijj j j A B P A P A B P A P B A P伯努力概型公式 n k p p C k P k n kk n n ,1,0,)1()(=-=-两件事件相互独立相应公式)()()(B P A P AB P =;)()(B P A B P =;)()(A B P A B P =;1)()(=+A B P A B P ;1)()(=+A B P A B P二、随机变量及其分布1、分布函数性质)()(b F b X P =≤ )()()(a F b F b X a P -=≤<2、 散型随机变量分布名称 分布律0–1分布),1(p B 1,0,)1()(1=-==-k p p k X P k k二项分布),(p n Bn k p p C k X P k n kk n ,,1,0,)1()( =-==-泊松分布)(λP,2,1,0,!)(===-k k ek X P kλλ几何分布)(p G,2,1,0,)1()(1=-==-k p p k X P k超几何分布),,(n M N H),min(,,1,,)(M n l l k C C C k X P nNkn MN k M +===--3..续型随机变量分布名称密度函数 分布函数均匀分布),(b a U⎪⎩⎪⎨⎧<<-=其他,0,1)(b x a ab x f⎪⎪⎩⎪⎪⎨⎧≥<≤--<=b x b x a a b a x a x x F ,1,,0)(指数分布)(λE⎪⎩⎪⎨⎧>=-其他,00,)(x e x f x λλ⎩⎨⎧≥-<=-0,10,0)(x e x x F xλ 正态分布),(2σμN+∞<<∞-=--x ex f x 222)(21)(σμσπ ⎰∞---=xt t ex F d21)(222)(σμσπ标准正态分布)1,0(N+∞<<∞-=-x ex x 2221)(πϕ⎰∞---=xt t ex F d21)(222)(σμσπ三、多维随机变量及其分布1、离散型二维随机变量边缘分布 ∑∑======⋅jjijjii i py Y x X P x X P p ),()(∑∑======⋅iiijjij j py Y x X P y Y P p ),()(2、离散型二维随机变量条件分布2,1,)(),()(=========⋅i P p y Y P y Y x X P y Y x X P p jij j j i j i j i2,1,)(),()(=========⋅j P p x X P y Y x X P x X y Y P p i ij i j i i j i j3、连续型二维随机变量( X ,Y )的分布函数⎰⎰∞-∞-=x ydvdu v u f y x F ),(),(4、连续型二维随机变量边缘分布函数与边缘密度函数 分布函数:⎰⎰∞-+∞∞-=xX dvdu v u f x F ),()( 密度函数:⎰+∞∞-=dv v x f x f X ),()( ⎰⎰∞-+∞∞-=yY dudv v u f y F ),()( ⎰+∞∞-=du y u f y f Y ),()(5、二维随机变量的条件分布 +∞<<-∞=y x f y x f x y f X X Y ,)(),()( +∞<<-∞=x y f y x f y x f Y Y X ,)(),()(四、随机变量的数字特征1、数学期望离散型随机变量:∑+∞==1)(k k k p x X E 连续型随机变量:⎰+∞∞-=dx x xf X E )()(2、数学期望的性质(1)为常数C ,)(C C E = )()]([X E X E E = )()(X CE CX E =(2))()()(Y E X E Y X E ±=± b X aE b aX E ±=±)()( )()()(1111n n n n X E C X E C X C X C E +=+ (3)若XY 相互独立则:)()()(Y E X E XY E = (4))()()]([222Y E X E XY E ≤ 3、方差:)()()(22X E X E X D -= 4、方差的性质(1)0)(=C D 0)]([=X D D )()(2X D a b aX D =± 2)()(C X E X D -<(2)),(2)()()(Y X Cov Y D X D Y X D ±+=± 若XY 相互独立则:)()()(Y D X D Y X D +=± 5、协方差:)()(),(),(Y E X E Y X E Y X Cov -= 若XY 相互独立则:0),(=Y X Cov6、相关系数:)()(),(),(Y D X D Y X Cov Y X XY ==ρρ 若XY 相互独立则:0=XY ρ即XY 不相关7、协方差和相关系数的性质(1))(),(X D X X Cov = ),(),(X Y C o v Y X C o v =(2)),(),(),(2121Y X Cov Y X Cov Y X X Cov +=+ ),(),(Y X a b C o v d bY c aX Cov =++8、常见数学分布的期望和方差分布 数学期望方差0-1分布),1(p B p)1(p p - 二行分布),(p n B np)1(p np -泊松分布)(λP λλ几何分布)(p G p1 21pp -超几何分布),,(n M N H N M n1)1(---N mN N M N M n均匀分布),(b a U 2b a + 12)(2a b - 正态分布),(2σμN μ2σ指数分布)(λEλ1 21λ五、大数定律和中心极限定理1、切比雪夫不等式若,)(,)(2σμ==X D X E 对于任意0>ξ有2)(})({ξξX D X E X P ≤≥-或2)(1})({ξξX D X E X P -≥<-2、大数定律:若n X X 1相互独立且∞→n 时,∑∑==−→−ni iDni i X E nX n11)(11(1)若n X X 1相互独立,2)(,)(i i i i X D X E σμ==且M i ≤2σ则:∑∑==∞→−→−ni iPni i n X E nX n11)(),(11(2)若n X X 1相互独立同分布,且i i X E μ=)(则当∞→n 时:μ−→−∑=Pn i i X n 11 3、中心极限定理(1)独立同分布的中心极限定理:均值为μ,方差为02>σ的独立同分布时,当n 充分大时有:)1,0(~1N n n XY nk kn −→−-=∑=σμ(2)拉普拉斯定理:随机变量),(~)2,1(p n B n n =η则对任意x 有: ⎰∞--+∞→Φ==≤--xt n x x dtex p np np P )(21})1({lim 22πη(3)近似计算:)()()()(11σμσμσμσμσμn n a n n b n n b n n Xn n a P b Xa P nk knk k-Φ--Φ≈-≤-≤-=≤≤∑∑==六、数理统计1、总体和样本总体X 的分布函数)(x F 样本),(21n X X X 的联合分布为)(),(121k nk n x F x x x F =∏=2、统计量(1)样本平均值:∑==ni i X nX 11(2)样本方差:∑∑==--=--=ni i ni i X n X n X X n S 122122)(11)(11(3)样本标准差:∑=--=ni i X X n S 12)(11(4)样本k 阶原点距: 2,1,11==∑=kXn A ni ki k(5)样本k 阶中心距:∑==-==ni k ik k k X XnM B 13,2,)(1(6)次序统计量:设样本),(21n X X X 的观察值),(21n x x x ,将n x x x 21,按照由小到大的次序重新排列,得到)()2()1(n x x x ≤≤≤ ,记取值为)(i x 的样本分量为)(i X ,则称)()2()1(n X X X ≤≤≤ 为样本),(21n X X X 的次序统计量。

概率论与数理统计重点笔记

概率论与数理统计重点笔记

概率论与数理统计重点笔记
概率论与数理统计是数学中的重要分支,它涉及到随机现象的
规律性和统计规律的研究。

在学习概率论与数理统计时,重点笔记
可以包括以下内容:
1. 概率论的基本概念,包括样本空间、随机事件、事件的概率、事件的运算规律等内容。

重点理解事件的概率定义、概率的性质和
概率的运算法则。

2. 随机变量及其分布,重点掌握随机变量的定义、离散随机变
量和连续随机变量的概念,以及它们的分布律、密度函数、分布函
数等。

还要重点理解常见的离散分布(如二项分布、泊松分布)和
连续分布(如正态分布、指数分布)。

3. 大数定律和中心极限定理,重点掌握大数定律和中心极限定
理的表述和应用,理解随机变量序列的收敛性质,以及大样本时样
本均值的渐近正态性质。

4. 参数估计,包括点估计和区间估计的基本概念和方法,重点
理解最大似然估计、矩估计等常用的参数估计方法。

5. 假设检验,理解假设检验的基本思想、原理和步骤,掌握显著性水平、拒绝域、接受域等相关概念,重点理解假设检验的错误类别和势函数的概念。

6. 相关性和回归分析,重点理解相关系数、回归方程、残差分析等内容,掌握相关性和回归分析的基本原理和方法。

总之,在学习概率论与数理统计的过程中,重点笔记应该围绕着基本概念、常用分布、极限定理、参数估计、假设检验和回归分析展开,全面理解这些内容并掌握其应用是十分重要的。

希望以上内容能够帮助你更好地理解概率论与数理统计。

概率论与数理统计笔记

概率论与数理统计笔记

AB = A ∪ B
设 A1, A2, …, An 是样本空间 Ω 的一个划分, B 是任意一 个事件,且 p(B)>0,则 P(Ai|B)=
P ( AB ) . P ( A)
P( Ai ) P( B | Ai) P( Ai ) P( B | Ai) = n , i=1,..,n P(B) P( Ak ) P( B | Ak)
k 1
概率的乘法公式: 当 P(A)>0 时,P(AB)= P(A)P(B|A) 当 P(B)>0 时,P(AB)= P(B)P(A|B) 乘法公式还可以推广到 n 个事件的情况:
n 重贝努利(Bernoulli)试验: Pn(k) =
C
k n
pk(1-p)n-k, k=0, 1, 2, …, n.(q=1-p)


k 1
Ak) =

k 1
P(Ak)
性质: (1) 0 ≤ P(A) ≤ 1, P (Φ) = 0 (2) P(A∪B) = P(A) + P(B)-P(AB) 特别地,当 A 与 B 互不相容时,P(A∪B) = P(A) + P(B) 推广: 对于任意事件 A, B, C 有 P(A∪B∪C) = P(A) + P(B)
当 0 < P(A) < 1 时,A 与 A 就是 Ω 的一个划分,又设 B 为任一事件, 则全概率公式的最简单形式为 P(B)=P(A) P(B|A)+ P( A ) P(B| A ) 运算律: 交换律:A∪B = B∪A, A∩B = B∩A 结合律:A∪(B∪C) = (A∪B)∪C, A∩(B∩C) = (A∩B)∩C 分配律:A∪(B∩C) = (A∪B)∩(A∪C), A∩(B∪C) = (A∩B)∪(A∩C)

浙江大学概率论与数理统计第4版课后答案及笔记

浙江大学概率论与数理统计第4版课后答案及笔记

浙江⼤学概率论与数理统计第4版课后答案及笔记浙江⼤学《概率论与数理统计》(第4版)笔记和课后习题(含考研真题)详解第1章 概率论的基本概念1.1 复习笔记⼀、随机事件1事件间的关系(见表1-1-1)表1-1-1 事件间的关系2事件的运算设A,B,C为事件,则有:(1)交换律:A∪B=B∪A;A∩B=B∩A;(2)结合律:A∪(B∪C)=(A∪B)∪C;A∩(B∩C)=(A∩B)∩C;(3)分配律:A∪(B∩C)=(A∪B)∩(A∪C);A∩(B∪C)=(A∩B)∪(A∩C);(4)德摩根律:;。

⼆、频率与概率概率的性质(1)若A⊂B,则P(B-A)=P(B)-P(A)与P(B)≥P(A)(2)(逆事件的概率)P(A_)=1-P(A);(3)(加法公式)P(A∪B)=P(A)+P(B)-P(AB);推⼴:对于任意n个事件A1,A2,…,A n,三、等可能概型(古典概型)计算公式四、条件概率1乘法定理(1)乘法公式:若P(A)>0,则P(AB)=P(B|A)P(A)。

(2)若P(A1A2…A n-1)>0,则有2全概率公式和贝叶斯公式(1)全概率公式P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+…+P(A|B n)P(B n)(2)贝叶斯公式注:全概率公式和贝叶斯公式的最简单形式五、独⽴性1两个事件独⽴(1)P(AB)=P(A)P(B)(2)两个定理①若P(A)>0,A,B相互独⽴,则P(B|A)=P(B),反之同样。

②若事件A与B独⽴,则A与B_独⽴,A_与B独⽴,A_与B_独⽴。

2三个事件独⽴设A,B,C是三个事件,如果满⾜等式则称A,B,C两两独⽴,若也成⽴,则A,B,C相互独⽴。

3n个事件独⽴设A1,A2,…,A n是n(n≥2)个事件,∀1≤i<j<k<…≤n,则A1,A2,…,A n相互独⽴。

考研数学《概率论与数理统计》知识点总结

考研数学《概率论与数理统计》知识点总结

考研数学《概率论与数理统计》知识点总结第一章概率论的基本概念定义:随机试验E的每个结果样本点组成样本空间S,S的子集为E的随机事件,单个样本点为基本事件.事件关系:1.A⊂B,A发生必导致B发生.2.A Y B和事件,A,B至少一个发生,A Y B发生.3.A I B记AB积事件,A,B同时发生,AB发生.4.A-B差事件,A发生,B不发生,A-B发生.5.A I B=Ø,A与B互不相容(互斥),A与B不能同时发生,基本事件两两互不相容.6.A Y B=S且A I B=Ø,A与B互为逆事件或对立事件,A与B中必有且仅有一个发生,记B=ASA-=.事件运算:交换律、结合律、分配率略.德摩根律:BABA IY=,BABA YI=.概率:概率就是n趋向无穷时的频率,记P(A).概率性质: 1.P(Ø)=0.2.(有限可加性)P(A1Y A2Y…Y A n)=P(A1)+P(A2)+…+P(A n),A i互不相容.3.若A⊂B,则P(B-A)=P(B)-P(A).4.对任意事件A,有)A(1)A(PP-=.5.P(A Y B)=P(A)+P(B)-P(AB).泊松分布:记X~π(λ),!}{kekXPkλλ-==,Λ,2,1,0=k.泊松定理:!)1(limkeppCkknkknnλλ--∞→=-,其中λ=np.当20≥n,05.0≤p应用泊松定理近似效果颇佳.随机变量分布函数:}{)(xXPxF≤=,+∞<<∞-x.)()(}{1221xFxFxXxP-=≤<.连续型随机变量:⎰∞-=x ttfxF d)()(,X为连续型随机变量,)(x f为X的概率密度函数,简称概率密度.概率密度性质:1.0)(≥xf;2.1d)(=⎰+∞∞-xxf;3.⎰=-=≤<21d)()()(}{1221xxxxfxFxFxXxP;4.)()(xfxF=',f(x)在x点连续;5.P{X=a}=0.均匀分布:记X~U(a,b);⎪⎩⎪⎨⎧<<-=其它,,1)(bxaabxf;⎪⎩⎪⎨⎧≥<≤--<=bxbxaabaxaxxF,,,1)(.性质:对a≤c<c+l≤b,有abllcXcP-=+≤<}{指数分布:⎪⎩⎪⎨⎧>=-其它,,1)(xexfxθθ;⎩⎨⎧>-=-其它,,1)(xexFxθ.无记忆性:}{}{tXPsXtsXP>=>+>.正态分布:记),(~2σμNX;]2)(ex p[21)(22σμσπ--=xxf;ttxF x d]2)(ex p[21)(22⎰∞---=σμσπ.性质:1.f(x)关于x=μ对称,且P{μ-h<X≤μ}=P{μ<X≤μ+h};2.有最大值f(μ)=(σπ2)-1.标准正态分布:]2exp[21)(2xx-=πϕ;⎰∞--=Φx ttx d]2ex p[21)(2π.即μ=0,σ=1时的正态分布X~N(0,1)性质:)(1)(xxΦ-=-Φ.正态分布的线性转化:对),(~2σμNX有)1,0(~NXZσμ-=;且有)(}{}{)(σμσμσμ-Φ=-≤-=≤=xxXPxXPxF.正态分布概率转化:)()(}{1221σμσμ-Φ--Φ=≤<xxxXxP;1)(2)()(}{-Φ=-Φ-Φ=+<<-ttttXtPσμσμ.3σ法则:P=Φ(1)-Φ(-1)=68.26%;P=Φ(2)-Φ(-2)=95.44%;P=Φ(3)-Φ(-3)=99.74%,P多落在(μ-3σ,μ+3σ)内.上ɑ分位点:对X~N(0,1),若zα满足条件P{X>zα}=α,0<α<1,则称点zα为标准正态分布的上α分位点.常用0.001 0.005 0.01 0.025 0.05 0.10上ɑ分位点:3.090 2.576 2.326 1.960 1.645 1.282Y服从自由度为1的χ2分布:设X密度函数f X(x),+∞<<∞-x,若Y=X2,则⎪⎩⎪⎨⎧≤>-+=)]()([21)(yyyfyfyyf XXY,,若设X~N(0,1),则有⎪⎩⎪⎨⎧≤>=--21)(221yyeyyfyY,,π定理:设X密度函数f X(x),设g(x)处处可导且恒有g′(x)>0(或g′(x)<0),则Y=g(X)是连续型随机变量,且有⎩⎨⎧<<'=其他,,)()]([)(βαyyhyhfyf XYh(y)是g(x)的反函数;①若+∞<<∞-x,则α=min{g(−∞),g(+∞)},β=max{g(−∞),g(+∞)};②若f X(x)在[a,b]外等于零,g(x)在[a,b]上单调,则α=min{g(a),g(b)},β=max{g(a),g(b)}.应用:Y=aX+b~N(aμ+b,(|a|σ)2).第二章多维随机变量及其分布二维随机变量的分布函数:分布函数(联合分布函数):)}(){(),(yYxXPyxF≤≤=I,记作:},{yYxXP≤≤.),(),(),(),(},{112112222121yxFyxFyxFyxFyYyxXxP+--=≤<≤<.F(x,y)性质:1.F(x,y)是x和y的不减函数,即x2>x1时,F(x2,y)≥F(x1,y);y2>y1时,F(x,y2)≥F(x,y1).2.0≤F(x,y)≤1且F(−∞,y)=0,F(x,−∞)=0,F(−∞,−∞)=0,F(+∞,+∞)=1.3.F(x+0,y)=F(x,y),F(x,y+0)=F(x,y),即F(x,y)关于x右连续,关于y也右连续.4.对于任意的(x1,y1),(x2,y2),x2>x1,y2>y1,有P{x1<X≤x2,y1<Y≤y2}≥0.离散型(X,Y):≥ijp,111=∑∑∞=∞=ijjip,ijyyxxpyxFii∑∑=≤≤),(.连续型(X,Y):vuvufyxF y x dd),(),(⎰⎰∞-∞-=.f(x,y)性质:1.f(x,y)≥0.2.1),(dd),(=∞∞=⎰⎰∞∞-∞∞-Fyxyxf.3.yxyxfGYXPG⎰⎰=∈dd),(}),{(.4.若f(x,y)在点(x,y)连续,则有),(),(2yxfyxyxF=∂∂∂.n维:n维随机变量及其分布函数是在二维基础上的拓展,性质与二维类似.边缘分布:F x(x),F y(y)依次称为二维随机变量(X,Y)关于X和Y的边缘分布函数,F X(x)=F(x,∞),F Y(y)=F(∞,y).离散型:*ip和j p*分别为(X,Y)关于X和Y的边缘分布律,记}{1iijjixXPpp==∑=∞=*,}{1jijijyYPpp==∑=∞=*.连续)(xfX ,)(yfY为(X,Y)关于X和Y的边缘密度函数,记型:⎰∞∞-=yy x f x f X d ),()(,⎰∞∞-=xy x f y fYd ),()(.二维正态分布:]})())((2)([)1(21exp{121),(2222212121212221σμσσμμρσμρρσπσ-+-------=y y x x y x f .记(X ,Y )~N (μ1,μ2,σ12,σ22,ρ)]2)(exp[21)(21211σμσπ--=x x f X ,∞<<∞-x .]2)(exp[21)(22222σμσπ--=y y f Y ,∞<<∞-y .离散型条件分布律: jij j j i j i p p y Y P y Y x X P y Y x X P *=======}{},{}{.*=======i ij i j i i j p p x X P y Y x X P x X y Y P }{},{}{.连续型条件分布: 条件概率密度:)(),()(y f y x f y x f Y Y X =|| 条件分布函数:x y f y x f y Y x X P y x F xY Y X d )(),(}{)(⎰∞-==≤=||| )(),()(x f y x f x y f X X Y =||y x f y x f x X y Y P x y F yX X Y d )(),(}{)(⎰∞-==≤=|||含义:当0→ε时,)|(d )|(}|{||y x F x y x f y Y y x X P Y X xY X =≈+≤<≤⎰∞-ε.均匀分布:若⎪⎩⎪⎨⎧∈=其他,0),(,1),(Gy x Ay x f ,则称(X ,Y)在G 上服从均匀分布.独立定若P {X ≤x ,Y ≤y }=P {X ≤x }P {Y ≤y },即F (x ,y )=F x (x )F y (y ),则称随机变量X 和Y 是相互独立的.义:独立条件或可等价为:连续型:f(x,y)=f x(x)f y(y);离散型:P{X=x i,Y=y j}=P{X=x i}P{Y=y j}.正态独立:对于二维正态随机变量(X,Y),X和Y相互对立的充要条件是:参数ρ=0.n维延伸:上述概念可推广至n维随机变量,要注意的是边缘函数或边缘密度也是多元(1~n-1元)的.定理:设(X1,X2,…,X m)和(Y1,Y2,…,Y n)相互独立,则X i和Y j相互独立.又若h,g是连续函数,则h(X1,X2,…,X m)和g(Y1,Y2,…,Y n)相互独立.Z=X +Y分布:若连续型(X,Y)概率密度为f(x,y),则Z=X+Y为连续型且其概率密度为⎰∞∞-+-=yyyzfzfYXd),()(或⎰∞∞-+-=xxzxfzfYXd),()(.f X和f Y的卷积公式:记⎰∞∞-+-==yyfyzfzfffYXYXYXd)()()(*⎰∞∞--=xxzfxfYXd)()(,其中除继上述条件,且X和Y相互独立,边缘密度分别为f X(x)和f Y(y).正态卷积:若X和Y相互独立且X~N(μ1,σ12),记Y~N(μ2,σ22),则对Z=X+Y有Z~N(μ1+μ2,σ12+σ22).1.上述结论可推广至n个独立正态随机变量.2.有限个独立正态随机变量的线性组合仍服从正态分布.伽马分布: 记),(~θαΓX ,0>α,0>θ.⎪⎩⎪⎨⎧>Γ=--其他,,00)(1)(1x e x x f x θαααθ,其中⎰+∞--=Γ01d )(te t t αα.若X 和Y 独立且X ~Γ(α,θ),记Y ~Γ(β,θ),则有X+Y~Γ(α+β,θ).可推广到n 个独立Γ分布变量之和.XYZ =:⎰∞∞-=xxz x f x z f X Y d ),()(,若X 和Y 相互独立,则有⎰∞∞-=xxz f x f x z f Y X X Y d )()()(.XYZ =分布: ⎰∞∞-=x xzx f x z f XY d ),(1)(,若X 和Y 相互独立,则有⎰∞∞-=x xz f x f x z f Y X XY d )()(1)(.大小分布:若X 和Y 相互独立,且有M =max{X ,Y }及N =min{X ,Y },则M 的分布函数:F max (z )=F X (z )F Y (z ),N 的分布函数:F min (z )=1-[1-F X (z )][1-F Y (z )],以上结果可推广到n 个独立随机变量的情况.第四章 随机变量的数字特征数学期望:简称期望或均值,记为E (X );离散型:kkk p x X E ∑=∞=1)(.连续型:⎰∞∞-=xx xf X E d )()(.定理: 设Y 是随机变量X 的函数:Y =g (X )(g 是连续函数). 1.若X 是离散型,且分布律为kk k p x g Y E )()(1∑=∞=. 2.若X 是连续型,概率密度为⎰∞∞-=xx f x g Y E d )()()(.P{X=x k}=p k,则:f(x),则:定理推广:设Z是随机变量X,Y的函数:Z=g(X,Y)(g是连续函数).1.离散型:分布律为P{X=x i,Y=y j}=p ij,则:ijjiijpyxgZE),()(11∑∑=∞=∞=.2.连续型:⎰⎰∞∞-∞∞-=yxyxfyxgZE dd),(),()(期望性质:设C是常数,X和Y是随机变量,则:1.E(C)=C.2.E(CX)=CE(X).3.E(X+Y)=E(X)+E(Y).4.又若X和Y相互独立的,则E(XY)=E(X)E(Y).方差:记D(X)或Var(X),D(X)=Var(X)=E{[X-E(X)]2}.标准差(均方差):记为σ(X),σ(X)= .通式:22)]([)()(XEXEXD-=.kkkpXExXD21)]([)(-∑=∞=,⎰∞∞--=xxfxExXD d)()]([)(2.标准化变量:记σμ-=xX*,其中μ=)(XE,2)(σ=XD,*X称为X的标准化变量.)(*=XE,1)(*=XD.方差性质:设C是常数,X和Y1.D(C)=0.2.D(CX)=C2D(X),D(X+C)=D(X).3.D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-)(xD是随机变量,则:E(Y))},若X,Y相互独立D(X+Y)=D(X)+D(Y).4.D(X)=0的充要条件是P{X=E(X)}=1.正态线性变换:若),(~2iiiNXσμ,i C是不全为0的常数,则),(~22112211iiniiininnCCNXCXCXCσμ∑∑+++==Λ.切比雪夫不等式:22}{εσεμ≤≥-XP或221}{εσεμ-≥<-XP,其中)(X E=μ,)(2XD=σ,ε为任意正数.协方差:记)]}()][({[),Cov(YEYXEXEYX--=.X与Y的相关系数:)()(),Cov(YDXDYXXY=ρ.D(X+Y)=D(X)+D(Y)+2Cov(X,Y),Cov(X,Y)=E(XY)-E(X)E(Y).性质:1.Cov(aX,bY)=ab Cov(X,Y),a,b是常数.2.Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).系数性质:令e=E[(Y-(a+bX))2],则e取最小值时有)()1(]))([(22minYDXbaYEeXYρ-=+-=,其中)()(XEbYEa-=,)(),Cov(0XDYXb=.1.|ρXY|≤1.2.|ρXY|=1的充要条件是:存在常数a,b使P{Y=a+bX}=1.|ρXY|越大e越小X和Y线性关系越明显,当|ρXY|=1时,Y=a+bX;反之亦然,当ρXY=0时,X和Y不相关.X和Y相互对立,则X和Y不相关;但X和Y不相关,X和Y不一定相互独立.定义:k阶矩(k阶原点矩):E(X k ).n维随机变量X i的协方差矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛=nnnnnncccccccccΛMMMΛΛ212222111211C,),Cov(jiijXXc==E{[X i-E(X i)][X j-E(X j)]}.k+l阶混合矩:E(X k Y l ).k阶中心矩:E{[X-E(X)] k }.k+l阶混合中心矩:E{[X-E(X)]k[Y-E(Y)]l}.n维正态分布:)}()(21ex p{det)2(1),,,(1T221μXCμXC---=-nnxxxfπΛ,T21T21),,,(),,,(nnxxxμμμΛΛ==μX.性质:1.n维正态随机变量(X1,X2,…,X n)的每一个分量X i (i=1,2,…,n)都是正态随机变量,反之,亦成立.2.n维随机变量(X1,X2,…,X n)服从n维正态分布的充要条件是X1,X2,…,X n的任意线性组合l1X1+l2X2+…+l n X n服从一维正态分布(其中l1,l2,…,l n不全为零).3.若(X1,X2,…,X n)服从n维正态分布,且Y1,Y2,…,Y k是X j (j=1,2,…,n)的线性函数,则(Y1,Y2,…,Y k)也服从多维正态分布.4.若(X1,X2,…,X n)服从n维正态分布,则“X i 相互独立”与“X i 两两不相关”等价.第五章大数定律及中心极限定理弱大数定理:若X1,X2,…是相互独立并服从同一分布的随机变量序列,且E(Xk)=μ,则对任意ε>0有11lim1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμknknXnP或→μPX,knkXnX11=∑=.定义:Y1,Y2,…,Y n ,…是一个随机变量序列,a是一个常数.若对任意ε>0,有1}|{|lim=<-∞→εaYPnn则称序列Y1,Y2,…,Y n ,…依概率收敛于a.记aY Pn−→−伯努利大数定理:对任意ε>0有1lim=⎭⎬⎫⎩⎨⎧<-∞→εpnfP An或lim=⎭⎬⎫⎩⎨⎧≥-∞→εpnfP An.其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.中心定理设X1,X2,…,Xn,…相互独立σμnnXknk)(1-∑=N(0,1)或nXσμ-~N(0,1)或X~N(μ,n2σ).~近似的极限定理一:并服从同一分布,且E(Xk)=μ,D(Xk)=σ2 >0,则n→∞时有定理二:设X1,X2,…,Xn,…相互独立且E(X k)=μ k,D(X k)=σk2 >0,若存在δ>0使n→∞时,}|{|1212→-∑+=+δδμkknknXEB,则nknkknkBX)(11μ==∑-∑~N(0,1),记212knknBσ=∑=.定理三:设),(~p n bnη,则n→∞时,Npnpnpn~)1()(--η(0,1),knknX1=∑=η.第六章样本及抽样分布定义:总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.定义:样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.频率直方图:图形:以横坐标小区间为横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组图形特点:外轮廓接近宽,纵坐标为高的跨越横轴的几个小矩形.距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).于总体的概率密度曲线.纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).定义:样本p分位数:记x p,有1.样本x i中有np个值≤x p.2.样本中有n(1-p)个值≥x p.箱线图:x p选择:记⎪⎩⎪⎨⎧∈+∉=++NnpxxNnpxxnpnpnpp当,当,][211)()()1]([.分位数x0.5,记为Q2或M,称为样本中位数.分位数x0.25,记为Q1,称为第一四分位数.分位数x0.75,记为Q3,称为第三四分位数.图形:图形特点:M为数据中心,区间[min,Q1],[Q1,M],[M,Q3],[Q3,max]数据个数各占1/4,区间越短数据密集.四分位数间距:记IQR=Q3-Q1;若数据X<Q1-1.5IQR 或X>Q3+1.5IQR,就认为X是疑似异常值.抽样分布:样本平均值:iniXnX11=∑=样本方差:)(11)(11221212XnXnXXnSiniini-∑-=-∑-===样本标准2SS=样本k阶kinikXnA11=∑=,k≥1样本k阶kinikXXnB)(11-∑==,k≥2min Q1 M Q3 max差: (原点)矩:中心矩:经验分布函数: )(1)(x S nx F n =,∞<<∞-x .)(x S 表示F 的一个样本X 1,X 2,…,X n 中不大于x 的随机变量的个数.自由度为n 的χ2分布: 记χ2~χ2(n ),222212nX X X +++=Λχ,其中X 1,X 2,…,X n 是来自总体N (0,1)的样本.E (χ2 )=n ,D (χ2 )=2n . χ12+χ22~χ2(n 1+n 2). ⎪⎩⎪⎨⎧>Γ=--其他,,00)2(21)(2122y e x n y f y n n .χ2分布的分位点: 对于0<α<1,满足αχχαχα==>⎰∞y y f n P n )(222d )()}({,则称)(2n αχ为)(2n χ的上α分位点.当n 充分大时(n >40),22)12(21)(-+≈n z n ααχ,其中αz 是标准正态分布的上α分位点.自由度为n 的t 分布:记t ~t (n ),n Y Xt /=, 其中X~N (0,1),Y~χ2(n ),X ,Y 相互独立.2)1(2)1(]2[]2)1([)(+-+Γ+Γ=n n t n n n t h π h (t )图形关于t =0对称;当n充分大时,t 分布近似于N (0,1)分布.t 分布对于0<α<1,满足ααα==>⎰∞t t h n t t P n t )(d )()}({,则称)(n tα为)(n t 的上α的分位点:分位点.由h(t)对称性可知t1-α(n)=-tα(n).当n>45时,tα(n)≈zα,zα是标准正态分布的上α分位点.自由度为(n1,n2)的F分布:记F~F(n1,n2),21nVnUF=,其中U~χ2(n1),V~χ2(n2),X,Y相互独立.1/F~F(n2,n1)⎪⎩⎪⎨⎧>+ΓΓ+Γ=+-其他,,]1)[2()2()](2)([)(2)(21211)2(221212111xnynnnynnnny nnnnψF分布的分位点:对于0<α<1,满足αψαα==>⎰∞yynnFFPnnF),(2121d)()},({,则称),(21n nFα为),(21nnF的上α分位点.重要性质:F1-α(n1,n2)=1/Fα(n1,n2).定理一:设X1,X2,…,X n 是来自N(μ,σ2)的样本,则有),(~2nNXσμ,其中X是样本均值.定理二:设X1,X2,…,X n 是来自N(μ,σ2)的样本,样本均值和样本方差分别记为X,2S,则有1.)1(~)1(222--nSnχσ;2.X与2S相互独立.定理三:设X1,X2,…,X n 是来自N(μ,σ2)的样本,样本均值和样本方差分别记为X,2S,则有)1(~--ntnSXμ.定理设X1,X2,…,X n1与X,Y,21S,22S,则有四: Y 1,Y 2,…,Y n 2分别是来自N (μ1,σ12)和N (μ2,σ22)的样本,且相互独立.设这两个样本的样本均值和样本方差分别记为 1.)1,1(~2122212221--n n F S Sσσ.2.当σ12=σ22=σ2时,)2(~)()(21121121-++-----n n t nn S Y X w μμ,其中2)1()1(212222112-+-+-=n n S n S n S w,2wwS S=.第七章 参数估计定义:估计量:),,,(ˆ21nX X X Λθ,估计值:),,,(ˆ21nx x x Λθ,统称为估计.矩估计法: 令)(llX E =μ=li n i l X n A 11=∑=(kl ,,2,1Λ=)(k 为未知数个数)联立方程组,求出估计θˆ. 设总体X均值μ及方差σ2都存在,则有X A ==1ˆμ,212212122)(11ˆX X n X X n A A i n i i n i -∑=-∑=-===σ.最大似然估计法:似然函数:离散:);()(1θθini x p L =∏=或连续:);()(1θθini x f L =∏=,)(θL 化简可去掉与θ无关的因式项. θˆ即为)(θL 最大值,可由方程0)(d d=θθL 或0)(ln d d=θθL 求得.当多个未知参数θ1,θ1,…,θk时:可由方程组0d d=L iθ或0ln d d=L iθ(k i ,,2,1Λ=)求得.最大似然估计的不变性:若u=u(θ)有单值反函数θ=θ(u),则有)ˆ(ˆθuu=,其中θˆ为最大似然估计.截尾样本取样:定时截尾样本:抽样n件产品,固定时间段t0内记录产品个体失效时间(0≤t1≤t2≤…≤t m≤t0)和失效产品数量.定数截尾样本:抽样n件产品,固定失效产品数量数量m记录产品个体失效时间(0≤t1≤t2≤…≤t m).结尾样本最大似然估计:定数截尾样本:设产品寿命服从指数分布X~e(θ),θ即产品平均寿命.产品t i时失效概率P{t=t i}≈f(t i)d t i,寿命超过t m的概率θm tmettF-=>}{,则)(}){()(1imimnmmntPttFCL=-∏>=θ,化简得)(1)(m t sm eL---=θθθ,由0)(lndd=θθL得:m t s m)(ˆ=θ,其中s(t m)=t1+t2+…+t m+(n-m)t m,称为实验总时间.定时截尾样本:与定数结尾样本讨论类似有s(t0)=t1+t2+…+t m+(n-m)t0,)(01)(t sm eL---=θθθ,m t s)(ˆ0=θ,.无偏性:估计量),,,(ˆ21nXXXΛθ的)ˆ(θE存在且θθ=)ˆ(E,则称θˆ是θ的无偏估计量.有效性:),,,(ˆ211nXXXΛθ与),,,(ˆ212nXXXΛθ都是θ的无偏估计量,若)ˆ()ˆ(21θθDD≤,则1ˆθ较2ˆθ有效.相合性:设),,,(ˆ21nXXXΛθθ的估计量,若对于任意0>ε有1}|ˆ{|lim=<-∞→εθθPn,则称θˆ是θ的相合估计量.置信区间:αθθθ-≥<<1)},,,(),,,({2121nnXXXXXXPΛΛ,θ和θ分别为置信下限和置信上限,则),(θθ是θ的一个置信水平为α-1置信区间,α-1称为置信水平,10<<α.正态设X1,枢轴量W W分布a,b不等其中样本置信区间:X2,…,X n是来自总体X~N(μ,σ2)的样本,则有μ的置信区间:式置信水平置信区间)1,0(~NnXσμ-⇒ασμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-12znXP⇒)(2ασznX±zα/2为上α分位点θ置信区间的求解:1.先求枢轴量:即函数W=W(X1,X2,…,X n;θ),且函数W的分布不依赖未知参数.如上讨论标注2.对于给定置信水平α-1,定出两常数a,b使P{a<W<b}=α-1,从而得到置信区间.(0-1)分布p 的区间估计:样本容量n>50时,⇒--∞→)1,0(~)1()(lim NpnpnpXnn{}⇒-≈<--αα1)1()(2zpnpnpXnP)2()(222222<++-+XnpzXnpznαα⇒若令22αzna+=,)2(22αzXnb+-=,2X nc=,则有置信区间(aacbb2)4(2---,aacbb2)4(2-+-).单侧置信区间:若αθθ-≥>1}{P或αθθ-≥<1}{P,称(θ,∞)或(∞-,θ)是θ的置信水平为α-1的单侧置信区间.正态总体均值、方差的置信区间与单侧置信限(置信水平为α-1)待估其他枢轴量W的分布置信区间单侧置信限一个正态总体μσ2已知)1,0(~NnXZσμ-=)(2ασznX±ασμznX+=,ασμznX-=μσ2未知)1(~--=ntnSXtμ⎪⎭⎫⎝⎛±2αtnSXαμtnSX+=,αμtnSX-=σ2μ未知)1(~)1(2222--=nSnχσχ⎪⎪⎭⎫⎝⎛---2212222)1(,)1(ααχχSnSn2122)1(αχσ--=Sn,222)1(αχσSn-=两个正态总体μ1-μ2σ12,σ22已知)1,0(~)(22212121NnnYXZσσμμ+---=⎪⎪⎭⎫⎝⎛+±-2221212nnzYXσσα2221212122212121nnzYXnnzYXσσμμσσμμαα+--=-++-=-μ1-μ2σ12=σ22=σ2未知)2(~)()(21121121-++---=--nntnnSYXtwμμ2)1()1(212222112-+-+-=nnSnSnSw()12112--+±-nnStYXwα2wwSS=121121121121----+--=-++-=-nnStYXnnStYXwwααμμμμσ12/σ22μ1,μ2未知)1,1(~2122212221--=nnFSSFσσ⎪⎪⎭⎫⎝⎛-212221222211,1ααFSSFSSασσ-=1222122211FSS,ασσFSS122212221=单个总体X ~N (μ,σ2),两个总体X ~N (μ1,σ12),Y ~N (μ2,σ22).第八章 假设实验定义: H 0:原假设或零假设,为理想结果假设;H 1:备择假设,原假设被拒绝后可供选择的假设.第Ⅰ类错误:H 0实际为真时,却拒绝H 0.第Ⅱ类错误:H 0实际为假时,却接受H 0.显著性检验:只对犯第第Ⅰ类错误的概率加以控制,而不考虑第Ⅱ类错误的概率的检验.P {当H 0为真拒绝H 0}≤α,α称为显著水平.拒绝域:取值拒绝H 0.临界点:拒绝域边界.双边假设检验:H 0:θ=θ0,H 1:θ≠θ0.右边检验:H 0:θ≤θ0,H 1:θ>θ0.左边检验:H 0:θ≥θ0,H 1:θ<θ0. 正态总体均值、方差的检验法(显著性水平为α)原假设H 0 备择假设H 1 检验统计量 拒绝域 1 σ2已知 μ≤μ0 μ>μ0 nX Z σμ0-=z ≥z αμ≥μ0 μ<μ0 z ≤-z α μ=μ0μ≠μ0 |z |≥z α/2 2 σ2未知 μ≤μ0 μ>μ0 nS X t 0μ-=t ≥t α(n -1)μ≥μ0μ<μ0 t ≤-t α(n -1) μ=μ0 μ≠μ0 |t |≥t α/2(n -1) 3σ1,σ2 已μ1-μ1-222121n n Y X Z σσδ+--=z ≥z α μ1-μ1-z ≤-z α μ1-μ1-|z |≥z α/2 4 σ12μ1-μ1-1211--+--=nn S Y X t w δt ≥t α(n 1+n 2-2)=σ22μ1-μ1-2)1()1(212222112-+-+-=n n S n S n S wt ≤-t α(n 1+n 2-2) μ1-μ1-|t |≥t α/2(n 1+n 2-2) 5 μ未知 σ2≤σ02 σ2>σ02 2022)1(σχSn -=χ2≥χα2(n -1) σ2≥σ02 σ2<σ02χ2≤χ21-α(n -1) σ2=σ02 σ2≠σ02χ2≥χ2α/2(n -1)或χ2≤χ21-α/2(n -1) 6 μ1,μ2 未知 σ12≤σ22σ12>σ22 2221S S F =F ≥F α(n 1-1,n 2-1) σ12≥σ22σ12<σ22F ≤F 1-α(n 1-1,n 2-1)σ12=σ22σ12≠σ22F ≥F α/2(n 1-1,n 2-1)或F ≤F 1-α/2(n 1-1,n 2-1) 7 成对 数据μD ≤0 μD >0 nS D t D 0-=t ≥t α(n -1)μD ≥0μD <0 t ≤-t α(n -1) μD =0μD ≠0|t |≥t α-2(n -1)检验方法选择: 主要是逐对比较法(成对数据)跟两个正态总体均值差的检验的区别,如上表即7跟3、4的区别,成对数据指两样本X 和Y 之间存在一一对应关系,而3和4一般指X 和Y 相互对立,但针对同一实体.关系: 置信区间与假设检验之间的关系:未知参数的置信水平为1-α的置信区间与显著水平为α的接受域相同.定义:施行特征函数(OC函数):β(θ)=Pθ(接受H0).功效函数:1-β(θ).功效:当θ*∈H1时,1-β(θ*)的值.。

概率论与数理统计笔记

概率论与数理统计笔记

第一章 概率论的基本概念随机试验:1.可以在相同的条件下重复进行2.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果3.进行一次试验之前不能确定哪个结果会出现样本空间:随机试验E 的所有可能结果组成的集合称为E 的样本空间,记为S 随机事件:试验E 的样本空间S 的子集,简称事件基本事件:由一个样本点(E 的每个结果)组成的单点集 频率:事件A 发生次数和试验次数的比值n A /n ,记作f n (A)概率:对事件A 赋予实数,P(A) 非负性,规范性,可列可加性性质i P(∅)=0.性质ii(有限可加性) 若A1,A2,…,An 是两两互不相容的事件,则有P(A 1⋃A 2⋃…⋃A n )=P (A 1)+P (A 2)+⋯+P(A n ).性质iii 设A,B 是两个事件,若A ⊂B,则有P(B-A)=P(B)-P(A);P(B)≥P(A). 性质iv 对于任一事件A,P(A)≤1.性质v(逆事件的概率) 对于任一事件A,有P(A )=1-P(A).性质vi(加法公式) 对于任意两事件 A,B 有P(A ⋃B)=P(A)+P(B)-P(AB). 古典概型:样本空间只包含有限个元素,每个基本事件可能性相同A 的对立事件A̅及其概率:也称逆事件 两个互不相容事件的和事件的概率:两事件不能同时发生,概率的有限可加性 概率的加法定理:P(A ⋃B )=P(A)+P(B)-P(AB)条件概率:在事件A 发生的条件下事件B 发生的P(B|A)=P(AB)P(A).概率的乘法公式:P(ABC)=P(C|AB)P(B|A)P(A) 全概率公式:P (A )=∑P (A |B i )n i=1P(B i ) B i 是试验E 的S 的划分,A 为E 的事件 贝叶斯公式:P (B i |A )=P(A|B i )P(B i )∑P(A|B j )P(B j )nj=1,i=1,2,…,n.事件的独立性:P(AB)=P(A)P(B),互相独立与互不相容不能同时成立设n 个事件,如果对于其中任意2个,任意3个,…,任意n 个事件的积事件的概率都等于各事件概率之积,则称n 个事件相互独立实际推断原理:概率很小的事件在一次实验中实际上几乎是不发生的第二章 随机变量及其分布随机变量:设E 的样本空间S={e},X=X(e)是定义在样本空间S 上的单值函数,称随机变量分布函数:X 是随机变量,x 是任意实数,F (x )=P {X ≤x },−∞<x <∞称为X 的分布函数任意实数x 1,x 2(x 1<x 2),有 P {x 1<X ≤x 2}=P {X ≤x 2}−P {X ≤x 1}=F (x 2)−F(x 1) 基本性质:不减函数,0≤F(x)≤1且F(-∞)=0,F(∞)=1离散型随机变量:全部可能取到的值是有限个或可列无限多个其分布律: P {X =x k }=p k ,k =1,2,… 连续性随机变量:F (x )=∫f(t)dt x−∞ 非负可积函数f (x )概率密度:f(x)性质:f (x )≥0;∫f (x )dx ∞−∞=1伯努利试验:试验E 只有两个可能结果:A 及A(0−1)分布: P {X =k }=p k (1−p)1−k ,k =0,1 (0<p <1) 记为X ~b(1,p) n 重伯努利试验:将伯努利试验E 独立重复地进行n 次,以C i 为A 或A ,i=1,2,…,n.独立:P (C 1C 2…C n )=P (C 1)P (C 2)…P(C n )二项分布:P {X =k }=(n k )p k (1−p)n−k ,k =0,1,2,…,n. 记为X ~b(n,p) 泊松分布:P {X =k }=λk e −λk!,k =0,1,2,…,λ是常数,记为X ~π(λ)指数分布:f (x )={1θe −xθ,x >00,otherwise,记为X ~η(θ)均匀分布:f (x )={1b−a ,a <x <b,0,otherwise.,记为X ~U(a,b)正态分布:f (x )=√2πσ−(x−μ)22σ2,-∞<x<∞,其中μ,σ(σ>0)是常数,记作X ~N (μ,σ2)标准正态分布:X ~N(0,1),概率密度为φ(x),分布函数为Φ(x) 引理:若X ~N(μ,σ2),则Z =X−μσ~N(0,1)随机变量函数的分布:Y=g(X),分布函数法(先求分布函数,再对分布函数求导)第三章 多维随机变量及其分布二维随机变量(X ,Y ):设X=X(e),Y=Y(e)是定义在样本空间S 上的随机变量构成的向量 (X ,Y )的分布函数:联合分布函数:F (x,y )=P {(X ≤x )∩(Y ≤y )}≝P{X ≤x,Y ≤y}边缘分布函数:F X (x )=P {X ≤x }=P {X ≤x,Y <∞}=F(x,∞),F Y (y )=F(∞,y) 离散型随机变量(X ,Y )的分布律:P{X =x i ,Y =y j }=p ij ,i,j =1,2,… 联合分布律 连续型随机变量(X ,Y )的概率密度:f(x,y) 联合概率密度1. f (x,y )≥02. ∫∫f(x,y)dxdy ∞−∞=F (∞,∞)=1∞−∞3. 设G 是xOy 平面上的区域,点(X,Y)落在G 内的概率为∬f(x,y)dxdyG . 4. 若f(x,y)在点(x,y)连续,则有∂2yF(x,y)∂x ∂y=f(x,y)离散型随机变量(X ,Y )的边缘分布律:P {X =x i }=∑p ij ∞i=0,i =1,2,…, Y 一样 连续型随机变量(X ,Y )的边缘概率密度:f X (x )=∫f(x,y)dy ∞−∞,Y 一样 条件分布函数:F X|Y (x |y )=P {X ≤x |Y =y }=∫f(x,y)f X (x)dy y −∞ 在Y=y 条件下X 的条件分布函数条件分布律:P {X =x i |Y =y i }=P{X=x i ,Y=y i }P{Y=y i }=p ij p .j,i =1,2,… 在Y=y j 条件下X 的条件分布律条件概率密度:f X|Y (x |y )=f(x,y)f Y (y)在Y=y 的条件下X 的条件概率密度两个随机变量X ,Y 的独立性:F (x,y )=F X (x)F Y (y)对二维正态随机变量变量(X,Y),X 和Y 相互独立的充要条件是参数ρ=0 Z=X+Y 、Z=Y/X 、Z=XY 的概率密度:Z=X+Y:f X+Y (z )={∫f X (z −y)f Y (y)dy∞−∞∫f X (x)f Y (z −x)dx∞−∞ Z=Y/X:f Y X(z )=∫|x|f(x,xz)dx ∞−∞=∫|x|f X (x)f Y (xz)dx ∞−∞Z=XY:f XY (z )=∫1|x|f(x,z x)dx ∞−∞=∫1|x|f X (x)f Y (zx)dx ∞−∞M=max{X ,Y},N=min{X ,Y}的概率密度:分布函数:F max (z)=P{M≤z}=P{X≤z,Y≤z}=P{X≤z}P{Y≤z}=F X (z)F Y (z).F min (z)=P{N≤z}=1-P(N>z)=1-P{X>z,Y>z}=1-P{X>z}∙P{Y>z}=1-[1-F X (z)][1-F Y (z)].第四章 随机变量的数字特征数学期望:E (X )=∑x k p k ∞k=1E (X )=∫xf(x)∞−∞dx (积分绝对收敛)随机变量函数的数学期望:Y=g(X)(g 是连续函数)E(Y)=E[g(X)]=∑g(x k )∞k=1p k E(Y)=E[g(X)]=∫g(x)f(x)dx ∞−∞E(Z)=E[g(X,Y)]=∑∑g(x i ,y j )p ij ∞i=1∞j=1E(Z)=E[g(X,Y)]=∫∫g(x,y)f(x,y)∞−∞dxdy ∞−∞数学期望的性质:1.设C 是常数,则有E(C)=C.2.设X 是一个随机变量,C 是常数,则有E(CX)=CE(X).3.设X,Y 是两个随机变量,则有E(X+Y)=E(X)+E(Y).(可推广到任意有限个随机变量之和)4.设X,Y 是相互独立的随机变量,则有E(XY)=E(X)+E(Y).(可推广到任意有限个相互独立随机变量之积)方差:D(X)=Var(X)=E{[X-E(X)]2}. 标准差:σ(x)=√D(X)方差的性质:1.设C 是常数,则D(C)=0.2.设X 是随机变量,C 是常数,则有D(CX)=C 2D(X),D(X+C)=D(X).3.设X,Y 是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-E(X))}. 若X,Y 相互独立,则有D(X+Y)=D(X)+D(Y).4.D(X)=0的充要条件是X 以概率1取常数E(X),即P{X=E(X)}=1. 标准化的随机变量:X ∗=X−μσ.(数学期望为0,方差为1)协方差:Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}. 相关系数:ρXY =√D(X)D(Y)相关系数的性质:1.|ρXY |≤1.2.|ρXY |=1的充要条件是,存在常数a,b 使P{Y=a+bX}=1. X ,Y 不相关:当ρXY =0时.切比雪夫不等式:设随机变量X 具有E(X)=μ,方差D(X)=σ2,则对任意正数ε,不等式 P{|X −μ|≥ε}≤σ2ε2成立几种重要分布的数学期望和方差:(推导)矩:k 阶原点矩:E(X k ),k=1,2,…k 阶中心矩:E([X-E(X)]k ),k=2,3,… k+l 阶混合矩:E(X k Y l ),k,l=1,2,…k+l 阶混合中心矩:E([X-E(X)]k [Y-E(Y)]l ),k,l=1,2,…协方差矩阵:C =(c ij )=(Cov(X i ,Y j ))=E{[X i -E(X i )][X j -E(X j )]},i,j=1,2,…,n.第五章 大数定律及中心极限定理依概率收敛:设Y 1,Y 2,…,Y n ,…是一个随机变量序列,a 是一个常数.若对于任意正数ε,有lim n→∞P {|Y n −a |<ε}=1,则称序列Y 1,Y 2,…,Y n ,…依概率收敛于a,记为Y n P→a.伯努利大数定理:P(A)=P,频率nA n(n 次重复独立试验),对∀ε>0,lim n→∞P {|n A n−P|<ε}=1.辛钦大数定理:已知R.V . X 1,X 2,…,X n ,…相互独立且E(X i )=μ.(i=1,2,…)则∀ε>0,lim n→∞P {|1n ∑X k −μn k=1|<ε}=1.独立同分布的中心极限定理:设R.V .序列:X 1,X 2,…,X n ,…相互独立,并且E(X k )=μ, D(X k )=σ2,k=1,2,…则k n k=1√nσ2̃N(0,1) 标准正态分布(高斯分布)近似计算 李雅普诺夫中心极限定理:棣莫弗-拉普拉斯中心极限定理:设R.V. ηn ~B(n,p),则对任意x 有{η−np √np (1−p )≤x}≈Φ(x) 二项分布(n→∞)→ 正态分布第六章 样本及抽样分布总体:试验的全部可能的观察值.简单随机样本:设X 是具有分布函数F 的随机变量,若X 1,X 2,…,X n 是具有同一分布函数F 的、相互独立的随机变量,则称X 1,X 2,…,X n 为从分布函数F 得到的容量为n 的简单随机样本,简称样本.统计量:不含未知参数的样本的函数g(X 1,X 2,…,X n ).样本平均值:X̅=1n∑X i ni=1 样本方差:S 2=1n −1∑(X i −X ̅)2n i=1=1n −1(∑X i 2ni=1−nX̅2) 样本k 阶原点矩:A k =1n∑X i k ni=1,k =1,2,…样本k 阶中心矩:B k =1n∑(X i −X̅)k ni=1,k =1,2,… χ2分布:χ2=X 12+X 22+⋯+X n 2,服从自由度为n 的χ2分布,记为χ2~χ2(n).χ2(n)分布的概率密度为f (y )={12n 2Γ(n 2)yn 2−1e −y 2,y >0 0, otℎerwiseGamma 函数:Γ(x )=∫e −t t x−1dt +∞0,(x >0)t 分布:设X ~N(0,1),Y ~χ2(n),且X,Y 相互独立随机变量t=√n,服从自由度为n 的t 分布.记为t ~t(n).t(n)分布的概率密度函数为h (t )=Γ(n +12)√πnΓ(n 2)(1+t 2n )−n+12F 分布:设U ~χ2(n 1),V ~χ2(n 2),且U,V 相互独立随机变量F=Un 1V n 2,服从自由度为(n 1,n 2)的F 分布,记为F ~F(n 1,n 2). 密度函数为ψ(y).密度函数图形轮廓:χ2分布,F 分布类似,t 分布对称上α分位点:χα2(n),t α(n),F α(n 1,n 2) F 1-α(n 1,n 2)=1Fα(n 1,n 2):F 分布上分位点的重要性质,用来求表中未列出的常用上α分位点.关于样本均值、样本方差的重要结果1.设X 1,X 2,…,X n 是来自总体X(不管服从什么分布,只要它的均值和方差存在)的样本,且有E(X)=μ,D(X)=σ2n .2.设总体X~N(μ,σ2),X1,X2,…,X n是来自X的样本,则有);1)X̅~N(μ,σ2n~χ2(n−1);2)(n−1)S2σ23)X̅与S2相互独立;~t(n−1);4)X̅−μS√n3.对于两个正态总体X~N(μ1,σ12),Y~N(μ2,σ22),有定理四的重要结果.第七章 参数估计矩估计量:θ̂i =θi(A 1,A 2,…,A k ),i=1,2,…,k 作为θi 的估计量,A i 是样本矩. 最大似然估计量:θ̂(X 1,X 2,…,X n ),使L(x 1,x 2,…x n ;θ̂)=max θ∈ΘL(x 1,x 2,…,x n ;θ) 估计量的评选标准:无偏性:若估计量θ̂=θ̂(X 1,X 2,…,X n )的数学期望E(θ̂)存在,且对于任意θ∈~Θ有E(θ̂)=θ. 有效性:θ̂1=θ̂1(X 1,X 2,…,X n )与 θ̂2=θ̂2(X 1,X 2,…,X n )都是θ的无偏估计量,若对于任意θ∈Θ,有D(θ̂1)≤D(θ̂2)且至少对于某一个θ∈Θ上式中的不等号成立. 相合性:设θ̂(X 1,X 2,…,X n )为参数θ的估计量,若对与任意θ∈Θ,当n →∞时θ̂(X 1,X 2,…,X n )依概率收敛于θ.参数θ的置信水平为1-α的置信区间:θ的两个矩估计量θ=θ(X 1,X 2,…,X n )θ=θ(X 1,X 2,…,X n )给定的值α(0<α<1)有 P{θ<θ<θ}=1-α. 称(θ,θ)为置信水平为(1-α)的置信区间.枢轴量:一个样本和参数的函数W(X 1,X 2,…,X n ;θ),W 的分布不依赖于θ及其它未知参数. 参数θ的单侧置信上限和单侧置信下限P{θ>θ}≥1-α,即(θ,+∞)为θ的单侧置信区间,θ为单侧置信下限. P{θ<θ}≥1-α,即(θ,+∞)为θ的单侧置信区间,θ为单侧置信上限. 单个正态总体均值置信区间:若σ2已知,找U=X−μσ√n~N(0,1),得到μ的一个置信水平为1-α的置信区间为(X √nz α2)若σ2未知,E(S 2)=σ2,将σ换成S=√S 2找T=X−μS √n~t(n −1),得到μ的一个置信水平为1-α的置信区间为(X ±√nt α2(n −1))单个正态总体方差置信区间:σ2的无偏估计为S 2,(n −1)S 2σ2~χ2(n −1) P{χ1−α22(n −1)<(n −1)S 2σ2<χα22(n −1)}=1−α P {(n −1)S 2χα22(n −1)<σ2<(n −1)S 2χ1−α22(n −1)}=1−α 得到σ2的一个置信水平为1-α的置信区间为((n −1)S 2χα22(n −1),(n −1)S 2χ1−α22(n −1)) 单侧置信上限与单侧置信下限σ2已知,关于μ的单侧置信区间选U=X−μσ√n~N(0,1)单侧置信上限为μ=X √n α单侧置信下限为μ=X√nασ2未知,选T=X−μS√n~t(n−1)单侧置信上限为μ=X√nα(n−1)单侧置信下限为μ=X√nα(n−1)关于σ2,选(n−1)S 2σ2~χ2(n−1)单侧置信上限为σ2=(n−1)S 2χ1−α2(n−1)单侧置信下限为σ2=(n−1)S 2χα2(n−1)两个正态总体均值差、方差比的置信区间、单侧置信上限与单侧置信下限第八章 假设检验原假设:H 0:μ=μ0备择假设:H 1:μ≠μ0(原假设被拒绝后可供选择的假设) 检验统计量:Z =X−μ0σ√n单边检验:(右边检验)H 0:μ=μ0,H 1:μ>μ0(左边检验)H 0:μ=μ0,H 1:μ<μ0 双边检验:形如H 0:μ=μ0, H 1:μ≠μ0的检验显著性水平:关于x 与μ0有无差异的判断是在显著性水平α之下作出的. 拒绝域:区域C 中取某个值时拒绝原假设,如|z|>z α2.显著性检验:只对犯第I 类错误的概率加以控制,而不考虑犯第II 类错误的概率的检验. 一个正态总体的参数的检验:μ的检验σ2已知:利用统计量Z=X−μ0σ√n~N(0,1)确定拒绝域|Z|≥z α2σ2未知:|t|=|X−μ0S √n|~t(n-1)σ2的检验:χ2分布χ2=(n−1)S 2σ02~χ2(n −1)k 1=χ1−α22(n −1),k 2=χα22(n −1) 拒绝域为(n−1)S 2σ02≤k 1 或(n−1)S 2σ02≥k 2。

考研数学《概率论与数理统计》知识点总结[免费专享]

考研数学《概率论与数理统计》知识点总结[免费专享]

第一章 概率论的基本概念定义: 随机试验E 的每个结果样本点组成样本空间S ,S 的子集为E 的随机事件,单个样本点为基本事件.事件关系:1.A ⊂B ,A 发生必导致B 发生.2.A B 和事件,A ,B 至少一个发生,A B 发生. 3.A B 记AB 积事件,A ,B 同时发生,AB 发生. 4.A -B 差事件,A 发生,B 不发生,A -B 发生.5.A B=Ø,A 与B 互不相容(互斥),A 与B 不能同时发生,基本事件两两互不相容.6.AB=S 且A B=Ø,A 与B 互为逆事件或对立事件,A 与B 中必有且仅有一个发生,记B=A S A -=.事件运算: 交换律、结合律、分配率略.德摩根律:B A B A =,B A B A =.概率: 概率就是n 趋向无穷时的频率,记P(A).概率性质:1.P (Ø)=0.2.(有限可加性)P (A 1 A 2 … A n )=P (A 1)+P (A 2)+…+P (A n ),A i 互不相容. 3.若A ⊂B ,则P (B -A)=P (B)-P (A).4.对任意事件A ,有)A (1)A (P P -=.5.P (A B)=P (A)+P (B)-P (AB).古典概型: 即等可能概型,满足:1.S 包含有限个元素.2.每个基本事件发生的可能性相同.等概公式: 中样本点总数中样本点数S A )A (==n k P . 超几何分布: ⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫ ⎝⎛=n N k n D N k D p ,其中ra C r a =⎪⎪⎭⎫ ⎝⎛. 条件概率:)A ()AB ()A B (P P P =. 乘法定理:)A ()A B ()AB C ()ABC ()A ()AB ()AB (P P P P P P P ==.全概率公式: )B ()B A ()B ()B A ()B ()B A ()A (2211n n P P P P P P P +++= ,其中i B 为S 的划分. 贝叶斯公式: )A ()B ()B A ()A B (P P P P i i i =,∑==nj j j B P B A P A P 1)()()(或)()()()()()()(B P B A P B P B A P B P B A P A B P +=.独立性: 满足P (AB)=P (A)P (B),则A ,B 相互独立,简称A ,B 独立.定理一: A ,B 独立,则.P (B |A)=P (B). 定理二: A ,B 独立,则A 与B ,A 与B ,A 与B 也相互独立.第二章 随机变量及其分布(0—1)分布: k k p p k X P --==1)1(}{,k =0,1 (0<p <1).伯努利实验:实验只有两个可能的结果:A 及A .二项式分布: 记X~b (n ,p ),kn k k n p p C k X P --==)1(}{. n 重伯努利实验:独立且每次试验概率保持不变.其中A 发生k 次,即二项式分布.泊松分布: 记X~π(λ),!}{k e k X P k λλ-==, ,2,1,0=k .泊松定理: !)1(lim k e p p C k kn k knn λλ--∞→=-,其中λ=np .当20≥n ,05.0≤p 应用泊松定理近似效果颇佳.随机变量分布函数: }{)(x X P x F ≤=,+∞<<∞-x .)()(}{1221x F x F x X x P -=≤<.连续型随机变量:⎰∞-=xt t f x F d )()(,X 为连续型随机变量,)(x f 为X 的概率密度函数,简称概率密度.概率密度性质:1.0)(≥x f ;2.1d )(=⎰+∞∞-x x f ;3.⎰=-=≤<21d )()()(}{1221x x x x f x F x F x X x P ;4.)()(x f x F =',f (x )在x 点连续;5.P {X=a }=0.均匀分布: 记X~U(a ,b );⎪⎩⎪⎨⎧<<-=其它,,01)(bx a ab x f ;⎪⎩⎪⎨⎧≥<≤--<=b x b x a a b a x a x x F ,,,10)(. 性质:对a ≤c <c +l ≤b ,有 a b l l c X c P -=+≤<}{ 指数分布:⎪⎩⎪⎨⎧>=-其它,,001)(x e x f x θθ;⎩⎨⎧>-=-其它,,001)(x e x F x θ. 无记忆性: }{}{t X P s X t s X P >=>+>. 正态分布: 记),(~2σμN X ;]2)(ex p[21)(22σμσπ--=x x f ;t t x F xd ]2)(ex p[21)(22⎰∞---=σμσπ.性质: 1.f (x )关于x =μ对称,且P {μ-h <X ≤μ}=P {μ<X ≤μ+h };2.有最大值f (μ)=(σπ2)-1. 标准正态分布:]2exp[21)(2x x -=πϕ;⎰∞--=Φxt t x d ]2ex p[21)(2π.即μ=0,σ=1时的正态分布X ~N(0,1)性质:)(1)(x x Φ-=-Φ.正态分布的线性转化: 对),(~2σμN X 有)1,0(~N X Z σμ-=;且有)(}{}{)(σμσμσμ-Φ=-≤-=≤=x x X P x X P x F .正态分布概率转化: )()(}{1221σμσμ-Φ--Φ=≤<x x x X x P ;1)(2)()(}{-Φ=-Φ-Φ=+<<-t t t t X t P σμσμ.3σ法则: P =Φ(1)-Φ(-1)=68.26%;P =Φ(2)-Φ(-2)=95.44%;P =Φ(3)-Φ(-3)=99.74%,P 多落在(μ-3σ,μ+3σ)内. 上ɑ分位点: 对X~N(0,1),若z α满足条件P {X>z α}=α,0<α<1,则称点z α为标准正态分布的上α分位点. 常用 上ɑ分位点: 0.001 0.005 0.01 0.025 0.05 0.10 3.0902.5762.3261.9601.6451.282Y 服从自由度为1的χ2分布:设X 密度函数f X (x ),+∞<<∞-x ,若Y=X 2,则⎪⎩⎪⎨⎧≤>-+=000)]()([21)(y y y f y f y y f X XY ,,若设X ~N(0,1),则有⎪⎩⎪⎨⎧≤>=--00021)(221y y e y y f y Y ,,π定理:设X 密度函数f X (x ),设g (x )处处可导且恒有g ′(x )>0(或g ′(x )<0),则Y=g (X)是连续型随机变量,且有⎩⎨⎧<<'=其他,,0)()]([)(βαy y h y h f y f X Yh (y )是g (x )的反函数;①若+∞<<∞-x ,则α=min{g (−∞),g (+∞)},β=max{g (−∞),g (+∞)};②若f X (x )在[a ,b ]外等于零,g (x )在[a ,b ]上单调,则α=min{g (a ),g (b )},β=max{g (a ),g (b )}.应用: Y=aX +b ~N(a μ+b ,(|a |σ)2).第三章 多维随机变量及其分布二维随机变量的分布函数: 分布函数(联合分布函数):)}(){(),(y Y x X P y x F ≤≤= ,记作:},{y Y x X P ≤≤. ),(),(),(),(},{112112222121y x F y x F y x F y x F y Y y x X x P +--=≤<≤<.F (x ,y )性质: 1.F (x ,y )是x 和y 的不减函数,即x 2>x 1时,F (x 2,y )≥F (x 1,y );y 2>y 1时,F (x ,y 2)≥F (x ,y 1).2.0≤F (x ,y )≤1且F (−∞,y )=0,F (x ,−∞)=0,F (−∞,−∞)=0,F (+∞,+∞)=1.3.F (x +0,y )=F (x ,y ),F (x ,y +0)=F (x ,y ),即F (x ,y )关于x 右连续,关于y 也右连续.4.对于任意的(x 1,y 1),(x 2,y 2),x 2>x 1,y 2>y 1,有P {x 1<X ≤x 2,y 1<Y ≤y 2}≥0.离散型(X ,Y ):0≥ij p ,111=∑∑∞=∞=ij j i p ,ij yy x x p y x F i i ∑∑=≤≤),(.连续型(X ,Y ):v u v u f y x F y xd d ),(),(⎰⎰∞-∞-=.f (x ,y )性质: 1.f (x ,y )≥0.2.1),(d d ),(=∞∞=⎰⎰∞∞-∞∞-F y x y x f .3.y x y x f G Y X P G⎰⎰=∈d d ),(}),{(.4.若f (x ,y )在点(x ,y )连续,则有),(),(2y x f yx y x F =∂∂∂. n 维: n 维随机变量及其分布函数是在二维基础上的拓展,性质与二维类似. 边缘分布:F x (x ),F y (y )依次称为二维随机变量(X ,Y )关于X 和Y 的边缘分布函数,F X (x )=F (x ,∞),F Y (y )=F (∞,y ).离散型: *i p 和j p *分别为(X ,Y )关于X 和Y 的边缘分布律,记}{1i ij j i x X P p p ==∑=∞=*,}{1j ij i j y Y P p p ==∑=∞=*. 连续型:)(x f X ,)(y f Y 为(X ,Y )关于X 和Y 的边缘密度函数,记⎰∞∞-=y y x f x f X d ),()(,⎰∞∞-=x y x f y f Y d ),()(. 二维正态分布:]})())((2)([)1(21exp{121),(2222212121212221σμσσμμρσμρρσπσ-+-------=y y x x y x f . 记(X ,Y )~N (μ1,μ2,σ12,σ22,ρ)]2)(exp[21)(21211σμσπ--=x x f X ,∞<<∞-x .]2)(exp[21)(22222σμσπ--=y y f Y ,∞<<∞-y . 离散型条件分布律: jij j j i j i p p y Y P y Y x X P y Y x X P *=======}{},{}{. *=======i ij i j i i j p p x X P y Y x X P x X y Y P }{},{}{.连续型条件分布:条件概率密度:)(),()(y f y x f y x f Y Y X =|| 条件分布函数:x y f y x f y Y x X P y x F xY Y X d )(),(}{)(⎰∞-==≤=||| )(),()(x f y x f x y f X X Y =|| y x f y x f x X y Y P x y F yX X Y d )(),(}{)(⎰∞-==≤=||| 含义:当0→ε时,)|(d )|(}|{||y x F x y x f y Y y x X P Y X xY X =≈+≤<≤⎰∞-ε.均匀分布: 若⎪⎩⎪⎨⎧∈=其他,0),(,1),(Gy x Ay x f ,则称(X ,Y)在G 上服从均匀分布. 独立定义:若P {X ≤x ,Y ≤y }=P {X ≤x }P {Y ≤y },即F (x ,y )=F x (x )F y (y ),则称随机变量X 和Y 是相互独立的. 独立条件或可等价为:连续型:f (x ,y )=f x (x )f y (y );离散型:P {X =x i ,Y =y j }=P {X =x i }P {Y =y j }.正态独立: 对于二维正态随机变量(X ,Y ),X 和Y 相互对立的充要条件是:参数ρ=0.n 维延伸: 上述概念可推广至n 维随机变量,要注意的是边缘函数或边缘密度也是多元(1~n -1元)的.定理:设(X 1,X 2,…,X m )和(Y 1,Y 2,…,Y n )相互独立,则X i 和Y j 相互独立.又若h ,g 是连续函数,则h (X 1,X 2,…,X m )和g (Y 1,Y 2,…,Y n )相互独立.Z=X+Y 分布: 若连续型(X ,Y )概率密度为f (x ,y ),则Z=X+Y 为连续型且其概率密度为 ⎰∞∞-+-=y y y z f z f Y X d ),()(或⎰∞∞-+-=x x z x f z f Y X d ),()(.f X 和f Y 的卷积公式: 记⎰∞∞-+-==y y f y z f z f f f Y X Y X Y X d )()()(*⎰∞∞--=x x z f x f Y X d )()(,其中除继上述条件,且X 和Y相互独立,边缘密度分别为f X (x )和f Y (y ).正态卷积:若X 和Y 相互独立且X ~N (μ1,σ12),记Y ~N (μ2,σ22),则对Z=X+Y 有Z ~N (μ1+μ2,σ12+σ22).1.上述结论可推广至n 个独立正态随机变量.2.有限个独立正态随机变量的线性组合仍服从正态分布.伽马分布:记),(~θαΓX ,0>α,0>θ.⎪⎩⎪⎨⎧>Γ=--其他,,00)(1)(1x e x x f x θαααθ,其中⎰+∞--=Γ01d )(t e t t αα.若X 和Y 独立且X ~Γ(α,θ),记Y ~Γ(β,θ),则有X+Y~Γ(α+β,θ).可推广到n 个独立Γ分布变量之和.X YZ =:⎰∞∞-=x xz x f x z f X Y d ),()(,若X 和Y 相互独立,则有⎰∞∞-=x xz f x f x z f Y X X Y d )()()(.XYZ =分布: ⎰∞∞-=xxzx f x z f XY d ),(1)(,若X 和Y 相互独立,则有⎰∞∞-=x x z f x f x z f Y X XY d )()(1)(. 大小分布:若X 和Y 相互独立,且有M =max{X ,Y }及N =min{X ,Y },则M 的分布函数:F max (z )=F X (z )F Y (z ),N 的分布函数:F min (z )=1-[1-F X (z )][1-F Y (z )],以上结果可推广到n 个独立随机变量的情况.第四章 随机变量的数字特征数学期望: 简称期望或均值,记为E (X );离散型:k k k p x X E ∑=∞=1)(.连续型:⎰∞∞-=x x xf X E d )()(.定理: 设Y 是随机变量X 的函数:Y =g (X )(g 是连续函数).1.若X 是离散型,且分布律为P {X =x k }=p k ,则: k k k p x g Y E )()(1∑=∞=.2.若X 是连续型,概率密度为f (x ),则:⎰∞∞-=x x f x g Y E d )()()(.定理推广: 设Z 是随机变量X ,Y 的函数:Z =g (X ,Y )(g 是连续函数).1.离散型:分布律为P {X =x i ,Y =y j }=p ij ,则:ij j i i j p y x g Z E ),()(11∑∑=∞=∞=. 2.连续型:⎰⎰∞∞-∞∞-=y x y x f y x g Z E d d ),(),()(期望性质:设C 是常数,X 和Y是随机变量,则:1.E (C )=C .2.E (CX )=CE (X ).3.E (X +Y )=E (X )+E (Y ). 4.又若X 和Y 相互独立的,则E (XY )=E (X )E (Y ).方差:记D (X )或Var(X ),D (X )=V ar(X )=E {[X -E (X )]2}.标准差(均方差): 记为σ(X ),σ(X )= .通式:22)]([)()(X E X E X D -=. k k k p X E x X D 21)]([)(-∑=∞=,⎰∞∞--=x x f x E x X D d )()]([)(2.标准化变量: 记σμ-=x X *,其中μ=)(X E ,2)(σ=X D ,*X 称为X 的标准化变量. 0)(*=X E ,1)(*=X D .方差性质: 设C 是常数,X 和Y 是随机变量,则: 1.D (C )=0. 2.D (CX )=C 2D (X ),D (X +C )=D (X ).3.D (X +Y )=D (X )+D (Y )+2E {(X -E (X ))(Y -E (Y ))},若X ,Y 相互独立D (X +Y )=D (X )+D (Y ).4.D (X )=0的充要条件是P {X =E (X )}=1.正态线性变换: 若),(~2i i i N X σμ,i C 是不全为0的常数,则),(~22112211i i n i i i n i n n C C N X C X C X C σμ∑∑+++== .切比雪夫不等式: 22}{εσεμ≤≥-X P 或221}{εσεμ-≥<-X P ,其中)(X E =μ,)(2X D =σ,ε为任意正数.协方差:记)]}()][({[),Cov(Y E Y X E X E Y X --=.X 与Y的相关系数:)()(),Cov(Y D X D Y X XY =ρ.D (X +Y )=D (X )+D (Y )+2Cov(X ,Y ),Cov(X ,Y )=E (XY )-E (X )E (Y ).性质: 1.Cov(aX ,bY )=ab Cov(X ,Y ),a ,b 是常数.2.Cov(X 1+X 2,Y )=Cov(X 1,Y )+Cov(X 2,Y ). 系数性质: 令e =E [(Y -(a +bX ))2],则e 取最小值时有)()1(]))([(2200min Y D X b a Y E e XY ρ-=+-=,其中)()(00X E b Y E a -=,)(),Cov(0X D Y X b =.1.|ρXY |≤1.2.|ρXY |=1的充要条件是:存在常数a ,b 使P {Y =a +bX }=1.)(x D|ρXY|越大e越小X和Y线性关系越明显,当|ρXY|=1时,Y=a+bX;反之亦然,当ρXY=0时,X和Y不相关.X和Y相互对立,则X和Y不相关;但X和Y不相关,X和Y不一定相互独立.定义:k阶矩(k阶原点矩):E(X k ).n维随机变量X i的协方差矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛=nnnnnnccccccccc212222111211C,),Cov(jiijXXc==E{[X i-E(X i)][X j-E(X j)]}.k+l阶混合矩:E(X k Y l ).k阶中心矩:E{[X-E(X)] k }.k+l阶混合中心矩:E{[X-E(X)]k[Y-E(Y)]l}.n维正态分布:)}()(21ex p{det)2(1),,,(1T221μXCμXC---=-nnxxxfπ,T21T21),,,(),,,(nnxxxμμμ==μX.性质:1.n维正态随机变量(X1,X2,…,X n)的每一个分量X i (i=1,2,…,n)都是正态随机变量,反之,亦成立.2.n维随机变量(X1,X2,…,X n)服从n维正态分布的充要条件是X1,X2,…,X n的任意线性组合l1X1+l2X2+…+l n X n服从一维正态分布(其中l1,l2,…,l n不全为零).3.若(X1,X2,…,X n)服从n维正态分布,且Y1,Y2,…,Y k是X j (j=1,2,…,n)的线性函数,则(Y1,Y2,…,Y k)也服从多维正态分布.4.若(X1,X2,…,X n)服从n维正态分布,则“X i 相互独立”与“X i 两两不相关”等价.第五章大数定律及中心极限定理弱大数定理:若X1,X2,…是相互独立并服从同一分布的随机变量序列,且E(X k)=μ,则对任意ε>0有11lim1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμknknXnP或→μPX,knkXnX11=∑=.定义:Y1,Y2,…,Y n ,…是一个随机变量序列,a是一个常数.若对任意ε>0,有1}|{|lim=<-∞→εaYPnn则称序列Y1,Y2,…,Yn,…依概率收敛于a.记aY Pn−→−伯努利大数定理:对任意ε>0有1lim=⎭⎬⎫⎩⎨⎧<-∞→εpnfP An或0lim=⎭⎬⎫⎩⎨⎧≥-∞→εpnfP An.其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.中心极限定理定理一:设X1,X2,…,X n ,…相互独立并服从同一分布,且E(Xk)=μ,D(Xk)=σ2 >0,则n→∞时有σμnnXknk)(1-∑=N(0,1)或nXσμ-~N(0,1)或X~N(μ,n2σ).定理二:设X1,X2,…,X n ,…相互独立且E(X k)=μk,D(X k)=σk2 >0,若存在δ>0使n→∞时,}|{|1212→-∑+=+δδμkknknXEB,则nknkknkBX)(11μ==∑-∑~N(0,1),记212knknBσ=∑=.定理三:设),(~pnbnη,则n→∞时,Npnpnpn~)1()(--η(0,1),knknX1=∑=η.第六章样本及抽样分布定义:总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.定义:样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.频率直方图:图形:以横坐标小区间为宽,纵坐标为高的跨越横轴的几个小矩形.横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).图形特点:外轮廓接近于总体的概率密度曲线.纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).定义:样本p分位数:记x p,有1.样本x i中有np个值≤x p.2.样本中有n(1-p)个值≥x p.~ 近似的箱线图:x p 选择: 记⎪⎩⎪⎨⎧∈+∉=++N np x x N np x x np np np p 当,当,][211)()()1]([. 分位数x 0.5,记为Q 2或M ,称为样本中位数.分位数x 0.25,记为Q 1,称为第一四分位数. 分位数x 0.75,记为Q 3,称为第三四分位数.图形:图形特点:M 为数据中心,区间[min ,Q 1],[Q 1,M ],[M ,Q 3],[Q 3,max]数据个数各占1/4,区间越短数据密集.四分位数间距:记IQR =Q 3-Q 1;若数据X<Q 1-1.5IQR 或X>Q 3+1.5IQR ,就认为X 是疑似异常值.抽样分布:样本平均值: i ni X n X 11=∑=样本方差: )(11)(11221212X n X n X X n S i n i i n i -∑-=-∑-=== 样本标准差: 2S S =样本k 阶(原点)矩: k i n i k X n A 11=∑=,k ≥1样本k 阶中心矩: k i n i k X X n B )(11-∑==,k ≥2 经验分布函数: )(1)(x S nx F n =,∞<<∞-x . )(x S 表示F 的一个样本X 1,X 2,…,X n 中不大于x 的随机变量的个数.自由度为n 的χ2分布:记χ2~χ2(n ),222212n X X X +++= χ,其中X 1,X 2,…,X n 是来自总体N (0,1)的样本.E (χ2 )=n ,D (χ2)=2n . χ12+χ22~χ2(n 1+n 2). ⎪⎩⎪⎨⎧>Γ=--其他,,00)2(21)(2122y e x n y f y n n .χ2分布的分位点:对于0<α<1,满足αχχαχα==>⎰∞y y f n P n )(222d )()}({,则称)(2n αχ为)(2n χ的上α分位点. 当n 充分大时(n >40),22)12(21)(-+≈n z n ααχ,其中αz 是标准正态分布的上α分位点. 自由度为n的t 分布: 记t ~t (n ),nY Xt /=, 其中X~N (0,1),Y~χ2(n ),X ,Y 相互独立.2)1(2)1(]2[]2)1([)(+-+Γ+Γ=n n t n n n t h π h (t )图形关于t =0对称;当n 充分大时,t 分布近似于N (0,1)分布.t 分布的分位点:对于0<α<1,满足ααα==>⎰∞t t h n t t P n t )(d )()}({,则称)(n t α为)(n t 的上α分位点.由h (t )对称性可知t 1-α(n )=-t α(n ).当n >45时,t α(n )≈z α,z α是标准正态分布的上α分位点.自由度为(n 1,n 2)的F分布:记F ~F (n 1,n 2),21n V n U F =,其中U~χ2(n 1),V~χ2(n 2),X ,Y 相互独立.1/F ~F (n 2,n 1)⎪⎩⎪⎨⎧>+ΓΓ+Γ=+-其他,,00]1)[2()2()](2)([)(2)(21211)2(221212111x n y n n n y n n n n y n n n n ψF 分布的分位点:对于0<α<1,满足αψαα==>⎰∞y y n n F F P n n F ),(2121d )()},({,则称),(21n n F α为),(21n n F 的上α分位点.重要性质:F 1-α(n 1,n 2)=1/F α(n 1,n 2).定理一: 设X 1,X 2,…,X n 是来自N (μ,σ2)的样本,则有),(~2n N X σμ,其中X 是样本均值.定理二:设X 1,X 2,…,X n 是来自N (μ,σ2)的样本,样本均值和样本方差分别记为 X ,2S ,则有1.)1(~)1(222--n S n χσ;2.X 与2S 相互独立.定理三:设X 1,X 2,…,X n 是来自N (μ,σ2)的样本,样本均值和样本方差分别记为X ,2S ,则有)1(~--n t nS X μ.定理四: 设X 1,X 2,…,X n 1 与Y 1,Y 2,…,Y n 2分别是来自N (μ1,σ12)和N (μ2,σ22)的样本,且相互独立.设这两个样本的样本均值和样本方差分别记为X ,Y ,21S ,22S ,则有1.)1,1(~2122212221--n n F S S σσ.min Q 1 M Q 3 max2.当σ12=σ22=σ2时,)2(~)()(21121121-++-----n n t n n S Y X w μμ,其中2)1()1(212222112-+-+-=n n S n S n S w,2w w S S =. 第七章 参数估计定义: 估计量:),,,(ˆ21n X X X θ,估计值:),,,(ˆ21nx x x θ,统称为估计. 矩估计法: 令)(ll X E =μ=li n i l X n A 11=∑=(k l ,,2,1 =)(k 为未知数个数)联立方程组,求出估计θˆ. 设总体X 均值μ及方差σ2都存在,则有X A ==1ˆμ,212212122)(11ˆX X n X X n A A i n i i n i -∑=-∑=-===σ. 最大似然估计法: 似然函数:离散:);()(1θθi n i x p L =∏=或连续:);()(1θθi ni x f L =∏=,)(θL 化简可去掉与θ无关的因式项.θˆ即为)(θL 最大值,可由方程0)(d d=θθL 或0)(ln d d =θθL 求得. 当多个未知参数θ1,θ1,…,θk 时:可由方程组 0d d =L i θ或0ln d d =L i θ(k i ,,2,1 =)求得. 最大似然估计的不变性:若u =u (θ)有单值反函数θ=θ(u ),则有)ˆ(ˆθu u=,其中θˆ为最大似然估计. 截尾样本取样: 定时截尾样本:抽样n 件产品,固定时间段t 0内记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ≤t 0)和失效产品数量. 定数截尾样本:抽样n 件产品,固定失效产品数量数量m 记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ).结尾样本最大似然估计: 定数截尾样本:设产品寿命服从指数分布X~e (θ),θ即产品平均寿命.产品t i 时失效概率P {t =t i }≈f (t i )d t i ,寿命超过t m 的概率θm t m et t F -=>}{,则)(}){()(1i mi mn m mnt P t t F C L =-∏>=θ,化简得)(1)(m t s m e L ---=θθθ,由0)(ln d d =θθL 得:mt s m )(ˆ=θ,其中s (t m )=t 1+t 2+…+t m +(n -m )t m ,称为实验总时间. 定时截尾样本:与定数结尾样本讨论类似有s (t 0)=t 1+t 2+…+t m +(n -m )t 0,)(01)(t s m e L ---=θθθ,mt s )(ˆ0=θ,. 无偏性: 估计量),,,(ˆ21nX X X θ的)ˆ(θE 存在且θθ=)ˆ(E ,则称θˆ是θ的无偏估计量. 有效性:),,,(ˆ211n X X X θ与),,,(ˆ212n X X X θ都是θ的无偏估计量,若)ˆ()ˆ(21θθD D ≤,则1ˆθ较2ˆθ有效. 相合性: 设),,,(ˆ21nX X X θθ的估计量,若对于任意0>ε有1}|ˆ{|lim =<-∞→εθθP n ,则称θˆ是θ的相合估计量. 置信区间:αθθθ-≥<<1)},,,(),,,({2121n n X X X X X X P ,θ和θ分别为置信下限和置信上限,则),(θθ是θ的一个置信水平为α-1置信区间,α-1称为置信水平,10<<α.正态样本置信区间: 设X 1,X 2,…,X n 是来自总体X ~N (μ,σ2)的样本,则有μ的置信区间:枢轴量W W 分布 a ,b 不等式 置信水平 置信区间)1,0(~N n X σμ-⇒ασμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-12z n X P ⇒)(2ασz n X ± 其中z α/2为上α分位点θ置信区间的求解: 1.先求枢轴量:即函数W =W (X 1,X 2,…,X n ;θ),且函数W 的分布不依赖未知参数. 如上讨论标注 2.对于给定置信水平α-1,定出两常数a ,b 使P {a <W <b }=α-1,从而得到置信区间. (0-1)分布p 的区间估计:样本容量n >50时,⇒--∞→)1,0(~)1()(lim N p np np X n n {}⇒-≈<--αα1)1()(2z p np np X n P0)2()(222222<++-+X n p z X n p z n αα⇒若令22αz n a +=,)2(22αz X n b +-=,2X n c =,则有置信区间(a ac b b 2)4(2---,a ac b b 2)4(2-+-).单侧置信区间:若αθθ-≥>1}{P 或αθθ-≥<1}{P ,称(θ,∞)或(∞-,θ)是θ的置信水平为α-1的单侧置信区间.正态总体均值、方差的置信区间与单侧置信限(置信水平为α-1)待估 其他 枢轴量W 的分布置信区间单侧置信限一个正态总体μσ2已知)1,0(~N nX Z σμ-=)(2ασz nX ±ασμz nX +=,ασμz nX -=μσ2未知 )1(~--=n t nS X t μ⎪⎭⎫ ⎝⎛±2αt n S X αμt n S X +=,αμt nSX -= σ2μ未知)1(~)1(2222--=n S n χσχ⎪⎪⎭⎫⎝⎛---2212222)1(,)1(ααχχS n S n 2122)1(αχσ--=S n ,222)1(αχσS n -=两个正态总体μ1-μ2σ12,σ22已知)1,0(~)(22212121N n n Y X Z σσμμ+---=⎪⎪⎭⎫ ⎝⎛+±-2221212n n z Y X σσα2221212122212121n n z Y X n n z Y X σσμμσσμμαα+--=-++-=-μ1-μ2σ12=σ22=σ2 未知)2(~)()(21121121-++---=--n n t n n S Y X t w μμ2)1()1(212222112-+-+-=n n Sn S n S w()12112--+±-nn S tY X wα2w w S S =121121121121----+--=-++-=-n n S t Y X n n S t Y X w w ααμμμμσ12/σ22μ1,μ2未知)1,1(~2122212221--=n n F S S F σσ⎪⎪⎭⎫ ⎝⎛-212221222211,1ααF S S F S S ασσ-=1222122211F S S ,ασσF S S 122212221=单个总体X ~N (μ,σ2),两个总体X ~N (μ1,σ12),Y ~N (μ2,σ22).第八章 假设实验定义: H 0:原假设或零假设,为理想结果假设;H 1:备择假设,原假设被拒绝后可供选择的假设. 第Ⅰ类错误:H 0实际为真时,却拒绝H 0.第Ⅱ类错误:H 0实际为假时,却接受H 0.显著性检验:只对犯第第Ⅰ类错误的概率加以控制,而不考虑第Ⅱ类错误的概率的检验.P {当H 0为真拒绝H 0}≤α,α称为显著水平.拒绝域:取值拒绝H 0.临界点:拒绝域边界.双边假设检验:H 0:θ=θ0,H 1:θ≠θ0.右边检验:H 0:θ≤θ0,H 1:θ>θ0.左边检验:H 0:θ≥θ0,H 1:θ<θ0.正态总体均值、方差的检验法(显著性水平为α)原假设H 0备择假设H 1检验统计量拒绝域 1 σ2已知μ≤μ0 μ>μ0 nX Z σμ0-=z ≥z α μ≥μ0μ<μ0z ≤-z αμ=μ0μ≠μ0|z|≥zα/22 σ2未知μ≤μ0μ>μ0nSXt0μ-=t≥tα(n-1) μ≥μ0μ<μ0t≤-tα(n-1) μ=μ0μ≠μ0|t|≥tα/2(n-1)3 σ1,σ2已知μ1-μ2≤δμ1-μ2>δ222121nnYXZσσδ+--=z≥zαμ1-μ2≥δμ1-μ2<δz≤-zαμ1-μ2=δμ1-μ2≠δ|z|≥zα/24 σ12=σ22=σ2未知μ1-μ2≤δμ1-μ2>δ1211--+--=nnSYXtwδ2)1()1(212222112-+-+-=nnSnSnSwt≥tα(n1+n2-2) μ1-μ2≥δμ1-μ2<δt≤-tα(n1+n2-2)μ1-μ2=δμ1-μ2≠δ|t|≥tα/2(n1+n2-2)5 μ未知σ2≤σ02σ2>σ02222)1(σχSn-=χ2≥χα2(n-1)σ2≥σ02σ2<σ02χ2≤χ21-α(n-1)σ2=σ02σ2≠σ02χ2≥χ2α/2(n-1)或χ2≤χ21-α/2(n-1)6 μ1,μ2未知σ12≤σ22σ12>σ222221SSF=F≥Fα(n1-1,n2-1) σ12≥σ22σ12<σ22F≤F1-α(n1-1,n2-1)σ12=σ22σ12≠σ22F≥Fα/2(n1-1,n2-1)或F≤F1-α/2(n1-1,n2-1)7 成对数据μD≤0 μD>0nSDtD-=t≥tα(n-1) μD≥0 μD<0 t≤-tα(n-1)μD=0 μD≠0 |t|≥tα-2(n-1)检验方法选择:主要是逐对比较法(成对数据)跟两个正态总体均值差的检验的区别,如上表即7跟3、4的区别,成对数据指两样本X和Y之间存在一一对应关系,而3和4一般指X和Y相互对立,但针对同一实体.关系:置信区间与假设检验之间的关系:未知参数的置信水平为1-α的置信区间与显著水平为α的接受域相同.定义:施行特征函数(OC函数):β(θ)=Pθ(接受H0).功效函数:1-β(θ).功效:当θ*∈H1时,1-β(θ*)的值.。

概率论与数理统计笔记

概率论与数理统计笔记

第一章 概率论的基本概念1 随机试验1.对随机现象的观察、记录、试验统称为随机试验.2.随机试验E 的所有结果构成的集合称为E 的样本空间,记为{}S e =, 称S 中的元素e 为基本事件或样本点.3.可以在相同的条件下进行相同的实验;每次实验的可能结果不止一个,并且能事先明确试验的所有可能结果;进行一次试验之前不能确定哪一个结果会实现.2.样本空间、随机事件1.对于随机试验,尽管在每次试验之前不能预知试验结果,但试验的所有可能结果组成的集合是已知的.我们将随机试验E 的所有可能结果组成的集合称为E 的样本空间,记为S 样本空间的元素,即E 的每个结果称为样本点.2.一般我们称S 的子集A 为E 的随机事件A ,当且仅当A 所包含的一个样本点发生称事件A 发生.如果将S 亦视作事件,则每次试验S 总是发生,故又称S 为必然事件。

为方便起见,记φ为不可能事件,φ不包含任何样本点.3.若A B ⊂,则称事件B 包含事件A ,这指的是事件A 发生必导致事件的发生。

若A B ⊂且B A ⊂,即A B =,则称事件A 与事件B 相等.4.和事件{}AB x x A x A A B =∈∈或:与至少有一发生.5.当AB φ=时,称事件A 与B 不相容的,或互斥的.这指事件A 与事件B 不能同时发生.基本事件是两两互不相容的.,{,{,,A A S A A SA A AB AA AB ===∅=∅的逆事件记为若则称互逆,互斥.6.,A B A B A B AB 当且仅当同时发生时,事件发生.也记作.,A B A B A B AB 当且仅当同时发生时,事件发生,也记作.7. 事件 A 的对立事件:设 A 表示事件 “A 出现”, 则“事件 A 不出现”称为事件 A 的对立事件或逆事件. 事件间的运算规律:,,, A B C 设为事件则有,A B B A AB BA ==(1)交换律:()(),A B C A B C =(2)结合律:()()AB C A BC = ()()()A B C A C B C ACBC ==(3)分配律:,de Morgan AB AB AB AB ==(4)律:3.频率和概率1.记()An n f A n=()A n A f A A n --其中n 发生的次数(频数);n 总试验次数.称为在这次试验中发生的频率.频率 反映了事件A 发生的频繁程度. 2.频率的性质:10()12()1n n kkf A f S ≤≤=。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档