第2章概率统计回顾2.1概率与条件概率

合集下载

概率论与数理统计第二版课后答案

概率论与数理统计第二版课后答案

概率论与数理统计第二版课后答案第一章:概率论的基本概念与性质1.1 概率的定义及其性质1.概率的定义:概率是对随机事件发生的可能性大小的度量。

在概率论中,我们将事件A的概率记为P(A),其中P(A)的值介于0和1之间。

2.概率的基本性质:–非负性:对于任何事件A,其概率满足P(A) ≥ 0。

–规范性:对于样本空间Ω中的全部事件,其概率之和为1,即P(Ω) = 1。

–可列可加性:对于互不相容的事件序列{Ai}(即Ai∩Aj = ∅,i ≠ j),有P(A1∪A2∪…) = P(A1) + P(A2) + …。

1.2 随机事件与随机变量1.随机事件:随机事件是指在一次试验中所发生的某种结果。

–基本事件:对于只包含一个样本点的事件,称为基本事件。

–复合事件:由一个或多个基本事件组成的事件称为复合事件。

2.随机变量:随机变量是将样本空间Ω上的每个样本点赋予一个实数的函数。

随机变量可以分为两种类型:–离散型随机变量:其取值只可能是有限个或可列无穷个实数。

–连续型随机变量:其取值在某个区间内的任意一个值。

1.3 事件的关系与运算1.事件的关系:事件A包含于事件B(记作A ⊆ B)指的是事件B发生时,事件A一定发生。

如果A ⊆ B且B ⊆ A,则A与B相等(记作A = B)。

–互不相容事件:指的是两个事件不能同时发生,即A∩B = ∅。

2.事件的运算:对于两个事件A和B,有以下几种运算:–并:事件A和事件B至少有一个发生,记作A∪B。

–交:事件A和事件B同时发生,记作A∩B。

–差:事件A发生而事件B不发生,记作A-B。

第二章:条件概率与独立性2.1 条件概率与乘法定理1.条件概率:在事件B发生的条件下,事件A发生的概率称为事件A在事件B发生的条件下的条件概率,记作P(A|B)。

–条件概率的计算公式:P(A|B) = P(A∩B) / P(B)。

2.乘法定理:对于任意两个事件A和B,有P(A∩B) = P(A|B) * P(B) =P(B|A) * P(A)。

掌握概率统计的基本方法与应用

掌握概率统计的基本方法与应用

掌握概率统计的基本方法与应用概率统计是一门研究随机现象的数学学科,广泛应用于各个领域。

掌握概率统计的基本方法和应用,对于我们理解和分析事物的发展趋势、预测未来事件的可能性具有重要的意义。

本文将介绍概率统计的基本概念、方法和实际应用,并探讨其在不同领域中的作用。

一、概率统计的基本概念1.1 概率的定义概率是指某个事件发生的可能性大小。

在数学中,概率以0到1之间的数值表示,0表示不可能事件,1表示必然事件。

概率可以用来度量不同事件之间的发生概率。

1.2 随机变量与概率密度函数随机变量是指在一次试验中可能取到的不同结果,它可以是离散的或连续的。

离散变量是指只能取到有限个或可列个值的变量,比如抛硬币的结果;而连续变量是指可以取到任意值的变量,比如人的身高。

概率密度函数则是描述随机变量的概率分布规律的函数,通常用来衡量事件在给定取值范围内可能发生的概率大小。

1.3 事件独立性与条件概率事件的独立性是指两个或多个事件之间相互独立,互不影响。

条件概率是指在已知某个事件发生的条件下,另一个事件发生的概率。

二、概率统计的基本方法2.1 概率计算方法概率计算是概率统计的核心方法之一。

通过利用事件之间的关系、概率的性质以及一些基本规则,可以计算出复杂事件的概率。

2.2 统计方法统计方法是通过收集和分析数据来推断总体特征、评估假设以及进行预测和决策的方法。

常见的统计方法包括抽样调查、假设检验、回归分析等。

2.3 概率模型与统计模型概率模型是描述随机现象的模型,通过概率论的方法来描述事件的发生规律。

统计模型则是通过收集样本数据,建立起概率模型的方法。

三、概率统计的应用领域3.1 金融领域中的应用概率统计在金融领域中有着广泛的应用。

例如,通过对金融市场的历史数据进行分析,可以对未来的金融市场走势进行预测;概率统计也可以用来评估金融产品的风险等。

3.2 医学领域中的应用在医学领域中,概率统计可以用来分析疾病的流行趋势、预测疾病的患病率等。

概率统计回顾21概率与条件概率概率什么是概率天气预报

概率统计回顾21概率与条件概率概率什么是概率天气预报

© 陈强,《计量经济学及Stata应用》,2014年。

请勿上传或散发。

第2章 概率统计回顾2.1 概率与条件概率1.概率什么是概率?天气预报明天70%概率下雨?含义:如果有100天的天气预报都报了70%的概率明天降雨,则大约有70天会下雨。

12“概率”为在大量重复实验下,事件发生的频率趋向的某个稳定值。

记事件“下雨”为A ,其发生的“概率”(probability)为P()A 。

2.条件概率例 已知明天会出太阳,下雨的概率有多大?记事件“出太阳”为B ,则在出太阳条件下降雨的“条件概率”(conditional probability)为P()P()P()A B A B B(2.1)3其中,“ ”表示事件的交集(intersection),故P()A B 为“太阳雨”的概率,参见图2.1。

图2.1 条件概率示意图4例 股市崩盘的可能性为无条件概率;在已知经济已陷入严重衰退的情况下,股市崩盘的可能性为条件概率。

3.独立事件如果条件概率等于无条件概率,即P()P()A B A ,即B 是否发生不影响A 的发生,则称A , B 为相互独立的随机事件。

5此时,P()P()P()P()A B A B A B ≡= ,故P()P()P()A B A B = (2.2)也可将此式作为独立事件的定义。

4.全概率公式如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容; ()0(1,,)i P B i n >∀= ;且12n B B B 为必然事件 (即在12,,,n B B B 中必然有某个i B 发生,“ ”表示事件的并集,union),6则对任何事件A (无论A 与{}12,,,n B B B 是否有任何关系),都有1P()P()P()ni i i A B A B ==∑ (2.3)全概率公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。

概率论与数理统计复习笔记

概率论与数理统计复习笔记

概率论与数理统计复习第一章概率论的基本概念一.基本概念随机试验E:1可以在相同的条件下重复地进行;2每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;3进行一次试验之前不能确定哪一个结果会出现.样本空间S: E的所有可能结果组成的集合. 样本点基本事件:E的每个结果.随机事件事件:样本空间S的子集.必然事件S:每次试验中一定发生的事件. 不可能事件:每次试验中一定不会发生的事件.二. 事件间的关系和运算事件B包含事件A 事件A发生必然导致事件B发生.∪B和事件事件A与B至少有一个发生.3. A∩B=AB积事件事件A与B同时发生.4. A-B 差事件事件A 发生而B 不发生.5. AB= A 与B 互不相容或互斥事件A 与B 不能同时发生.6. AB=且A ∪B=S A 与B 互为逆事件或对立事件表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为PA,称为事件A 的概率.1非负性 PA ≥0 ; 2归一性或规范性 PS=1 ;3可列可加性 对于两两互不相容的事件A 1,A 2,…A i A j =φ, i ≠j, i,j=1,2,…,PA 1∪A 2∪…=P A 1+PA 2+…2.性质1 P = 0 , 注意: A 为不可能事件2有限可加性对于n个两两互不相容的事件A1,A2,…,An,PA1∪A2∪…∪An=PA1+PA2+…+PAn有限可加性与可列可加性合称加法定理3若A B, 则PA≤PB, PB-A=PB-PA .4对于任一事件A, PA≤1, PA=1-PA .5广义加法定理对于任意二事件A,B ,PA∪B=PA+PB-PAB .对于任意n个事件A1,A2,…,An…+-1n-1PA1A2…An四.等可能古典概型1.定义如果试验E满足:1样本空间的元素只有有限个,即S={e1,e2,…,en};2每一个基本事件的概率相等,即Pe1=Pe2=…= Pen.则称试验E所对应的概率模型为等可能古典概型.2.计算公式 PA=k / n 其中k是A中包含的基本事件数, n是S中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率PB|A=PAB / PA PA>0.2.乘法定理 PAB=PA P B|A PA>0; PAB=PB P A|B PB>0.PA 1A 2…A n =PA 1PA 2|A 1PA 3|A 1A 2…PA n |A 1A 2…A n-1 n ≥2, PA 1A 2…A n-1 > 03. B 1,B 2,…,B n 是样本空间S 的一个划分B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S ,则当PB i >0时,有全概率公式 PA=()()i ni i B A P B P ∑=1当PA>0, PB i>0时,有贝叶斯公式P B i|A=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足PAB = PA PB 时,称A,B 为相互独立的事件.1两个事件A,B 相互独立 PB= P B|A .2若A 与B,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足PAB =PA PB, PAC= PA PC, PBC= PB PC,称A,B,C 三事件两两相互独立. 若再满足PABC =PA PB PC,则称A,B,C 三事件相互独立.个事件A 1,A 2,…,A n ,如果对任意k 1<k ≤n,任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X e 称为随机变量.2.随机变量X 的分布函数Fx=P{X ≤x} , x 是任意实数. 其性质为:10≤Fx≤1 ,F -∞=0,F∞=1. 2Fx 单调不减,即若x 1<x 2 ,则 Fx 1≤Fx 2.3Fx 右连续,即Fx+0=Fx. 4P{x 1<X≤x 2}=Fx 2-Fx 1.二.离散型随机变量 只能取有限个或可列无限多个值的随机变量1.离散型随机变量的分布律 P{X= x k }= p k k=1,2,… 也可以列表表示. 其性质为:1非负性 0≤P k ≤1 ; 2归一性11=∑∞=k k p .2.离散型随机变量的分布函数 Fx=∑≤xX k k P 为阶梯函数,它在x=x kk=1,2,…处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布1X~0-1分布 P{X=1}= p ,P{X=0}=1–p 0<p<1 .2X~bn,p 参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1k=0,1,2,…,n 0<p<1 3X~参数为的泊松分布 P{X=k}=λλ-e k k !k=0,1,2,… >0 三.连续型随机变量1.定义 如果随机变量X 的分布函数Fx 可以表示成某一非负函数fx 的积分Fx=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f x 称为X 的概率密度函数.2.概率密度的性质1非负性 fx ≥0 ; 2归一性 ⎰∞∞-dx x f )(=1 ;3 P{x 1<X ≤x 2}=⎰21)(xx dx x f ; 4若f x 在点x 处连续,则f x=F/x .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布1X ~U a,b 区间a,b 上的均匀分布⎩⎨⎧=-0)(1a b x f其它b x a << . 2X 服从参数为的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 >0.3X~N ,2参数为,的正态分布222)(21)(σμσπ--=x e x f -<x<, >0.特别, =0, 2=1时,称X 服从标准正态分布,记为X~N 0,1,其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, -x=1-Φx .若X ~N ,2, 则Z=σμ-X ~N 0,1, P{x 1<X ≤x 2}=Φσμ-2x-Φσμ-1x .若P{Z>z }= P{Z<-z }= P{|Z|>z /2}= ,则点z ,-z , z / 2分别称为标准正态分布的上,下,双侧分位点. 注意:z =1- , z 1- = -z .四.随机变量X 的函数Y= g X 的分布1.离散型随机变量的函数若gx k k=1,2,…的值全不相等,则由上表立得Y=gX 的分布律.若gx k k=1,2,…的值有相等的,则应将相等的值的概率相加,才能得到Y=gX 的分布律.2.连续型随机变量的函数若X 的概率密度为f X x,则求其函数Y=gX 的概率密度f Y y 常用两种方法:1分布函数法 先求Y 的分布函数F Y y=P{Y ≤y}=P{gX ≤y}=()()dx x f ky Xk∑⎰∆其中Δk y 是与gX ≤y 对应的X 的可能值x 所在的区间可能不只一个,然后对y 求导即得f Y y=F Y/y .2公式法 若gx 处处可导,且恒有g /x>0 或g / x<0 ,则Y=g X 是连续型随机变量,其概率密度为()()()()⎩⎨⎧'=yhyhfyf XY其它βα<<y其中hy是gx的反函数 , = min g -,g = max g -,g .如果f x在有限区间a,b以外等于零,则 = min g a,g b = max g a,g b .第三章二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义若X和Y是定义在样本空间S上的两个随机变量,则由它们所组成的向量X,Y称为二维随机向量或二维随机变量.对任意实数x,y,二元函数Fx,y=P{X≤x,Y≤y}称为X,Y的X和Y的联合分布函数.2.分布函数的性质1Fx,y分别关于x和y单调不减.20≤Fx,y≤1 , Fx,- =0, F-,y=0, F-,-=0, F,=1 .3 Fx,y关于每个变量都是右连续的,即 Fx+0,y= Fx,y, Fx,y+0= Fx,y .4对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= Fx 2,y 2- Fx 2,y 1- Fx 1,y 2+ Fx 1,y 1二.二维离散型随机变量及其联合分布律1.定义 若随机变量X,Y 只能取有限对或可列无限多对值x i ,y j i ,j =1,2,… 称X,Y 为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为X,Y 的联合分布律.也可列表表示.2.性质 1非负性 0≤p i j ≤1 .2归一性 ∑∑=i jijp 1 .3. X,Y 的X 和Y 的联合分布函数Fx,y=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f x,y,使对任意的x 和y,有Fx,y=⎰⎰∞-∞-y xdudv v u f ),(则称X,Y 为二维连续型随机变量,称fx,y 为X,Y 的X 和Y 的联合概率密度.2.性质 1非负性 f x,y ≥0 . 2归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .3若f x,y 在点x,y 连续,则yx y x F y x f ∂∂∂=),(),(2 4若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. X,Y 关于X 的边缘分布函数 F X x = P{X ≤x , Y<}= F x , .X,Y 关于Y 的边缘分布函数 F Y y = P{X<, Y ≤y}= F ,y2.二维离散型随机变量X,Y关于X 的边缘分布律 P{X= x i }=∑∞=1j ij p = p i · i =1,2,… 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }=∑∞=1i ij p = p·jj =1,2,… 归一性11=∑∞=•j j p .3.二维连续型随机变量X,Y关于X 的边缘概率密度f X x=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y y=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义若对一切实数x,y,均有Fx,y= FX x FYy ,则称X和Y相互独立.2.离散型随机变量X和Y相互独立⇔p i j= p i··p·j i ,j =1,2,…对一切x i,y j成立.3.连续型随机变量X和Y相互独立⇔f x,y=f X xf Y y对X,Y所有可能取值x,y都成立.六.条件分布1.二维离散型随机变量的条件分布定义设X,Y是二维离散型随机变量,对于固定的j,若P{Y=yj}>0,则称P{X=xi |Y=yj}为在Y= yj条件下随机变量X的条件分布律.同样,对于固定的i,若P{X=xi}>0,则称P{Y=yj |X=xi}为在X=xi 条件下随机变量Y 的条件分布律.,}{},{jj ijjippyYPyYxXP•=====,}{},{•=====ij iijippxXPyYxXP第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i i =1,2,… 概率密度f x数学期望均值EX∑∞=1i i i p x 级数绝对收敛⎰∞∞-dx x xf )(积分绝对收敛方差DX=E{X-EX 2}[]∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=EX 2-EX 2 级数绝对收敛 积分绝对收敛函数数学期望EY=EgXi i i p x g ∑∞=1)(级数绝对收敛 ⎰∞∞-dx x f x g )()(积分绝对收敛标准差X=√DX .二.数学期望与方差的性质1. c 为为任意常数时, Ec = c , EcX = cEX , Dc = 0 , D cX = c 2 DX .,Y为任意随机变量时, E X±Y=EX±EY .3. X与Y相互独立时, EXY=EXEY , DX±Y=DX+DY .4. DX = 0 P{X = C}=1 ,C为常数.三.六种重要分布的数学期望和方差 EX DX~ 0-1分布P{X=1}= p 0<p<1 p p 1- p ~ b n,p 0<p<1 n p n p 1- p ~~ Ua,b a+b/2 b-a 2/12服从参数为的指数分布2~ N ,22四.矩的概念随机变量X的k阶原点矩EX k k=1,2,…随机变量X 的k 阶中心矩E{X-EX k}随机变量X 和Y 的k+l 阶混合矩EX k Y l l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{X-EX k Y-EY l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11 k=1,2,… 样本k 阶中心矩∑-==n i ki k X X n B 1)(1k=1,2,…二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E X = EX , D X = DX / n .特别,若X~ N ,2 ,则 X ~ N , 2 /n .分布 1定义 若X ~N 0,1,则Y =∑=ni i X 12~ 2n 自由度为n 的2分布.2性质 ①若Y~ 2n,则EY = n , DY = 2n .②若Y 1~ 2n 1 Y 2~ 2n 2 ,则Y 1+Y 2~ 2n 1 + n 2.③若X~ N ,2 , 则22)1(σS n -~ 2n-1,且X 与S 2相互独立.3分位点 若Y~ 2n,0< <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为2分布的上、下、双侧分位点.3. t 分布1定义 若X~N 0,1 ,Y~ 2 n,且X,Y 相互独立,则t=nY X~tn 自由度为n 的t 分布. 2性质①n →∞时,t 分布的极限为标准正态分布.②X ~N ,2 时,nS X μ-~ t n-1 . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N 1,12 且12=22=2 X 1 ,X 2 ,…,X n1 X S 12Y~ N 2,22 Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t n 1+n 2-2 , 其中 2)1()1(212222112-+-+-=n n S n S n S w3分位点 若t ~ t n ,0 < <1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧分位点.注意: t 1- n = - t n.分布 1定义 若U~2n 1, V~ 2n 2, 且U,V 相互独立,则F =21n V n U ~Fn 1,n 2自由度为n 1,n 2的F 分布.2性质条件同3.2③22212221σσS S ~Fn 1-1,n 2-13分位点 若F~ Fn 1,n 2 ,0< <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧分位点. 注意: .).(1),(12211n n F n n F αα=- 第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数1, 2,…, k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩 ll=1,2,…,k 得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式可以是分布律或概率密度为px, 1, 2,…, k ,称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数1, 2,…,k 的最大似然估计值,代入样本得到最大似然估计量.若L 1, 2,…, k 关于1, 2,…, k 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ i =1,2,…,k 求出最大似然估计. 3.估计量的标准(1)无偏性 若E ∧θ=,则估计量∧θ称为参数的无偏估计量.不论总体X 服从什么分布, E X = EX , ES 2=DX, EA k =k =EX k ,即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值EX,方差DX,总体k 阶矩k 的无偏估计,2有效性 若E ∧θ1 =E ∧θ2= , 而D ∧θ1< D ∧θ2, 则称估计量∧θ1比∧θ2有效.3一致性相合性 若n →∞时,θθP →∧,则称估计量∧θ是参数的相合估计量.二.区间估计1.求参数的置信水平为1-的双侧置信区间的步骤1寻找样本函数W=WX 1 ,X 2 ,…,X n ,,其中只有一个待估参数未知,且其分布完全确定.2利用双侧分位点找出W 的区间a,b,使P{a<W <b}=1-.3由不等式a<W<b 解出θθθ<<则区间θθ,为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间2已知 nX σμ-~N 0,1 2/ασz n X ±2未知 nS X μ-~ t n-1 )1((2/-±n t n S X α 2未知22)1(σS n -~ 2n-1 ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体1均值差 1- 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N0,1 )(2221212n n z Y Xσσα+±-未知22221σσσ==212111)(n n S Y X w +---μμ~tn 1+n 2-2)11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 2③.2 1, 2未知, W=22212221σσS S ~ Fn 1-1,n 2-1,方差比12/22的置信区间为注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上下限中的下标/2改为,另外的下上限取为- 即可.。

概率论与数理统计复习汇总

概率论与数理统计复习汇总
3 个患者的治疗中,至少有一个是有效的概率. 设对各个患者的治疗效果是相 互独立的.
第二章:随机变量及其相关内容
基本概念:随机变量、分布律、概率密度、分布函数 随机变量:设随机试验的样本空间为 S = {e}, X = X (e) 是定义在样本空间 S 上的
实值单值函数,称 X = X (e) 为随机变量. ( 样本点到数的对应法则) 随机变量的分类:离散型随机变量和连续型随机变量(基于 r.v. 的取值类型) 离散型随机变量 取值为有限个或者无限可列个的随机变量 分布律 若 r.v. X 的取值为 x1, x2 , , xn , 对应概率值为 p1, p2 , , pn , ,即
(1) 任取一件产品为次品的概率是多少? (2) 已知取得的产品为次品,求此次品来自甲厂生产的概率是多少? 2. 人们为了了解一支股票未来一定时期内价格的变化,往往会去分析影响股票 价格的基本因素,比如利率的变化. 现假设人们经分析评估知利率下降的概率为 60%,利率不变的概率为 40%.根据经验,人们估计,在利率下调的情况下,该
一个划分.或者 B1, B2 , , Bn 为一个完备事件组.
全概率公式:设设 S 为随机试验 E 的样本空间, B1, B2, , Bn 为一个完备事件组,
则有 P( A) = P(B1)P( A B1) + P(B2 )P( A B2 ) + + P(Bn )P( A Bn )
Bi 称为原因, A 称为结果;全概率公式由原因找结果; 贝叶斯公式: 由结果找造成的原因
运算规律:德摩根律 AB = A ∪ B; A ∪ B = AB
加法原理: n1 + n2 + + nm (分类),乘法原理: n1 ⋅ n2 ⋅ ⋅ nm (分步)

概率论与数理统计笔记(重要公式)

概率论与数理统计笔记(重要公式)

r = A 中样本点数 / Ω 中样本点总数 n
= A 所包含的基本事件数 / 基本事件总数 条件概率:
对偶律: A B = A B , P ( AB ) 设 A, B 是两个事件, 且 P(B)>0, 称 P(A|B)= 为 贝叶斯公式: P( B) 在事件 B 发生条件下事件 A 发生的条件概率。显然, 当 P(A)>0 时,P(B|A)=
二项分布 X ~ B(n, p): 指数分布 X ~ E(λ) 若随机变量 X 只取两个可能值 0, 1, …, n, 而 X 的分布律为 e x x 0 若随机变量 X 的概率密度为 f ( x) k k nk pk =P {X= xk }= Cn p q , k=0, 1, 2, …, n, x0 0

设 X 为离散型随机变量, 可能取值为 x1, x2, …, xk, … 且 P 概率密度的性质: (1) f(x)≥0 {X= xk }= pk, k=1, 2, …, 则称{pk}为 X 的分布律 表格形式: f ( x)dx =1 (2) X x1, x2, …, xk, … b P p1, p2, …, pk, … (3) P{a<X≤b}= F(b)-F(a)= f ( x)dx , a≤b a {pk}性质: (4) 设 x 为 f(x)的连续点,则 F’(x)存在,且 (1) pk≥0, k=1, 2, … F’(x)= f(x) (2) pk =1 均匀分布 X ~ U (a, b) k 1 若随机变量 X 的概率密度为 在求离散型随机变量的分布律时,首先要找出其所有可能 1 , a≤x≤b 的取值,然后再求出每个值相应的概率 ba f(x) = 在实际应用中,有时还要求“X 满足某一条件”这样事件的 概率, 求法就是把满足条件的 xk 所对应的概率 pk 相加可得 0, 其他 则称 X 服从区间[a,b]上的均匀分布,其分布函数为 其分布函数 F(x) = pk xk x 0, x≤a 0-1 分布: xa F(x) = , a<x<b 若随机变量 X 只取两个可能值 0, 1,且 ba P {X=1}=p, P{X=0}=q 1, x≥b 其中 0<p<1, q=1-p, 则称 X 服从 0-1 分布. X 的分布律为 设 X ~ U (a, b), a≤c<d≤b,即[a,b] [c,d],则 X 0 1 d c P{c≤X≤d}= P q p ba

概率论与数理统计第二章

概率论与数理统计第二章
26
4. 条件概率的计算
1) 用定义计算:
P( A | B) P( AB) , P(B)
P(B)>0
2)从加入条件后改变了的情况去算
例:A={掷出2点},B={掷出偶数点}
掷骰子
P(A|B)= 1 3
B发生后的 缩减样本空间 所含样本点总数
在缩减样本空间 中A所含样本点
个数
27
例8 掷两颗均匀骰子,已知第一颗掷出6点,问 “掷出点数之和不小于10”的概率是多少?
实际上,这个假定并不完 全成立,有关问题的实际概 率比表中给出的还要大 .
当人数超过23时,打赌 说至少有两人同生日是有利 的.
18
例3 某城市的电话号码由5个数字组成,每个 数字可能是从0-9这十个数字中的任一个,求 电话号码由五个不同数字组成的概率.
解:
a

A150 105
=0.3024
问:
b
P( A) =1-0.524=0.476
即22个球迷中至少有两人同生日的概率为0.476.
这个概率随着球迷人数的增加而迅速增加.
17
人数 至少有两人同
生日的概率
20
0.411
21
0.444
22
0.476
23
0.507
24
0.538
30
0.706
40
0.891
50
0.970
60
0.994
所有这些概率都是在假 定一个人的生日在 365天的 任何一天是等可能的前提下 计算出来的.
25
3. 条件概率的性质 设B是一事件,且P(B)>0,则 1. 对任一事件A,0≤P(A|B)≤1;

概率统计公式大全汇总

概率统计公式大全汇总

概率统计公式大全汇总概率统计是一门研究随机现象的理论和方法的学科,它包含了许多重要的公式和定理。

在这篇文章中,我将给出一些概率统计的重要公式的概览,以便复习和总结。

1.概率的基本公式概率是指事件发生的可能性,可以通过以下公式计算:P(A)=n(A)/n(S)其中,P(A)是事件A发生的概率,n(A)是事件A的样本空间中有利结果的个数,n(S)是样本空间中所有可能结果的个数。

2.加法准则当事件A和事件B不相容时,其和事件的概率可以通过以下公式计算:P(A∪B)=P(A)+P(B)如果事件A和事件B是相容的,则有:P(A∪B)=P(A)+P(B)-P(A∩B)3.乘法准则当事件A和事件B是相互独立的时,其交事件的概率可以通过以下公式计算:P(A∩B)=P(A)*P(B)如果事件A和事件B不是相互独立的,则有:P(A∩B)=P(A)*P(B,A)4.条件概率条件概率是指在已知一些事件发生的条件下,另一个事件发生的概率。

条件概率可以通过以下公式计算:P(A,B)=P(A∩B)/P(B)5.全概率公式全概率公式用于计算在多个事件的情况下一些事件的概率。

根据全概率公式,可以将一些事件划分为几个互不相容的子事件,然后分别计算每个子事件的概率,并将其加权求和。

全概率公式如下:P(A)=P(A∩B1)+P(A∩B2)+...+P(A∩Bn)其中,B1、B2、..、Bn表示将样本空间划分的互不相容的子事件。

6.贝叶斯公式贝叶斯公式描述了在已知B发生的条件下,事件A发生的概率。

根据贝叶斯公式,可以通过条件概率、全概率和边际概率来计算后验概率。

贝叶斯公式如下:P(A,B)=P(B,A)*P(A)/P(B)7.期望值期望值是随机变量的平均值,表示随机变量在每个可能取值上的发生概率乘以对应的取值,并将其加权求和。

期望值可以通过以下公式计算:E(X)=Σ(x*P(X=x))其中,x表示随机变量的取值,P(X=x)表示随机变量取值x的概率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

© 陈强,《计量经济学及Stata应用》,2014年。

请勿上传或散发。

第2章 概率统计回顾2.1 概率与条件概率1.概率什么是概率?天气预报明天70%概率下雨?含义:如果有100天的天气预报都报了70%的概率明天降雨,则大约有70天会下雨。

12“概率”为在大量重复实验下,事件发生的频率趋向的某个稳定值。

记事件“下雨”为A ,其发生的“概率”(probability)为P()A 。

2.条件概率例 已知明天会出太阳,下雨的概率有多大?记事件“出太阳”为B ,则在出太阳条件下降雨的“条件概率”(conditional probability)为P()P()P()A B A B B(2.1)3其中,“ ”表示事件的交集(intersection),故P()A B 为“太阳雨”的概率,参见图2.1。

图2.1 条件概率示意图4例 股市崩盘的可能性为无条件概率;在已知经济已陷入严重衰退的情况下,股市崩盘的可能性为条件概率。

3.独立事件如果条件概率等于无条件概率,即P()P()A B A ,即B 是否发生不影响A 的发生,则称A , B 为相互独立的随机事件。

5此时,P()P()P()P()A B A B A B ≡= ,故P()P()P()A B A B = (2.2)也可将此式作为独立事件的定义。

4.全概率公式如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容; ()0(1,,)i P B i n >∀= ;且12n B B B 为必然事件 (即在12,,,n B B B 中必然有某个i B 发生,“ ”表示事件的并集,union),6则对任何事件A (无论A 与{}12,,,n B B B 是否有任何关系),都有1P()P()P()ni i i A B A B ==∑ (2.3)全概率公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。

该公式有助于理解“迭代期望定律”(Law of Iterated Expectation )。

72.2 分布与条件分布 1.离散型概率分布假设随机变量X 的可能取值为{}12,,,,k x x x ,其对应概率为{}12,,,,k p p p ,即(P )k k p X x ≡=,则称X 为离散型随机变量,其分布律可以表示为1212k k X x x x pp p p(2.4)其中,0kp ≥,1k kp =∑。

82.连续型概率分布连续型随机变量可以取任意实数,其“概率密度函数”(probability density function ,简记pdf)()f x 满足, (i)()0,f x x ≥∀; (ii)()d 1f x x +∞-∞=⎰;(iii) X 落入区间[,]a b 的概率为()()d ba P a Xb f x x ≤≤=⎰。

定义“累积分布函数”(cumulative distribution function ,简记cdf):()P()()d xF x X x f t t -∞≡-∞<≤=⎰ (2.5)9其中,t 为积分变量。

()F x 度量从-∞至x ,概念密度函数()f t 曲线下的面积。

3.多维随机向量的概率分布为研究变量间关系,常同时..考虑两个或多个随机变量,即“随机向量”(random vector)。

二维连续型随机向量(,)X Y 的“联合密度函数”(joint pdf)(,)f x y 满足,(i)(,)0,,f x y x y ≥∀;10(ii)(,)d d 1f x y x y +∞+∞-∞-∞=⎰⎰;(iii)(,)X Y 落入平面某区域D 的概率为{}P (,)(,)d d DX Y D f x y x y∈=⎰⎰。

二维随机向量的联合密度函数就像倒扣的草帽。

落入平面某区域D 的概率就是此草帽下在区域D 之上的体积。

n 维连续型随机向量12(,,,)n X X X 可由联合密度函数12(,,,)n f x x x 来描述。

11从二维联合密度(,)f x y ,可计算X 的(一维)边缘密度函数(marginal pdf):()(,)d x f x f x y y +∞-∞=⎰ (2.6)即给定X ,把所有Y 取值的可能性都“加”起来(积分的本质就是加总)。

类似地,可计算Y 的(一维)边缘密度函数:()(,)d y f y f x y x +∞-∞=⎰(2.7)12定义二维随机向量(,)X Y 的累积分布函数为:(,)P(;)(,)d d xyF x y X x Y y f t s t s -∞-∞≡-∞<≤-∞<≤=⎰⎰ (2.8)4.条件分布“条件分布”(conditional distribution )对于计量经济学至关重要。

考虑在X x =条件下Y 的条件分布,记为Y X x =。

13如果X 为连续型随机变量,事件{}X x =发生的概率为0。

如何计算Y X x =的“条件概率密度”(conditional pdf)?考虑[],X x x εε∈-+,然后让0ε+→(参见图2.2),可证明条件密度函数为,(,)(|)()x f x y f y x f x =(2.9)此公式与条件概率公式类似。

14图2.2 条件密度函数的计算152.3 随机变量的数字特征定义 对于分布律为P()k k p X x ≡=的离散型随机变量X ,其“期望”(expectation)为1E()k k k X x p μ∞=≡≡∑ (2.10)期望就是加权平均,权重为概率。

定义 对于概率密度函数为()f x 的连续型随机变量X ,其“期望”为16E()()d X xf x x μ+∞-∞≡≡⎰ (2.11)期望算子(expectation operator)满足“线性性”(linearity),即E()E()E()X Y X Y +=+,E()E()kX k X =,k 为任意常数。

定义 随机变量X 的“方差”(variance)为[]22Var()E E()X X X σ≡≡- (2.12)方差越大,则随机变量取值的波动幅度越大。

17称方差的平方根为“标准差”(standard deviation),记为σ。

计算方差的简便公式:命题 []22Var()E[]E()X X X =-证明:[][]{}222Var()E E()E 2E()E()X X X X X X X ≡-=-+[][][]22222E[]2E()E()E[]E()X X X X X =-+=-18定义 随机变量X 与Y 的“协方差”(covariance)为()()Cov(,)E E()E()XY X Y X X Y Y σ≡≡--⎡⎤⎣⎦ (2.13)如果当X 的取值大于(小于)其期望E()X 时,Y 的取值也倾向于大于(小于)其期望值E()Y ,则Cov(,)0X Y >,二者正相关;反之,负相关。

如果Cov(,)0X Y =,则二者“线性不相关”,但不一定“相互独立”,还可能存在非线性的相关关系。

19计算协方差的简便公式:[][]Cov(,)E (E())(E())E E()E()E()E()E()E()E()X Y X X Y Y XY X Y X Y X Y XY X Y ≡--=--+=- (2.14)协方差的运算也满足线性性,可以证明Cov(,)Cov(,)Cov(,)X Y Z X Y X Z +=+ (2.15)协方差受X 与Y 计量单位的影响。

将其标准化,引入相关系数。

20定义 随机变量X 与Y 的“相关系数”(correlation)为Cov(,)Corr(,)XYX Y X Y X Y σρσσ≡≡=(2.16)可以证明,11ρ-≤≤。

注:如果以上各定义式中的积分不收敛,则随机变量的数字特征可能不存在。

例:自由度为1的t 分布变量,期望与方差都不存在。

21更一般地,对于随机变量X ,可以定义一系列的数字特征,即各阶“矩”(moment )的概念。

定义 一阶原点矩为E()X (即期望),二阶原点矩为2E()X ,三阶原点矩为3E()X ,四阶原点矩为4E()X ,等等。

22定义 二阶中心矩为[]2E E()X X -(即方差),三阶中心矩为[]3E E()X X -,四阶中心矩为[]4E E()X X -,等等。

一阶原点矩(期望)表示随机变量的平均值;二阶中心矩(方差)表示随机变量的波动程度;三阶中心矩表示随机变量密度函数的不对称性(偏度); 四阶中心矩表示随机变量密度函数的最高处(山峰)有多“尖”及尾部有多“厚”(峰度)。

但三、四阶中心矩还取决于变量的单位。

为此,首先将变量“标准化”(即减去其期望m,再除s),并引入以下定义。

以其标准差定义随机变量X的“偏度”(skewness)为[]3-。

X m sE()23如果随机变量为对称分布(比如,正态分布),则其偏度为0(奇函数在关于原点对称的区间上积分为0)。

定义随机变量X的“峰度”(kurtosis)为[]4-。

E()X m s对于正态分布,其峰度为3。

24如果随机变量X的峰度大于3(比如t分布),则其密度函数的最高处(山峰)比正态分布更尖,而两侧尾部则更厚。

The kurtosis of a distribution is a measure of how much mass is in its tails, and a measure of how much of the variance of Y arises from extreme values (outliers极端值)。

2526图2.3 (0,1)N 与(3)t 的概率密度定义随机变量X的“超额峰度”(excess kurtosis)为[]4X m s--。

E()3正态分布的偏度为0,峰度为3。

可以使用正态分布的偏度与峰度性质来检验某个分布是否为正态分布。

2728更一般地,对于任意函数()g ⋅,称随机变量函数的期望[]E ()()()g X g x f x dx +¥-¥=ò为“矩”(moment )。

定义 “条件期望”(conditional expectation)就是条件分布|Y x 的期望,即E(|)E(|)(|)d Y X x Y x yf y x y +∞-∞=≡=⎰ (2.17)由于y 已被积分掉,故E(|)Y x 只是x 的函数,参见图2.4。

29图2.4 条件期望与条件方差示意图30定义 “条件方差”(conditional variance)就是条件分布|Y x 的方差[]2Var(|)Var(|)E(|)(|)d Y X x Y x y Y x f y x y +∞-∞=≡=-⎰ (2.18)由于y 已被积分掉,故Var(|)Y x 只是x 的函数,参见图2.4。

相关文档
最新文档