概率论与数理统计5-1 基本概念

合集下载

概率论与数理统计目录

概率论与数理统计目录一、随机事件及其概率1.1 随机事件的基本概念定义与分类事件的运算1.2 概率的定义与性质概率的公理化定义概率的基本性质1.3 古典概型与几何概型古典概型的计算几何概型的计算1.4 条件概率与独立性条件概率事件的独立性1.5 全概率公式与贝叶斯公式全概率公式贝叶斯公式及其应用二、随机变量及其分布2.1 随机变量的概念随机变量的定义随机变量的分类2.2 离散型随机变量及其分布常见的离散型分布分布律与分布函数2.3 连续型随机变量及其分布常见的连续型分布概率密度函数与分布函数2.4 随机变量函数的分布离散型随机变量函数的分布连续型随机变量函数的分布三、多维随机变量及其分布3.1 多维随机变量的概念联合分布函数边缘分布3.2 多维离散型随机变量联合分布律边缘分布律3.3 多维连续型随机变量联合概率密度函数边缘概率密度函数3.4 条件分布离散型条件分布连续型条件分布3.5 随机变量的独立性独立性的定义独立性的判定与性质四、数字特征4.1 数学期望数学期望的定义与性质数学期望的计算4.2 方差方差的定义与性质方差的计算4.3 协方差与相关系数协方差的定义与性质相关系数的定义与性质4.4 矩与协矩阵矩的定义与计算协矩阵的定义与计算五、大数定律与中心极限定理5.1 大数定律切比雪夫大数定律伯努利大数定律5.2 中心极限定理林德贝格-莱维中心极限定理德莫佛尔-拉普拉斯中心极限定理六、数理统计的基本概念6.1 总体与样本总体的定义与性质样本的定义与性质6.2 统计量与抽样分布统计量的定义与性质常见的抽样分布七、参数估计与假设检验7.1 参数估计点估计区间估计7.2 假设检验假设检验的基本概念单侧检验与双侧检验正态总体的假设检验八、回归分析与方差分析8.1 回归分析一元线性回归多元线性回归回归模型的检验与预测8.2 方差分析单因素方差分析双因素方差分析方差分析的应用。

概率论与数理统计各章重点知识整理

概率论与数理统计各章重点知识整理第一章概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则交换律结合律分配律德•摩根律 B A B A I Y = B A B A Y I = 三. 概率的定义与性质1.定义对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件P(A)=0 .(2)有限可加性对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121Y ΛY Y…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P ΛΛ2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意：连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ～U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ～N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意：Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法： (1)分布函数法先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六．条件分布1．二维离散型随机变量的条件分布定义设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛),}{},{jji j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如：样本均值∑==n i i X n X 11 样本方差()∑--==n i iX X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布即统计量的分布1.X 的分布不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义若X ～N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P Y 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义若X~N (0,1),Y~ χ2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ～N (μ,σ2)时, nS X μ-~ t (n-1) .③两个正态总体相互独立的样本样本均值样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P Y的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章参数估计一.点估计总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμΛΛΛ解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθΛΛΛ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A ΛΛΛθθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθΛΛ为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21Λ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数其它参数 W 及其分布置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ～t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。

概率论与统计5-1 基本概念

n
它反映了总体方差的信息
1 n 2 2 X i nX . n i 1
可用于推断：D(X). 其观察值
1 n 2 sn ( xi x )2 n i 1
3)样本标准差
Sn
2 Sn
1 n X i X 2 ; n i 1
其观察值
第一节
基本概念
一、总体与个体二、随机样本的定义三、统计量
下回
停
一、总体与个体
总体: 在数理统计中，把研究对象的全体称为总体（或母体）. 个体：总体中每个成员称为个体. 例如，在考察我校某届本科生学习质量时，该届本科生的全体称为一个总体，每一个本科生称为一个个体。
在实际中，我们并不关心总体的各个方面，而往往关心它的某项或几项数量指标。例如，考察灯泡质量时，只研究灯泡的寿命、亮度等数量指标。
k 1 k 2 k n
k 1
k 2
k n
k
再根据第四章辛钦定理知，
1 P k Ak X i k , n i 1
n
( n ), k 1, 2, ;
由第四章关于依概率收敛的序列的性质知
g ( A1 , A2 ,, Ak ) P g ( 1 , 2 ,, k ),
*2 E ( Sn )
2.
证 (1) E ( X )
1 1 1 E ( X ) E ( X i ) E ( X i ) n i 1 n i 1 n i 1
1 2 ( 2 ) D( X ) n 1 n D( X ) D( X i ) n i 1
解总体 X 的分布律为
P{ X i } p (1 p)

考研数学一大纲重点梳理概率论与数理统计部分

考研数学一大纲重点梳理概率论与数理统计部分概率论和数理统计是考研数学一科目中的重要部分，本文将针对概率论与数理统计这一大纲进行重点梳理。

首先，我们将介绍概率论的基本概念和理论，然后详细讨论数理统计的相关内容。

一、概率论的基本概念和理论1. 概率的基本概念概率是研究随机现象的定量描述，用来描述事件发生的可能性大小。

概率可以用数值表示，范围在0到1之间，其中0代表不可能事件，1代表必然事件。

2. 概率的运算规则概率的运算规则包括加法规则和乘法规则。

加法规则适用于互斥事件，乘法规则适用于独立事件。

3. 随机变量和概率分布随机变量是用来描述随机现象的变量，可以分为离散随机变量和连续随机变量。

概率分布描述了随机变量的取值与概率之间的关系，常见的概率分布包括二项分布、泊松分布和正态分布等。

4. 期望和方差期望是随机变量的平均值，用来描述随机变量的集中趋势；方差是随机变量与期望之间的差异程度，用来描述随机变量的离散程度。

二、数理统计的相关内容1. 抽样与抽样分布抽样是指从总体中选取一部分个体进行观察和研究的过程，抽样分布是指样本统计量的概率分布。

常见的抽样分布包括正态分布、t分布和F分布等。

2. 参数估计参数估计是利用样本数据来估计总体参数的值，常见的参数估计方法包括点估计和区间估计。

点估计是用单个数值来估计参数的值，区间估计是用一个区间来估计参数的值。

3. 假设检验假设检验是根据样本提供的信息，对总体的某个参数是否满足某种假设进行判断。

假设检验可以分为单侧检验和双侧检验，常见的假设检验方法包括z检验和t检验等。

4. 方差分析方差分析是用来比较两个或多个总体间均值差异是否显著的统计方法。

方差分析可以分为单因素方差分析和多因素方差分析，常用的方法包括单因素方差分析和双因素方差分析等。

5. 回归分析回归分析是用来研究自变量与因变量之间的关系的方法。

简单线性回归是一种自变量和因变量之间存在线性关系的回归分析方法，多元线性回归是多个自变量和一个因变量之间的回归分析方法。

概率论与数理统计课件(共199张PPT)

P(An|A1A2…An-1).
33
例3. r只红球○ t只白球○
每次任取一只球观察颜色后, 放回, 再放回a只同色球
在袋中连续取球4次, 试求第一、二次取到红球且第三、四次取到白球的概率.
34
(三) 全概率公式和贝叶斯公式:
1. 样本空间的划分

定:义若 B 1,B 2, ,B n一组事 : 件
计算条件概率有两种方法:
1. 公式法：
先计P算(A)P, (AB然 ), 后按公式计算
P(B| A) P(AB.) P(A)
31
2. 缩减样本空间法：
在A发生的前提下, 确定B的缩减样本空间, 并在其中计算B发生的概率, 从而得到P(B|A). 例2. 在1, 2, 3, 4, 5这5个数码中, 每次取一个数码, 取后不放回, 连取两次, 求在第1次取到偶数的条件下, 第2
B
A S
(1) AB
8
2.和事件:
AB{x|xA或xB}称为 A与B的和事 . 件
即AB,中至少有一 ,称个为 A与发 B的生,和记AB.
可列个A1事 , A2,件的和事件记 Ak. 为
k1
3.积事件：事件A B={x|x A 且 x B}称A与B的积，
即事件A与B同时发A生. A B 可简记为AB.
i1
1i jn
P(A i A j Ak )
1i jkn
(1)n1 P(A1 A 2 A n ).
27
例4. 设P(A)=p, P(B)=q, P(AB)=r, 用p, q, r表示下列事件的概率:
( 1 ) P ( A B ) (; P ( 2 A B ) ( ) ; P ( 3 A B ) ) (; ( 4 A B )

概率论与数理统计第5章

i 1 4 i 2 2 i i 1
n
n
性质2.（分布可加性）:若X～2(n1)，Y～2(n2)，X与 Y独立，则
X + Y～2(n1+n2 )
3、2分布表及有关计算
(1)构成 P{2(n)>λ}=α，已知n, α可查表求得λ; (2)有关计算P 2 (n) 2 (n) 称为上侧α分位数
例5.1 设 X ~ N ( , 2 ) (X1,X2,…,Xn)为X的一个样本，
求(X1,X2,…,Xn)的密度。解 (X1,X2,…,Xn)为X的一个样本，故
X i ~ N ( , 2 )
n
i 1,2,, n
f ( x1 , x2 ,, xn ) f ( xi )
16 2
解
i 1,2,,16
2 1 16 2 2 P ( X i ) P 8 2 (16) 16 2 16 i 1
2—分布的密度函数f(y)曲线
n/2 1 f ( y) 2 ( n / 2) y 0,
n y 1 2 2
e , y0 y0
2 例5.4 X ~ N ( , ) (X1,X2,X3)为X的一个样本
X 1 X 2 X 3 的分布。求

(n)为整体记号
2
2 (n) 2 2 查表得 0 ( 25 ) 34 . 382 10) 18.307 .1 0.05 (
1 当n充分大时，近似有 (n ) (u 2n - 1) 2 2
2
练习1. P(2(n)<s)=1-p ∵P(2(n) < s)=1- P(2(n) s )=1-p ∴ P(2(n) s )=p 2 s p (n) 练习2. P(2(11)>s)=0.05,求s

概率论与数理统计基本概念

概率论与数理统计基本概念
概率论与数理统计是研究事件发生的可能性，以及由此衍生的结果
的一门学科。

它可以帮助人们提高分析和预测能力。

可以帮助我们了
解自然界及其客观原理，以及把握当代社会经济实体及其活动。

一、概率概念：
1. 随机事件：指事件发生以来，在所有结果中，用概率值去衡量其发
生的可能性，及其各个单一结果的概率分布情况；
2. 概率：是用来衡量某一随机事件发生的可能性的数值，可以给出这
个事件发生的可能性大小；
3. 概率分布：是某一随机变量及其可能取值之间发生关系的一种描述；
二、数理统计概念：
1、统计：是指对数据进行定量描述，尝试从数据中获得解释性的统计
特征；
2、变量：是指以数值形式表示的某类事物，是研究目标内容分析的一
种实际基础；
3、统计分布：是给定一组数据，通过统计手段，计算出变量的概率分
布情况，及其可能的变化规律；
4、极限定理：是一种概率论的定理，旨在探讨一个系统在重复抽样下，抽样结果的收敛情况；
5、数据描述：是指对数据的描述，可以让人简单明了地理解数据，及
其特征和趋势；
6、统计推断：是指根据统计样本信息，以概率结果作为有效依据，做
出关于总体参数情况的推断；
7、回归分析：是指建立一条回归函数模型，以描述解释变量对被解释
变量的影响；
8、判别分析：是指构建一个准确的模型，能够根据输入的观测值来准
确地判断属于哪一类人或物；
9、聚类分析：是指将一组数据进行分类，从而揭示内部数据间的关系，辅助决策；
10、卡方检验：是指判断某一种统计判断是否证实对某一总体分布结
果的检验，从而决定是否接受或拒绝假设。

概率论与数理统计知识点总结(超详细版)

《概率论与数理统计》第一章概率论的基本概念§2．样本空间、随机事件1．事件间的关系 B A ⊂则称事件B 包含事件A ，指事件A 发生必然导致事件B 发生B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件，指当且仅当A ，B 中至少有一个发生时，事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件，指当A ，B 同时发生时，事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件，指当且仅当A 发生、B 不发生时，事件B A —发生φ=⋂B A ，则称事件A 与B 是互不相容的，或互斥的，指事件A 与事件B 不能同时发生，基本事件是两两互不相容的且S =⋃B A φ=⋂B A ，则称事件A 与事件B 互为逆事件，又称事件A 与事件B 互为对立事件2．运算规则交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃ 分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃）（))(()( C A B A C B A ⋂⋂=⋃⋂徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3．频率与概率定义在相同的条件下，进行了n 次试验，在这n 次试验中，事件A 发生的次数A n 称为事件A 发生的频数，比值n n A 称为事件A 发生的频率概率：设E 是随机试验，S 是它的样本空间，对于E 的每一事件A 赋予一个实数，记为P （A ），称为事件的概率 1．概率)(A P 满足下列条件：（1）非负性：对于每一个事件A 1)(0≤≤A P （2）规范性：对于必然事件S 1)S (=P（3）可列可加性：设n A A A ,,,21 是两两互不相容的事件，有∑===nk knk kA P A P 11)()( （n 可以取∞）2．概率的一些重要性质：（i ） 0)(=φP（ii ）若n A A A ,,,21 是两两互不相容的事件，则有∑===nk kn k kA P A P 11)()(（n 可以取∞）（iii ）设A ，B 是两个事件若B A ⊂，则)()()(A P B P A B P -=-，)A ()B (P P ≥ （iv ）对于任意事件A ，1)(≤A P （v ）)(1)(A P A P -=（逆事件的概率）（vi ）对于任意事件A ，B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型（古典概型）等可能概型：试验的样本空间只包含有限个元素，试验中每个事件发生的可能性相同若事件A包含k个基本事件，即}{}{}{2]1k i i i e e e A =，里个不同的数，则有中某，是，，k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5．条件概率（1）定义：设A,B 是两个事件，且0)(>A P ，称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率（2）条件概率符合概率定义中的三个条件1。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第五章
数理统计的基本概念与抽样分布
5.1 基本概念
一、总体与个体二、随机样本的定义三、统计量四、小结
一、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体)，
总体中每个成员称为个体.
总体
研究某批灯泡的质量
总体 …
考察国产轿车的质量
然而在统计研究中，人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况. 这时，每个个体具有的数量指标的全体就是总体.
例1 设总体服从参数为 ( 0) 的指数分
布, (1,2 ,L ,n ) 是来自总体的样本, 求样本
(1,
解
2 ,L ,n ) 的概率密度.
总体的概率密度为p(
x)

e

x
,
x0
0,
x0
因为1,2,L ,n 相互独立, 且与有相同的分布,
所以 (
灯泡的寿命
国产轿车每公里的耗油量
该批灯泡寿命的全体就是总体
所有国产轿车每公里耗油量的全体就是总体
由于每个个体的出现带有随机性，即相应的数量指标值的出现带有随机性。从而可把此种数量指标看作随机变量，我们用一个随机变量或其分布来描述总体。为此常用随机变量的符号或分布的符号来表示总体。
通常，我们用随机变量 ,,,…, 等表示总体。当我们说到总体，就是指一个具有确定概率分布的随机变量。
D

D(
1 n
i )

1 n2
Di

1 n2

2

1 n

2
i 1
i 1
i 1
(3)
E ( S n2
)

E[
1 n
n
i2
2]

1 n
n
E(i2 ) E 2
i 1
i 1
n
1n (Di (Ei )2 ) (D (E )2 )
i 1
n

pn (x1,
1,2
x2 ,
,L
, xn
,
)
n

)的概率密度为
n
p(xi )

ne

n

i 1
xi
,
i 1
0,
xi 0 其它
例2 设总体服从两点分布 B(1, p), 其中0 p 1, (1,2 ,L ,n )是来自总体的样本, 求样本 (1,2,L ,n )
容量为n的样本可以看作n维随机变量.但是,一旦取定一组样本,得到的是n个具体的数
(x1, x2 , , xn ) ,称此为样本的一次观察值,源自称样本值.2. 简单随机样本
抽取样本的目的是为了利用样本对总体进行统计推断,这就要求样本能很好的反映总体的特性且便于处理.为此,需对抽样提出一些要求,通常有两条:
称函数
0,
Fn
(
x
)

k n
,
1,
x x(1) , x(k ) x x(k1) , x x(n) .
为总体的经验分布函数.换句话说, 对任何
实数x, 经验分布函数 Fn (x) 为样本值中不超过x的个数再除以n, 即
Fn ( x)

1 n
S (x),
( x )
1 n
(
2

2)

(
1 n

2

2)

n1 n
2
i 1
(4)
E(Sn*2 )

E(
n n1
Sn2 )

n n1
E(Sn2 )

2
性质5.2
若总体的k 阶矩 E( k ) 记成 k存在, 则当n 时, Ak Pk , k 1, 2,L .
证明因为 1,2,L ,n 独立且与同分布,
个统计量，统计量的分布称为抽样分布。
设 x1, x2 ,L , xn 是相应于样本1,2 ,L ,n
的样本值, 则称 f (x1, x2 ,L , xn ) 是 f (1,2 ,L ,n )
的观察值.
例1
设
X
1
,
X
2
,
X
是来自总体
3
N
(

,
2
)的
一
个
样本, 其中为已知, 2 为未知, 判断下列各式哪
E[Fn (x)] F(x), D[Fn (x)]
n
(3) Fn (x)依概率收敛于F(x).即
的分布律.
解总体的分布律为
P{ i} pi (1 p)1i (i 0, 1)
因为 1,2 ,L ,n相互独立, 且与有相同的分布,
所以 (1,2,L ,n ) 的分布律为
P{1 x1, 2 x2 , L , n xn }
P{1 x1}P{ 2 x2}L P{n xn }
所以 1k ,2k ,L ,nk 独立且与 k 同分布,
故有
E (1k
)

E
(
k 2
)

L

E
(
k n
)

E(
k
)

k
.
再根据第四章辛钦定理知
1
n
n
ik
i 1
Pk
,
k 1, 2, L ;
由第四章关于依概率收敛的序列的性质知
g( A1, A2, , Ak ) P g(1,2, ,k ),
1. 代表性：母体的每一个体有同等机会被选入子样.
2. 独立性：子样的分样是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本.
获得简单随机样本的抽样方法称为简单随机抽样.
为了使大家对总体和样本有一个明确的概念,我们给出如下定义:
定义5.1 一个随机变量或其相应的分布函数F(x)称为一个总体.
(1,2,L ,n )为来自总体X的样本,则有 :
(1) E ;
(2)
D

1 n

2;
(3)
E(Sn2 )

n1
n
2;
(4) E(Sn*2 ) 2.
证明
n
n
n
(1)
E

E
(
1 n
i )

1 n
Ei

1 n

i 1
i 1
i 1
n
n
n
(2)
n
n
xi
n xi
pi1 (1 p) i1
其中 x1, x2, , xn 在集合{0,1}中取值.
三、统计量
由样本推断总体特征,需要对样本值进行 “加工”,“提炼”.这就需要构造一些样本的函数,它把样本中所含的信息集中起来.
定义5.3. 统计量
设1,2 ,L ,n 是来自总体的一个样本, f (1,2 ,L ,n ) 是1,2 ,L ,n 的函数, 若 f 不依赖于任何未知参数 , 则称 f (1,2 ,L ,n ) 是一
x1, x2,L , xn 是这一样本的观察值.
它反映了总体均值
(1)子样均值

1 n
n
i ;
i 1
的信息
其观察值
1n x n i1 xi .
它反映了总体方差的信息
(2)子样方差
S
2 n

1 n
n i 1
(i
)2

1 n

n i1
i2

n
2

p(n) ( x)

n
n
x n 1 ,
0,
0 x
其他
4. 经验分布函数
定义5.5
设 1,2 ,L
,

是总体
n

的一个样本,
((1) ,(2) ,L ,(n) ) 是(1,2 ,L ,n ).的次序统计量
( x(1) , x(2) , x(n) )为其观测值, 设x是任一实数,
.
(3) 子样的k 阶(原点)矩
k
1 n
n
ik , k 1, 2, L
i 1
;
(4)子样的 k 阶中心矩
mk
1 n
n
(i )k
i 1
,k
2, 3, L
;
其观察值
bk
1n n i1 ( xi

x)k
,k
2, 3,
.
样本矩具有下列性质:
性质5.1设总体的期望E ,方差D 2,
定义5.2 设是具有分布函数 F (x)的随机变量,
若1,2, L , n 是具有同一分布函数 F (x)、相互独立的随机变量, 则称 1, 2,L , n 为从总体 (或总体 F (x)) 中抽取的容量为 n
的简单随机样本, 简称样本.
它们的观察值 x1, x2, L , xn 称为样本值,
如:研究某批灯泡的寿命时，我们关心的数量指标就是寿命，那么，此总体就可以用随机变量X表示，或用其分布函数F(x)表示.
总体
寿命可用一概 F(x) 率分布来刻划
某批灯泡的寿命
因此, 在统计学中,总体这个概念的要旨是:
总体就是一个概率分布.
有限总体和无限总体
实例某工厂10月份生产的灯泡寿命所组成的总体中, 个体的总数就是10月份生产的灯泡数, 这是一个有限总体; 而该工厂生产的所有灯泡寿命所组成的总体可近似地看成一个无限总体, 它包括以往生产和今后生产的灯泡寿命.