概率统计常见题型及方法总结
常见大题:
1.全概率公式和贝叶斯公式问题
B看做“结果”,有多个“原因或者条件”可以导致B 这个“结果”发生,考虑结果B发生的概率,或者求在B发生的条件下,源于某个原因的概率问题
全概率公式:
贝叶斯公式:
一(12分)今有四个口袋,它们是甲、乙、丙、丁,每个口袋中都装有只红球和只白球。先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球的概率为多少?
解表示从第个口袋放入第个口袋红球,
表示从第个口袋中任取一个球为红球, 2分则
, 2分
2分
依次类推 2分
二(10分)袋中装有只正品硬币,只次品硬币(次品硬币的两面均印有国徽),在袋中任取一只,将它投掷次,已知每次都出现国徽,问这只硬币是次品的概率为多少?
、解记={取到次品},={取到正品},={将硬币投掷次每次都出现国徽} 则,,―—5分
三、(10分)一批产品共100件,其中有4件次品,其余皆为正品。现在每次从中任取一件产品进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。在检验时,一件正品被误判为次品的概率为0.05,而一件次品被误判为正品的概率为0.01。(1)求任取一件产品被检验为正品的概率;(2)求这批产品被检验为合格品的概率。
解设表示“任取一件产品被检验为正品”,表示“任取一件产品是正品”,则
,,,
(1)由全概率公式得
(2)这批产品被检验为合格品的概率为
四、在电报通讯中不断发出信号‘0’和‘1’,统计资料表明,发出‘0’和‘1’的概率分别为0.6和0.4,由于存在干扰,发出‘0’时,分别以概率0.7和0.1接收到‘0’和‘1’,以0.2的概率收为模糊信号‘’;发出‘1’时,分别以概率0.85和0.05收到‘1’和‘0’,以概率0.1收到模糊信号‘’。
(1)求收到模糊信号‘’的概率;
(2)当收到模糊信号‘’时,以译成哪个信号为好?为什么?
解设=“发出信号”,=“收到信号”。由题意知
,,,。
(1)由全概率公式得
4分
。 2分(2)由贝叶斯公式得
, 3分
3分
二、随机变量函数的分布及其边缘密度及其独立性的判断记住如下知识点:
常见分布律和概率密度:
一般正态分布的计算转化为标准正态分布去做:
连续随机变量X:
二维随机变量的分布函数:
联合密度:
掌握如下解决随机变量函数分布的解题方法:
对于二维随机变量函数的概率密度,注意:除了求随机变量 Z=X+Y 的密度函数用公式:
注意:
先写出联合密度:
,根据联合密度写出
或者,
在平面x0z或者y0z上画出被积函数不为零的区域,然后穿线通过区域确定x的上下限。
他的函数Z = g ( X , Y )的概率密度,只能使用分布函数法
其步骤如下:
第一步
求联合密度:
,根据联合密度写出或者
第二步求z的分布函数:
难点是画出二重积分的积分区域,然后把二重积分化为二次积分定上下限,
画图:先画出被积函数也就是联合密度非零的区域,再确定区域
与密度非零区域的重合区域就是二重积分的积分区域,穿线定积分限:然后左右穿或者上下穿个积分区域定内限,求出分布函数
第三步求密度函数:
分析:
一、设总体服从上的均匀分布,是来自总体的一个样本,最大顺序统计量,
1.求随机变量的概率密度;
解:,其分布函数为
而的分布函数为
,
二、(10分)设二维随机变量的概率密度为
(1)求常数的值;(2)求与的协方差。
解(1)由,得
(2)
三(16分)设二维随机变量的概率密度为
(1)求边缘密度函数,;
(2)求边缘分布函数,;
(3)判断与是否相互独立;
(4)求。
(1) ,
当≤0时,=0,于是=0
当>0时, =,
所以的边缘概率密度为=
的边缘概率密度
当≤0时,=0
当>0时= 4分(2)
4分(3)独立 4分(3) 4分
四(10分)设随机变量的概率密度为
求随机变量的分布函数。
当时,
当时,
所以的分布函数为
3.中心极限定理的问题:用正态分布近似计算共两类:
一类是二项分布的近似计算问题
,即
,
这个公式给出了n 较大时二项分布的概率计算方法。
另一类是除二项分布之外的其他分布的独立变量连加和的计算问题,
设独立同分布,
近似有连加和服从正态分布:
一、(14分)
设粮仓内老鼠的数目是一个服从泊松分布的随机变量,且仓内无鼠的概率为。
(1)写出随机变量的分布律;
(2)试用中心极限定理计算,在200个同类粮仓内老鼠总数超过350只的概率。
解(1); 5分
(2)表示任意老鼠个数,由中心极限定理
3分
3分
3分
二、(10分)某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以表示在随意抽查的100个索赔户中因被盗而向保险公司索赔的数。
(1)写出的概率分布;
(2)求被盗索赔户不少于14户且不多于30户的概率的近似值。
[解] (1),
,
(2),
根据棣莫佛—拉普拉斯中心极限定理
三(10分)某银行的柜台替每一位顾客的服务时间(单位:分钟)服从参数的指数
分布,且各位顾客的服务时间是相互独立的,试用中心极限定理计算,对100位顾客的总服务时间不超过240分钟的概率。
解设分别表示每一位顾客的服务时间,则它们相互独立相同分布,且
------------------------------- 5分
点估计的问题:矩估计和似然估计
似然函数的构造:
例题分析:
一、设总体的概率密度为
是未知参数,是来自的样本,
1.求的矩估计量;
矩估计法:,令, =>
2.求的最大似然估计量;
3.判断,是否为无偏估计
解:最大似然估计法:设为样本的观察值,则
似然函数为
,
按似然估计的思想,当似然函数关于是增函数,故。的最大似然估计量为。
二(10分)设为样本,总体的概率密度为
求参数的最大似然估计量;问它是否为的无偏估计量
解设是相应的样本值,则似然函数为
=
令
为无偏估计量
三、设是总体的样本,的概率密度为
其中.求和的最大似然估计量。
设是的样本值, 则似然函数
,
当()时,, 令
显然, 第二个等式是矛盾等式, 所以由上述似然方程求不出和. 由于, 这表明是的严格递增函数, 注意到(), 因此当
时最大. 于是和的最大似然估计值
, ,
于是和的最大似然估计量为
, .
四、(10分)设总体X的概率密度为
其中是未知参数。设为总体的样本。
(1)求参数的最大似然估计量;(2)判断是否为的无偏估计量。
解(1)设是的观测值,则似然函数为
,
。
令,得,解得
的最大似然估计量为
(2)由于,是的无偏估计量。
五(10分)设电池的寿命服从指数分布,其概率密度为
其中为未知参数,今随机抽取5只,测得寿命如下:
1150,1190,1310,1380,1420
求电池的平均寿命的最大似然估计值。
解似然函数, 3分
3分
令得 2分
2分六、设总体X的概率密度为
其中是未知参数.设为总体的样本.求参数的矩估计量
和最大似然估计量.
解矩估计
且,令
,则
从而的矩估计量
最大似然估计
设是的样本观测值, 则似然函数为
.
取对数得,
令,得,解得,
所以, 的最大似然估计量为.
七、.设总体的分布律为
,,
一个样本:
为未知参数。现抽得
其中
,
的矩估计值
,求参数
,
和极大似然估计值。
解,
由,即,得参数的矩估计值为
统计量的分布判断问题:
主要利用性质:
独立正态分布的线性组合还是正态分布
三大分布的定义: