数理统计复习

合集下载

数理统计复习题

数理统计复习题

注:本卷中所用的样本方差为∑=--=ni i X X n S 122)(11;采用上分位点的记法。

一.填空1. 设总体X 服从正态分布(0,1)N ,从此总体中抽取容量为8的样本123(,,,X X X45678,,,,)X X X X X 。

又设2212345678()()Y X X X X X X X X =+++++++,则b = 使得随机变量bY 服从2χ分布。

2. 设1,2,...,n X X X 是(1,1)-上的均匀分布的总体的一个样本,∑=-=ni i X n X 11,则DX为 。

4. 设n X X ,,1 是来自正态总体),(2σμN 的样本,若μ为未知,则2σ的置信度为α-1的置信区间为 。

7.设n X X ,,1 是来自正态总体),(2σμN 的样本,其中2,σμ均未知, 则μ的置信 度为α-1的置信区间为 ;若μ为未知,则检验假设()2222200100::,H H s s s s s 倡<已知的拒绝域为 。

8.在一元线性回归模型Y x αβε=++中,当0x x =时,对Y 作区间估计的统计量为 。

9.设母体X 服从(0,)b 上的均匀分布,n X X X ,,,21 是来自X 的简单随机样本, 则b 的矩估计和最大似然估计量分别 , 。

二选择1. 设n X X X ,,,21 是来自正态母体2(,)N μσ的子样,令2211()nii Y Xμσ==-∑,则 Y ( )A.2()n χB. ),(2σμNC. 2(1)n χ- D. 2(,)N nσμ2. 在假设检验中,设0H 为原假设,犯第一类错误情况为( )A.0H 为真, 接受0HB. 0H 不真,接受0HC.0H 为真, 拒绝0HD. 0H 不真, 拒绝0H3.设1,2,...,n X X X 是区间(1,1)-DX 分别为( )A .10,3B .11,3 C .10,3n D .11,33n4.已知~(),X t n 则2~X ( )A. 2()x nB. ()t nC. (,1)F nD. (1,)F n6.设母体X 具有指数分布,它的分布密度为0()0,0x e x f x x λλ-⎧≥=⎨<⎩其中0λ>,则λ的矩估计量为( ) A .X B .1XC .2S D .21S7. 一元方差分析中对r 个总体:1,,r X X 第i 个总体i X 有i n 个:1,,i i in X X , 且12r n n n n +++= ,检验原假设0H 时使用的统计量为( )A. X T =B. /1/A E Q r F Q n r -=-C. //1E A Q n r F Q r -=-D. 222(1)n S χσ-= 三 证明:12,,,n X X X 为具有有限方差的总体X 的简单样本,求(1) 样本均值X 的方差; (2) 样本方差2S 的期望;四、 设总体X 具有分布律其中)10(<<θθ为未知参数。

概率论与数理统计总复习知识点归纳

概率论与数理统计总复习知识点归纳

概率论与数理统计总复习知识点归纳1.概率论的基础概念-随机事件、样本空间和事件的关系。

-频率和概率的关系,概率的基本性质。

-古典概型和几何概型的概念。

-条件概率和乘法定理。

-全概率公式和贝叶斯公式。

-随机变量和概率分布函数的概念。

-离散型随机变量和连续型随机变量的定义、概率质量函数和概率密度函数的性质。

2.随机变量的数字特征-随机变量的数学期望、方差、标准差和切比雪夫不等式。

-协方差、相关系数和线性变换的数学期望和方差公式。

-两个随机变量的和、差、积的数学期望和方差公式。

3.大数定律和中心极限定理-大数定律的概念和三级强大数定律。

-中心极限定理的概念和中心极限定理的两种形式。

4.数理统计的基本概念和方法-总体、样本和抽样方法的概念。

-样本统计量和抽样分布的概念。

-点估计和区间估计的概念。

-假设检验的基本思想和步骤。

-正态总体的参数的假设检验和区间估计。

5.参数估计和假设检验的方法和推广-极大似然估计的原理和方法。

-矩估计的原理和方法。

-最小二乘估计的原理和方法。

-一般参数的假设检验和区间估计。

6.相关分析和回归分析-相关系数和线性相关的概念和性质。

-回归分析的一般原理。

-简单线性回归的估计和检验。

7.非参数统计方法-秩和检验和符号检验的基本思想和应用。

-秩相关系数的计算和检验。

8.分布拟合检验和贝叶斯统计-卡方拟合检验的原理和方法。

-正态总体参数的拟合优度检验。

-贝叶斯估计的基本思想和方法。

9.时间序列分析和质量控制-时间序列的基本性质和分析方法。

-时间序列预测的方法和模型。

-质量控制的基本概念和控制图的应用。

以上是概率论与数理统计总复习知识点的归纳,希望对你的复习有所帮助。

数理统计复习资料

数理统计复习资料

复习资料(资料总结,仅供参考)判断题1.研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。

X 2.统计分析包括统计描述和统计推断。

3.计量资料、计数资料和等级资料可根据分析需要相互转化。

4.均数总是大于中位数。

X 5.均数总是比标准差大。

X 6.变异系数的量纲和原量纲相同。

X 7.样本均数大时,标准差也一定会大。

X 8.样本量增大时,极差会增大。

9.若两样本均数比较的假设检验结果P 值远远小于0.01,则说明差异非常大。

X 10.对同一参数的估计,99%可信区间比90%可信区间好。

X 11.均数的标准误越小,则对总体均数的估计越精密。

12. 四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。

X13.统计资料符合参数检验应用条件,但数据量很大,可以采用非参数方法进行初步分析。

14.对同一资料和同一研究目的,应用参数检验方法,所得出的结论更为可靠。

X 15.等级资料差别的假设检验只能采用秩和检验,而不能采用列联表χ2检验等检验方法X 。

16.非参数统计方法是用于检验总体中位数、极差等总体参数的方法。

X 17.剩余平方和SS 剩1=SS 剩2,则r 1必然等于r 2。

X 18.直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。

19.两变量关系越密切r 值越大。

X 20.一个绘制合理的统计图可直观的反映事物间的正确数量关系。

21.在一个统计表中,如果某处数字为“0”,就填“0”,如果数字暂缺则填“…”,如果该处没 有数字,则不填。

X 22.备注不是统计表的必要组成部分,不必设专栏,必要时,可在表的下方加以说明。

23.散点图是描写原始观察值在各个对比组分布情况的图形,常用于例数不是很多的间断性分组资料的比较。

24.百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的原始顺序依次进行绘制,其他置于最后。

X 25.用元参钩藤汤治疗80名高血压患者,服用半月后比服用前血压下降了2.8kPa ,故认为该药有效( X )。

数理统计复习

数理统计复习
i 1
n 2 2
( xi ) 0
1n

2 4
( xi
i 1

)2

0




1
ni 21
n
n
xi
1
n
(
i 1
xi
x
x )2

s02
经检验,x和s02确为似然函数的最大值点,
从而, 2的极大似然估计量为 ˆ X , 2 S02
i 1
i 1
n
n
(
n
C xi m
xi ) p i1
(1
nm xi p) i1
i 1
n
对数似然方程为 ln L( p) ln(
C xi m
)

nx
ln
p

(nm

nx)
ln(1
p)
i 1
令 ln L( p) nx (nm nx) 0 p x
抽取6件,测得它们的长度为:32.56, 29.66, 31.64, 30.00, 31.87, 31.03。问 这批零件的长度是否符合产品要求?
3、某药厂生产一种抗菌素,每瓶抗菌素的某项指标服从正态分布。某日开 工后随机抽取5瓶,测得该项指标数据为:22.3, 21.5, 22.0, 21.8, 21.4。 1)求该指标均值的区间估计; 2)设在正常情况下,该指标的均值为23.0,问该日的生产是否正常?
2
n
|xi |
2)极大似然估计:似然函数L( )
n
n i 1
p(
xi
;
)


1

数理统计总复习(题型归纳)

数理统计总复习(题型归纳)

56学 考题8(2005级 256学时) 三 、 ( 本 题 8 分 ) 设 X 1 , X 2 , L , X n为 服 从 泊 松 分 布 )的 π(λ )的总体X的一个样本,求λ的极大似然估计量。
32 考题9(2004级 32学时) 三、(本题8分)设总体X的概率密度为: ( θ + 1) x θ , 0 < x < 1, f ( x) = 0, 其它 其中θ > −1是未知参数,X 1 , X 2 , L , X n为总体X 的一个容量为n简单随机样本,求参数θ的极大 似然估计量。
考题5(2007级 64学时 作业P153 四) 七、(本题8分)设X 1 , L , X n为总体X的样本, X的密度函数为: 0< x<1 θ, f ( x , θ) = 1 − θ, 1 ≤ x < 2;其中未知参数θ > 0 0, 其他 设N为样本值x1 , L , xn中小于1的个数,求θ的极 大似然估计。
1 2 n
32学 考题4(2007级 32学时) 10分 六、(本题10分)设随机变量X的概率密度为 2x 2 , 0< x<θ f ( x) = θ ,其中未知参数θ > 0, 0, 其他 X 1 , L , X n是样本,求θ的矩估计和最大似然估计。
(此题和2008级的第三大题一样的.)
: 解(1)检验假设H 0:σ 2 = 1,H 1:σ 2 ≠ 1; ( n − 1) S 2 取统计量:χ 2 = 2 σ0
2 拒绝域为:χ 2 ≤ χ 2 α ( n − 1) = χ 0.975 ( 9) = 2.70 1−
或χ 2 ≥ χ 2 ( n − 1) = χ α
2
2 2 0.025

数理统计主要内容和复习重点

数理统计主要内容和复习重点
第七章 假设检验 主要内容: 一. 基本概念:两类错误、检验的 p 值
两类错误:H0 正确但拒绝 H0 为第一类错误,H0 错误但接受 H0 为第二类错误; 检验的 p 值:作出拒绝 H0 决策的最小显著水平。 二. 参数检验:单正态总体参数、双正态总体参数、其他分布参数、似然比检验 单正态总体参数检验:已知方差检验均值、未知方差检验均值、检验方差; 双正态总体参数检验:已知方差检验均值差、未知方差检验均值差、检验方差比; 其他分布参数检验:指数分布参数检验、比例 p 的检验、泊松分布参数检验,以
及对应的大样本情形。 似然比检验:分别求出一般情况与在 H0 成立条件下,似然函数的上确界之比。 三. 非参数检验:分类χ 2 拟合优度检验、列联表独立性检验、正态检验、其他非参数检验 分类χ 2 拟合优度检验:总体分布分成有限类的χ 2 检验法;
列联表独立性检验:χ 2 检验法; 正态性检验:正态概率纸,W 检验法,EP 检验; 其他非参数检验:游程检验、符号检验、秩和检验。 重点: 单与双正态总体参数检验的六种类型、其他分布参数检验、似然比检验、分类χ 2 拟合优度检 验与列联表独立性检验
估计方法:矩估计、最大似然估计; 评价标准:相合性、无偏性、有效性,以及均方误差; 最小方差无偏估计 UMVUE:充分性原则,UMVUE 判定定理,Fisher 信息量,
C-R 下界与有效估计; 贝叶斯估计:先验分布、后验分布,共轭先验分布。 二. 区间估计:枢轴量、单正态总体、双正态总体、比例 p、其他分布参数 枢轴量:概念以及与统计量的区别; 单正态总体置信区间:已知方差估计均值、未知方差估计均值、估计方差; 双正态总体置信区间:已知方差估计均值差、未知方差估计均值差、估计方差比; 比例 p 的置信区间:近似法、方程法、修正法; 其他分布参数的置信区间:指数分布、泊松分布等。 重点: 矩估计与最大似然估计、无偏性与有效性、Fisher 信息量与有效估计、单与双正态总体置信 区间的六种类型、比例 p 的置信区间(任一方法)。

概率论与数理统计期末复习

概率论与数理统计期末复习

概率论与数理统计期末复习《概率论与数理统计》总复习提纲第⼀块随机事件及其概率内容提要基本内容:随机事件与样本空间,事件的关系与运算,概率的概念和基本性质,古典概率,⼏何概率,条件概率,与条件概率有关的三个公式,事件的独⽴性,贝努⾥试验.1、随机试验、样本空间与随机事件(1)随机试验:具有以下三个特点的试验称为随机试验,记为.1)试验可在相同的条件下重复进⾏;2)每次试验的结果具有多种可能性,但试验之前可确知试验的所有可能结果;3)每次试验前不能确定哪⼀个结果会出现.(2)样本空间:随机试验的所有可能结果组成的集合称为的样本空间记为Ω;试验的每⼀个可能结果,即Ω中的元素,称为样本点,记为.(3)随机事件:在⼀定条件下,可能出现也可能不出现的事件称为随机事件,简称事件;也可表述为事件就是样本空间的⼦集,必然事件(记为)和不可能事件(记为). 2、事件的关系与运算(1)包含关系与相等:“事件发⽣必导致发⽣”,记为或;且.(2)互不相容性:;互为对⽴事件且.(3)独⽴性:(1)设为事件,若有,则称事件与相互独⽴. 等价于:若().(2)多个事件的独⽴:设是n个事件,如果对任意的,任意的,具有等式,称个事件相互独⽴.3、事件的运算(1)和事件(并):“事件与⾄少有⼀个发⽣”,记为.(2)积事件(交):“事件与同时发⽣”,记为或.(3)差事件、对⽴事件(余事件):“事件发⽣⽽不发⽣”,记为称为与的差事件;称为的对⽴事件;易知:.4、事件的运算法则1) 交换律:,;2) 结合律:,;3) 分配律:,;4) 对偶(De Morgan)律:,,可推⼴5、概率的概念(1)概率的公理化定义:(2)频率的定义:事件在次重复试验中出现次,则⽐值称为事件在次重复试验中出现的频率,记为,即.(3)统计概率:称为事件的(统计)概率.在实际问题中,当很⼤时,取(4)古典概率:若试验的基本结果数为有限个,且每个事件发⽣的可能性相等,则(试验对应古典概型)事件发⽣的概率为:.(5)⼏何概率:若试验基本结果数⽆限,随机点落在某区域g的概率与区域g的测度(长度、⾯积、体积等)成正⽐,⽽与其位置及形状⽆关,则(试验对应⼏何概型),“在区域中随机地取⼀点落在区域中”这⼀事件发⽣的概率为:.(6)主观概率:⼈们根据经验对该事件发⽣的可能性所给出的个⼈信念.6、概率的基本性质(1)不可能事件概率零:=0.(2)有限可加性:设是n个两两互不相容的事件,即=,(),则有=+.(3)单调不减性:若事件,且.(4)互逆性:且.(5)加法公式:对任意两事件,有-;此性质可推⼴到任意个事件的情形.(6)可分性:对任意两事件,有,且7、条件概率与乘法公式(1)条件概率:设是两个事件,即,则称为事件发⽣的条件下事件发⽣的条件概率.(2)乘法公式:设且则称为事件的概率乘法公式.8、全概率公式与贝叶斯(Bayes)公式(1)全概率公式:设是的⼀个划分,且,,则对任何事件,有称为全概率公式.(2)贝叶斯(Bayes)公式:设是的⼀个划分,且,则对任何事件,有称为贝叶斯公式或逆概率公式.9、贝努⾥(Bernoulli)概型(1)只有两个可能结果的试验称为贝努⾥试验,常记为.也叫做“成功—失败”试验,“成功”的概率常⽤表⽰,其中=“成功”.(2)把重复独⽴地进⾏次,所得的试验称为重贝努⾥试验,记为.(3)把重复独⽴地进⾏可列多次,所得的试验称为可列重贝努⾥试验,记为.以上三种贝努⾥试验统称为贝努⾥概型.(4)中成功次的概率是:其中.疑难分析1、必然事件与不可能事件必然事件是在⼀定条件下必然发⽣的事件,不可能事件指的是在⼀定条件下必然不发⽣的事件.它们都不具有随机性,是确定性的现象,但为研究的⽅便,把它们看作特殊的随机事件.2、互逆事件与互斥(不相容)事件如果两个事件与必有⼀个事件发⽣,且⾄多有⼀个事件发⽣,则、为互逆事件;如果两个事件与不能同时发⽣,则、为互斥事件.因⽽,互逆必定互斥,互斥未必互逆.区别两者的关键是:当样本空间只有两个事件时,两事件才可能互逆,⽽互斥适⽤与多个事件的情形.作为互斥事件在⼀次试验中两者可以都不发⽣,⽽互逆事件必发⽣⼀个且只发⽣⼀个.3、两事件独⽴与两事件互斥两事件、独⽴,则与中任⼀个事件的发⽣与另⼀个事件的发⽣⽆关,这时;⽽两事件互斥,则其中任⼀个事件的发⽣必然导致另⼀个事件不发⽣,这两事件的发⽣是有影响的,这时.可以⽤图形作⼀直观解释.在图1.1左边的正⽅形中,图1.1,表⽰样本空间中两事件的独⽴关系,⽽在右边的正⽅形中,,表⽰样本空间中两事件的互斥关系.4、条件概率与积事件概率是在样本空间内,事件的概率,⽽是在试验增加了新条件发⽣后的缩减的样本空间中计算事件的概率.虽然、都发⽣,但两者是不同的,⼀般说来,当、同时发⽣时,常⽤,⽽在有包含关系或明确的主从关系时,⽤.如袋中有9个⽩球1个红球,作不放回抽样,每次任取⼀球,取2次,求:(1)第⼆次才取到⽩球的概率;(2)第⼀次取到的是⽩球的条件下,第⼆次取到⽩球的概率.问题(1)求的就是⼀个积事件概率的问题,⽽问题(2)求的就是⼀个条件概率的问题. 5、全概率公式与贝叶斯(Bayes)公式当所求的事件概率为许多因素引发的某种结果,⽽该结果⼜不能简单地看作这诸多事件之和时,可考虑⽤全概率公式,在对样本空间进⾏划分时,⼀定要注意它必须满⾜的两个条件.贝叶斯公式⽤于试验结果已知,追查是何种原因(情况、条件)下引发的概率.第⼆块随机变量及其分布内容提要基本内容:随机变量,随机变量的分布的概念及其性质,离散型随机变量的概率分布,连续型随机变量的概率分布,常见随机变量的分布,随机变量函数的分布.1、随机变量设是随机试验的样本空间,如果对于试验的每⼀个可能结果,都有唯⼀的实数与之对应,则称为定义在上的随机变量,简记为.随机变量通常⽤⼤写字母等表⽰.2、离散型随机变量及其分布列如果随机变量只能取有限个或可列个可能值,则称为离散型随机变量.如果的⼀切可能值为,并且取的概率为,则称为离散型随机变量的概率函数(概率分布或分布律).也称分布列,常记为其中.常见的离散型随机变量的分布有:(1)两点分布(0-1分布):记为,分布列为或(2)⼆项分布:记为,概率函数(3)泊松分布,记为,概率函数泊松定理设是⼀常数,是任意正整数,设,则对于任⼀固定的⾮负整数,有.当很⼤且很⼩时,⼆项分布可以⽤泊松分布近似代替,即,其中(4)超⼏何分布:记为,概率函数,其中为正整数,且.当很⼤,且较⼩时,有(5)⼏何分布:记为,概率函数.3、分布函数及其性质分布函数的定义:设为随机变量,为任意实数,函数称为随机变量的分布函数.分布函数完整地描述了随机变量取值的统计规律性,具有以下性质:(1)有界性;(2)单调性如果,则;(3)右连续,即;(4)极限性;(5)完美性.4、连续型随机变量及其分布分布如果对于随机变量的分布函数,存在⾮负函数,使对于任⼀实数,有,则称为连续型随机变量.函数称为的概率密度函数.概率密度函数具有以下性质:(1);(2);(3);(4);(5)如果在处连续,则.常⽤连续型随机变量的分布:(1)均匀分布:记为,概率密度为分布函数为(2)指数分布:记为,概率密度为分布函数为(3)正态分布:记为,概率密度为,相应的分布函数为当时,即时,称服从标准正态分布.这时分别⽤和表⽰的密度函数和分布函数,即具有性质:①.②⼀般正态分布的分布函数与标准正态分布的分布函数有关系:.5、随机变量函数的分布(1)离散型随机变量函数的分布设为离散型随机变量,其分布列为(表2-2):表2-2则任为离散型随机变量,其分布列为(表2-3):表2-3……有相同值时,要合并为⼀项,对应的概率相加.(2)连续型随机变量函数的分布设为离散型随机变量,概率密度为,则的概率密度有两种⽅法可求.1)定理法:若在的取值区间内有连续导数,且单调时,是连续型随机变量,其概率密度为.其中是的反函数.2)分布函数法:先求的分布函数然后求.疑难分析1、随机变量与普通函数随机变量是定义在随机试验的样本空间上,对试验的每⼀个可能结果,都有唯⼀的实数与之对应.从定义可知:普通函数的取值是按⼀定法则给定的,⽽随机变量的取值是由统计规律性给出的,具有随机性;⼜普通函数的定义域是⼀个区间,⽽随机变量的定义域是样本空间.2、分布函数的连续性定义左连续或右连续只是⼀种习惯.有的书籍定义分布函数左连续,但⼤多数书籍定义分布函数为右连续. 左连续与右连续的区别在于计算时,点的概率是否计算在内.对于连续型随机变量,由于,故定义左连续或右连续没有什么区别;对于离散型随机变量,由于,则定义左连续或右连续时值就不相同,这时,就要注意对定义左连续还是右连续.第三块多维随机变量及其分布内容提要基本内容:多维随机变量及其分布函数⼆维离散型随机变量的联合分布列,⼆维连续型随机变量的联合分布函数和联合密度函数,边际分布,随机变量的独⽴性和不相关性,常⽤多维随机变量,随机向量函数的分布.1、⼆维随机变量及其联合分布函数为n维(n元)随机变量或随机向量.联合分布函数的定义设随机变量,为随机向量的联合分布函数⼆维联合分布函数具有以下基本性质:(1)单调性是变量或的⾮减函数;(2)有界性;(3)极限性(3)连续性关于右连续,关于也右连续;(4)⾮负性对任意点,若,则.上式表⽰随机点落在区域内的概率为:.2、⼆维离散型随机变量及其联合分布列如果⼆维随机变量所有可能取值是有限对或可列对,则称为⼆维离散型随机变量.设为⼆维离散型随机变量,它的所有可能取值为将或表3.1称为的联合分布列.………………联合分布列具有下列性质:(1);(2).3、⼆维连续型随机变量及其概率密度函数如果存在⼀个⾮负函数,使得⼆维随机变量的分布函数对任意实数有,则称是⼆维连续型随机变量,称为的联合密度函数(或概率密度函数).联合密度函数具有下列性质:(1)⾮负性对⼀切实数,有;(2)规范性;(3)在任意平⾯域上,取值的概率;(4)如果在处连续,则.4、⼆维随机变量的边缘分布设为⼆维随机变量,则称分别为关于和关于的边缘(边际)分布函数.当为离散型随机变量,则称分别为关于和关于的边缘分布列.当为连续型随机变量,则称分别为关于和关于的边缘密度函数.5、⼆维随机变量的条件分布(了解)(1)离散型随机变量的条件分布设为⼆维离散型随机变量,其联合分布律和边缘分布列分别为,则当固定,且时,称为条件下随机变量的条件分布律.同理,有(2)连续型随机变量的条件分布设为⼆维连续型随机变量,其联合密度函数和边缘密度函数分别为:.则当时,在和的连续点处,在条件下,的条件概率密度函数为.同理,.6、随机变量的独⽴性设及分别是的联合分布函数及边缘分布函数.如果对任何实数有则称随机变量与相互独⽴.设为⼆维离散型随机变量,与相互独⽴的充要条件是.设为⼆维连续型随机变量,与相互独⽴的充要条件是对⼏乎⼀切实数,有.7、两个随机变量函数的分布设⼆维随机变量的联合概率密度函数为,是的函数,则的分布函数为.(1)的分布若为离散型随机变量,联合分布列为,则的概率函数为:或.若为连续型随机变量,概率密度函数为,则的概率函数为:.(2)的分布若为连续型随机变量,概率密度函数为,则的概率函数为:.8.最⼤值与最⼩值的分布则9.数理统计中常⽤的分布(1)正态分布:(2):(3):(4):疑难分析1、事件表⽰事件与的积事件,为什么不⼀定等于?如同仅当事件相互独⽴时,才有⼀样,这⾥依乘法原理.只有事件与相互独⽴时,才有,因为.2、⼆维随机变量的联合分布、边缘分布及条件分布之间存在什么样的关系?由边缘分布与条件分布的定义与公式知,联合分布唯⼀确定边缘分布,因⽽也唯⼀确定条件分布.反之,边缘分布与条件分布都不能唯⼀确定联合分布.但由知,⼀个条件分布和它对应的边缘分布,能唯⼀确定联合分布.但是,如果相互独⽴,则,即.说明当独⽴时,边缘分布也唯⼀确定联合分布,从⽽条件分布也唯⼀确定联合分布.3、两个随机变量相互独⽴的概念与两个事件相互独⽴是否相同?为什么?两个随机变量相互独⽴,是指组成⼆维随机变量的两个分量中⼀个分量的取值不受另⼀个分量取值的影响,满⾜.⽽两个事件的独⽴性,是指⼀个事件的发⽣不受另⼀个事件发⽣的影响,故有.两者可以说不是⼀个问题.但是,组成⼆维随机变量的两个分量是同⼀试验的样本空间上的两个⼀维随机变量,⽽也是⼀个试验的样本空间的两个事件.因此,若把“”、“”看作两个事件,那么两者的意义近乎⼀致,从⽽独⽴性的定义⼏乎是相同的.第四块随机变量的数字特征内容提要基本内容:随机变量的数学期望和⽅差、标准差及其性质,随机变量函数的数学期望,原点矩和中⼼矩,协⽅差和相关系数及其性质.1、随机变量的数学期望设离散型随机变量的分布列为,如果级数绝对收敛,则称级数的和为随机变量的数学期望.设连续型随机变量的密度函数为,如果⼴义积分绝对收敛,则称此积分值为随机变量的数学期望.数学期望有如下性质:(1)设是常数,则;(2)设是常数,则;(3)若是随机变量,则;对任意个随机变量,有;(4)若相互独⽴,则;对任意个相互独⽴的随机变量,有.2、随机变量函数的数学期望设离散型随机变量的分布律为,则的函数的数学期望为,式中级数绝对收敛.设连续型随机变量的密度函数为,则的函数的数学期望为,式中积分绝对收敛.3、随机变量的⽅差设是⼀个随机变量,则称为的⽅差.称为的标准差或均⽅差.。

数理统计复习要点

数理统计复习要点

e x , x 0
0, x 0
其中 0 。试用矩法求 的估计量。
解: =E (X )
1 所以, =


xf ( x)dx xe
0

x
dx
1

1 ˆ ˆ =X ,所以, = 用样本 X 估计, 则有 X
3.设母体X具有在区间[a,b]上的均匀分布,其 分布密度为 f(x)=
H0
16.某电工器材厂生产一种保险丝。测量其融化 时间,依通常情况方差为400。今从某天产品中 抽取容量为25的子样,测量其融化时间并计算得 x 62.24,s*2 404.77,问这天保险丝融化时间 分散度与通常有无明显差异( 1%)?假定融 化时间是正态母体。 解:(1 )建立假设H 0: 0 400
=e
( xi )
i 1
n
d ln L ln L ( xi n ), 0无解 d i
xi n尽可能小,所以 为了使L达到最大, i 尽可能大,而 x , min x x
i 1i n i (1)
12、设母体X服从正态分布 N (,1),( X1, X 2 ) 是从此母体中抽取的一个子样。试验证下面 三个估计量 2 1 (1)^ 1 X 1 X 2
0
(3)给定显著水平 0.05 ,有 u 1.96 ,使 2 x 0 P{ u u } 即 P{ 1.96} 0.05 0 / n 2 (4)由样本n=16, x 27.56 代入 27.56 26 接受H0 u 1.2 u 1.96 5.2 / 4 2
解:
(1)X
*2
用 s 估计 2 给定置信概率1 =99%,查表得
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章统计量及其分布一、教材说明本章内容包括:总体与样本,样本数据的整理与显示,统计量及其分布,三大抽样分布。

本章的基本概念和重要结论是学习数理统计的基础。

1、教学目的与教学要求—1)掌握数理统计的总体、样本、样本经验分布函数、统计量及常用统计量等基本概念。

2)掌握三大分布的定义,并能熟练应用来求随机变量的分布。

3)牢记Fisher定理的内容及其三大推论。

4)使学生了解数理统计研究问题的方法与概率论研究问题方法的不同。

5)了解如何对样本数据进行整理与现实。

|2、本章重点与难点本章重点是数理统计的基本概念、三大分布的定义、Fisher定理及其推论。

难点是Fisher 定理结合三大分布来求随机变量的分布。

二、教学内容本章共分总体与样本、样本数据的整理与显示、统计量及其分布、三大抽样分布等4节来讲述本章的基本内容。

》§总体与样本一、总体与样本在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体。

对于实际问题,总体中的个体是一些实在的人或物。

比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体。

事实上,每一个学生有许多特征:性别、年龄、身高、体重等等,而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不考虑。

这样,每个学生(个体)所具有的数量指标——身高就是个体,而所有身高全体看成总体。

这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:总体就是一个分布,而其数量指标就是服从这个分布的随机变量。

—例5.1.1考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p表示不合格品率,则各总体可用一个二点分布表示:不同的p反映了总体间的差异。

在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机向量及其联合分布来描述总体。

这种总体称为多维总体。

若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体。

实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象。

<二、样本与简单随机样本 1、样本为了了解总体的分布,从总体中随机地抽取n 个个体,记其指标值为 n x x x ,,,21 , 则n x x x ,,,21 称为总体的一个样本,n 称为样本容量或简称为样本量,样本中的个体称为样品。

当30≥n 时,称n x x x ,,,21 为大样本,否则为小样本。

首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母 n X X X ,,,21 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母n x x x ,,,21 表示。

简单起见,无论是样本还是其观测值,本书中均用n x x x ,,,21 表示,从上下文我们能加以区别。

、每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本。

从而知道分组样本与完全样本相比在信息上总有损失,但在实际中,若样本量特别大,用分组样本既简明扼要,又能帮助人们更好地认识总体。

2、简单随机样本从总体中抽取样本可有不同的抽法,为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体。

这就需要对抽样方法提出一些要求,最常用的有如下两个要求:1)样本具有随机性:要求每一个个体都有同等机会被选入样本,这便意味着每一样品i x 与总体X 有相同的分布。

2)样本要求有独立性:要求每一样品的取值不影响其它样品的取值,这便意味着n x x x ,,,21 相互独立。

\若样本n x x x ,,,21 是n 个相互独立的具有同一分布的随机变量,则称该样本为简单随机样本,简称为样本。

注(1)若总体X 的分布函数为F (x ),则其样本的联合分布函数为)(1i ni x F =∏(2)若总体X 的密度函数为p (x ),则其样本的联合密度为)(1i ni x p =∏(3)若总体X 的分布列为 )(i x p ,则其样本的联合分布列为)(1i ni x p =∏(4)对有限总体不放回抽样,若总体中有几个个体,抽取样本容量为n ,当n <<N (1.0≤Nn)时,不放回抽样得到的样本可认为是简单随机样本。

、例5.1.5 设有一批产品共N 个,需进行抽样检验以了解其不合格品率p ,现从中抽出n 个逐一检查它们是否是不合格品,记合格品为0,不合格品为1。

则总体为一个二点分布:P(X =1)=p ,P (X =0)=1-p 。

设 1,...,n x x 为该总体的一个样本,采用不放回抽样得到。

这时,第二次抽到不合格品的概率依赖于第一次抽到的是否是不合格品:11)11(12--===N Np x x P 1)01(12-===N Npx x P 但当N 很大时,上述两个概率近似都等于p ,所以当N 很大,而n 不大时,不放回抽样得到的样本可近似看成简单随机样本。

}§样本数据的整理与显示一、经验分布函数1、定义 设n x x x ,,,21 是取自总体分布函数为F(x)的样本,若将样本观测值从小到大进行排列为)()2()1(,,,n x x x ,则)()2()1(n x x x ≤≤为有序样本,如下函数(1)()(1)()0,(),,1,2,,11,n k k n x x kF x x x x k n n x x +<⎧⎪⎪=≤<=-⎨⎪⎪>⎩当当当称为经验分布函数。

%例5.2.1某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重为:351 347 355 344 351,求此样本的经验分布函数。

2、经验分布函数的性质01 对每一个固定的x ,)(x F n 是事件“X x ≤”发生的频率,当n 固定时,)(x F n 是样本的函数,是一个随机变量,且)()(x F x F Pn −→−。

02(格里纹科定理)定理5.2.1:设n x x x ,,,21 是取自总体分布函数为F (x )的样本,)(x F n 是经验分布函数,有1)0)()(sup lim (==-+∞<<∞-∞→x F x F P n x n 。

|注 此定理表明,当n 相当大时,经验分布函数是总体分布函数的一个良好的近似。

二、频数频率分布表样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其频数分布表或频率分布表,其基本步骤是:1、对样本进行分组:首先确定组数k ,作为一般性原则,组数通常在5-20个。

对容量较小的样本,通常将其分为5组或6组,容量为100左右的样本可分7到10组,容量在200左右的样本可分9~13组,容量为300左右级以上的样本可分12到20组。

2、确定每组组距:每组组距可以相同也可以不同。

但实际中常选用长度相同的区间,以d 表示组距。

{3、确定每组组限。

4、统计样本数据落入每个区间的个数——频数,并列出其频数频率分布表。

具体例子略。

三、样本数据的图形显示:常用的样本数据的图形显示主要有直方图和茎叶图,具体例子略。

#§统计量及其分布一、统计量与抽样分布样本来自总体,含有总体各方面的信息,但这些信息较为分散,有时不能直接利用。

为将这些分散的信息集中起来以反映总体的各种特征,需要对样本进行加工,最常用的加工方法是构造样本的函数,为此:定义 5.3.1 设n x x x ,,,21 为取自某总体的样本,若样本函数),,(1n x x T T =中不含有任何未知参数,则称T 为统计量。

统计量的分布为抽样分布。

按上述定义:设n x x x ,,,21 为样本,则211,i ni i ni x x ==∑∑都是统计量,当2,σμ未知时,σμ11,x x -等都不是统计量。

注 统计量不依赖于未知参数,但其分布一般是依赖于未知参数的。

二、常用的统计量1、样本均值、样本方差、样本k 阶矩及k 阶中心矩定义 设n x x x ,,,21 是来自某总体的样本。

称—∑==ni i x n x 11 为样本均值∑=-=ni i x x n S12*)(12为样本方差 2**S S = 为样本标准差∑=--=ni i x x n S 122)(11 为样本(无偏)方差 2S S = 为样本(无偏)标准差)∑==n i ki k x n a 11 为样本k 阶(原点)矩∑=-=ni k i k x x n b 1)(1为样本k 阶中心矩注(1)∑=--=n i i x x n S 122)(11=][11122∑=--ni ix n x n (2)在分组样本场合下:若i x 为第i 组的组中值,i f 为该i 组的个数,k 为组数,则∑==++=ki i k k f n n f x f x x 111,其中*∑=--=k i i i x x f n S 122)(11=][11122∑=--ki ii x n x f n 2、次序统计量定义 5.3.7设n x x x ,,,21 是取自总体X 的样本,将其从小到大排序得到(1)(2)()n x x x ≤≤≤.定义)(i X :不论n x x x ,,,21 取怎样的一组观测值,)(i X 总取()i x 为其观测值,称)(i X 为第i 个次序统计量,从而有)()2()1(n X X X ≤≤.{}i ni X X ≤≤=11min ,{}i ni n X X ≤≤=1)(max 分别称为样本的最小、最大次序统计量。

注 样本n x x x ,,,21 独立同总体分布,但)()2()1(,,,n X X X 既不独立又不同分布。

}三、统计量X 与2S 的性质定理5.3.10)(1=-∑=ni ix x。

定理 5.3.2数据观察值与均值的偏差平方和最小,即在形如∑=-ni ic x12)(的函数中,∑=-ni i x x 12)(最小,其中c 为任意给定常数。

定理5.3.3 设n x x x ,,,21 是来自某个总体的样本,x 为样本均值。

1) 若总体分布为),(2σμN ,则x 的精确分布为)1,(2σμnN 。

¥2) 若总体分布未知或不是正态分布,但2,σμ==VarX EX ,则n 较大时的渐近分布为)1,(2σμn N ,记为x .~)1,(2σμnN 。

定理5.3.4 设总体X 具有二阶矩,即2,σμ==VarX EX <∞+, n x x x ,,,21 为从该总体中得到的样本,x 和2S 分别是样本均值与样本方差,则222,11,σσμ======VarX ES nVarX n X Var EX X E 。

相关文档
最新文档