数理统计典型例题分析
《概率论与数理统计》典型例题 第四章 大数定律与中心极限定理

= 0.15,
µn 为
5000
户中收视
该节目的户数,所以可应用棣莫弗-拉普拉斯中心极限定理,即二项分布以正态 分布为极限定理。
解 : 设 µn 为 5000 户 中 收 视 该 节 目 的 户 数 , 则 µn ~ B(n, p) , 其 中
n = 5000, p = 0.15 。 由棣莫弗-拉普拉斯中心极限定理, µn − np 近似服从 np(1− p)
显然需用到前一不等式,则只需算出 E(X + Y ) 与 D(X + Y ) 即可。
解:由于 E(X + Y ) = 0 ,
D( X + Y ) = DX + DY + 2Cov( X , Y ) = DX + DY + 2ρ XY DX DY = 1+ 4 + 2×1× 2× (−0.5) = 3 ,
( D )服从同一离散型分布。
分析:林德伯格-列维中心极限定理要求的条件是 X 1, X 2,", X n,"相互独
立、同分布、方差存在,这时,当 n 充分大时, Sn 才近似服从正态分布。 根据 条件分析选项即可。
解:显然选项 A 与 B 不能保证 X 1, X 2 , ", X n 同分布,可排除。 选项 C 给出了指数分布,此时独立同分布显然满足,而且由于是指数分布, 方差肯定存在,故满足定理条件。 选项 D 只给出其离散型的描述,此时独立同分布显然满足。 但却不能保证 方差一定存在,因此也应排除。 故选 C 。 注:本例重在考察中心极限定理的条件。
P{ X
− EX
≥ ε}≤
E[g( X − EX )] 。 g(ε )
分析:证明的结论形式与切比雪夫不等式非常相似,利用切比雪夫不等式的 证明思想试试看。
数理统计5.2例子

239.968
+95.0%CL
295.690
例:研究货运总量 y(万吨)与工业总产值
x1 (亿元)、农业总产值 x 2 (亿元)、居
民非商品支出 x 3 (亿元)的关系。
(1) 求出 y 关于 x1 , x 2 , x3 的三元线性
回归方程; (2) 对线性回归效果作显著性检验; (3) 对每一系数作显著性检验; (4) 如果有的回归系数没有通过显著性检
Predicting Values for variabl.675630 75.00000 350.672 X2 8.970961 42.00000 376.780
Intercept
-459.624
Predicted
267.829
-95.0%CL
X3 0.277096 0.235286 12.447 10.5693 1.17770 0.283510
Regression Summary for Dependent Variable: Y R= .87209434 R2= .76054853 Adjusted R2= .69213383
F(2,7)=11.117 p<.00672 Std.Error of estimate: 24.081
验,将其剔除,重新建立回归方程,再 作对回归方程的显著性检验和回归系数 的显著性检验; (5) 求当 x 01 = 75 , x 02 = 42 时的 yˆ 0 ;并求 其概率为 95%的预测区间。
编号
1 2 3 4 5 6 7 8 9 10
货运总 量y (万 吨)
160 260 210 265 240 220 275 160 275 250
Beta Std.Err. B Std.Err. t(7) p-level
数理统计习题及答案

数理统计习题及答案数理统计习题及答案数理统计是一门研究数据收集、分析和解释的学科,是现代社会中不可或缺的一部分。
在学习数理统计的过程中,习题是不可或缺的一部分。
通过解答习题,我们可以更好地理解和掌握数理统计的概念和方法。
本文将介绍一些常见的数理统计习题,并给出详细的解答。
1. 某班级有40名学生,他们的身高数据如下:160、165、170、165、168、172、178、175、170、165、160、163、168、172、175、170、165、160、163、168、172、175、170、165、160、163、168、172、175、170、165、160、163、168、172、175、170、165、160、163、168。
请计算这组数据的平均身高、中位数和众数。
解答:首先,将这组数据按照从小到大的顺序排列:160、160、160、160、160、160、160、160、163、163、163、163、165、165、165、165、165、165、165、165、168、168、168、168、168、168、170、170、170、170、170、170、172、172、172、172、172、175、175、175、175、175、178。
平均身高 =(160+160+160+160+160+160+160+160+163+163+163+163+165+165+165+1 65+165+165+165+168+168+168+168+168+168+170+170+170+170+170+170+172+172+172+172+172+175+175+175+175+175+178)/40 = 166.7中位数 = 排列后的第20个数据 = 165众数 = 出现次数最多的数据 = 1602. 某汽车厂家生产了1000辆汽车,其中200辆为红色,300辆为蓝色,400辆为黑色。
数理统计13

当 H 01和 H 02 都成立时,
α i = β j = 0, i = 1, 2L , r;
j = 1, 2L , s,
=> X ij = µ + α i + β j + ε ij = µ + ε ij
S A = s ∑ (α i + ε i • − ε ) = s ∑ ( ε i • − ε )
H02 的拒绝域为
FB ≥ Fα ( s − 1, (r − 1)( s − 1))
一般需要两个表格 因素B B1 因素A
A1 A2
B2
X 11 X 21
X 12 X 22
M
Ar
S• j
r
M
X r1 ∑X
∑X
i =1 s i1
r
M
X r2
∑X
Si •
SS• j
s
∑X
i =1 j =1
j =1 r
1j
r i =1 r i =1 2 i i =1
r
2
r
= s ∑ α +sE ∑ (ε i• − ε ) + 2 sE ∑ α i (ε i• − ε )
2 i =1
E∑ i (εi• −ε ) = ∑ i E(εi• −ε ) = 0 α α
r
r
E(εi• −ε )2 = E( ε ) + E( ε 2 ) −2E( ε εi• ) 1 2 1 2 1 2 = σ + σ −2 σ s rs rs 1 = ( r −1) σ 2 rs
∑ (ε
s j =1
ij
− ε i• − ε • j + ε ) = 0
=> S E σ 2 的自由度为: r − 1)( s − 1) (
数理统计方法题解5-2

5.6 设 i i i i x x y εβββ+-++=)23(2210,i ε~),0(2σN ,3,2,1=i ,321,,εεε 相互独立,11-=x ,02=x ,13=x 。
(1)写出矩阵 X ,X X T和 1)(-X X T ; (2)求 210,,βββ 的最小二乘估计; (3)证明 02=β 时,10,ββ 的最小二乘估计与02≠β 时的最小二乘估计相同。
解 (1)⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=111201111X ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=600020003X X T ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=-610002100031)(1X X T 。
(2) ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=210ˆˆˆˆββββY X X X T T 1)(-= ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=311121101111610002100031y y y ⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡+-+-++=622332131321y y y y y y y y 。
即有3ˆ3210y y y ++=β ,2ˆ311y y +-=β ,62ˆ3210y y y +-=β 。
(3)(证法一)02=β 时,模型成为 i i i x y εββ++=10,i ε~),0(2σN ,3,2,1=i ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=110111X ,⎥⎦⎤⎢⎣⎡=2003X X T ,⎥⎦⎤⎢⎣⎡=-210031)(1X X T , ⎥⎦⎤⎢⎣⎡10ˆˆββY X X X T T 1)(-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡=321101*********y y y ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+-++=2331321y y y y y ,即有3ˆ3210y y y ++=β ,2ˆ311y y +-=β , 10,ββ 的最小二乘估计与02≠β 时的最小二乘估计相同。
(证法二)02=β 时,模型成为 i i i x y εββ++=10,i ε~),0(2σN ,3,2,1=i , 按照一元线性回归的计算公式,有03101=++-=x ,2)01()00()01(222=-+-+--=xx L , 3321y y y y ++= ,y x n y x L i i i xy -=∑=313132110)1(y y y y y +-=⋅+⋅+⋅-= ,xxxy L L =1ˆβ231y y +-=,3ˆˆ32110y y y y x y ++==-=ββ 。
《概率论与数理统计》典型例题第五章数理统计初步

第五章 数理统计初步例1.若总体2~(,)X N µσ,其中2σ已知,但µ未知,而为来自总体的一个简单随机样本,试指出下列样本函数中 12,,n X X X …是统计量, 不是统计量:(1)11n i i X n =∑; (2)211(n i i X n )µ=−∑; (3)211()1n i i X X n =−−∑;;X 。
分析:利用统计量的定义即可辨别,特别注意不能含有未知参数。
解:由统计量的定义:设为总体12,,n X X X …X 的一个样本,为连续函数,如果不包含任何未知参数,则称其为一个统计量。
12(,,)n g x x x …12(,,)n g X X X …显然,(1),(3),(4),(6)给出的是统计量;而(2),(5)给出的量因含有未知参数µ,所以不是统计量。
注:统计量不包含任何未知参数,它具有两重性。
统计量是样本的一个函数,所以是一个随机变量。
若是的一组观察值,则统计量12,,nX X X …12(,,)n g X X X …12,,n x x x …12,,n X X X …12(,,)n g x x x …又是一个确定的数。
例2.设随机变量X 和Y 都服从标准正态分布,则 。
(A ) X Y +服从正态分布。
(B ) 22X Y +服从2χ分布。
(C ) 2X 和都服从2Y 2χ分布。
() D 22X 服从F 分布。
分析:考察统计中三种常见分布的构成,注意正态分布的性质。
解:由于的联合分布是否为二维正态分布未知,不能确定(,)X Y X Y +服从正态分布,又因X 与Y 是否独立未知,因而不能确定X Y +服从正态分布,也不能确定22X Y +服从2χ分布,也不能确定22X Y 服从F 分布,因而选。
C 注:本例重在强调各分布的构成中,都有独立性的要求。
另外,正态分布的性质中也同样要求独立性。
例3.设2~(,)X N µσ,则样本均值X 与总体期望µ的偏差不超过(n 为样本容量)的概率为 。
高中数学涉及的统计学知识典型例题分析

高中数学涉及的统计学知识典型例题分析一、基础知识:(一)随机抽样:1、抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到容量为n 的样本2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:(1)先将总体的N 个个体编号(2)确定分段间隔k ,设样本容量为n ,若N n 为整数,则N k n= (3)在第一段中用简单随机抽样确定第一个个体编号l ,则后面每段所确定的个体编号与前一段确定的个体编号差距为k ,例如:第2段所确定的个体编号为l k +,第m 段所确定的个体编号为()1l m k +−,直至完成样本注:(1)若N n不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被n 整除,再进行系统抽样。
例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的500个个体参加系统抽样(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为k3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。
分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到(二)频率分布直方图:1、频数与频率(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数(3)各试验结果的频率之和等于12、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出(1)极差:一组数据中最大值与最小值的差(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以有组距=极差/组数(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”(5)频率分布直方图的特点:②因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1 (三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数。
概率论与数理统计案例分析

概率论与数理统计案例分析概率论与数理统计作为数学的一个重要分支,广泛应用于各个领域。
本文将通过一些具体案例来分析概率论和数理统计在实际中的应用。
案例一:市场营销中的A/B测试在市场营销领域,A/B测试是一种常见的实验设计方法,用于比较两种不同的营销策略、广告设计或产品设计等。
假设某电商公司希望提高其网站用户的转化率,他们可以设计一个A/B测试来比较两种不同的促销活动对用户购买行为的影响。
首先,将用户随机分为两组,一组接受A方案,另一组接受B方案。
然后通过收集和分析用户的购买数据,可以利用概率论和数理统计方法来评估两种方案的效果。
通过统计显著性检验和置信区间分析,可以得出结论,哪种方案对用户购买行为影响更大,从而指导公司的营销策略。
案例二:医学研究中的双盲试验在医学研究领域,双盲试验是一种常用的研究设计,用于评估新药物的疗效。
在一次双盲试验中,研究者和参与者都不知道哪些人接受了治疗,哪些人接受了安慰剂。
通过随机分组和盲法设计,可以最大程度地减少实验结果的偏倚。
利用概率论和数理统计方法,研究人员可以对试验数据进行分析,来评估新药物的疗效是否显著,以及是否出现不良反应等情况。
通过以上案例分析,可以看出概率论和数理统计在实际中的重要性和应用价值。
无论是市场营销领域还是医学研究领域,都离不开对数据的收集、分析和解释。
掌握好概率论和数理统计知识,对于提高决策的科学性和准确性有着重要的意义。
希望本文的案例分析能够让读者更深入地理解概率论和数理统计的实际应用,为他们在相关领域的工作和研究提供一定的启发和帮助。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
典型例题分析例1.分别从方差为20和35的正态总抽取容量为8和10的两个样本,求第一个样本方差是第二个样本方差两倍的概率的范围。
解 以21S 和22S 分别表示两个(修正)样本方差。
由222212σσy x S S F =知统计量2221222175.13520S S S S F ==服从F 分布,自由度为(7,9)。
1) 事件{}22212S S =的概率 {}{}05.320352352022222122212221===⎭⎬⎫⎩⎨⎧⨯==⎭⎬⎫⎩⎨⎧===F P S S P S S P S S P因为F 是连续型随机变量,而任何连续型随机变量取任一给定值的概率都等于0。
2) 现在我们求事件{}二样本方差两倍第一样本方差不小于第=A 的概率:{}{}5.322221≥=≥=F P S S P p 。
由附表可见,自由度9,721==f f 的F 分布水平α上侧分位数),(21f f F α有如下数值:)9,7(20.45.329.3)9,7(025.005.0F F =<<=。
由此可见,事件A 的概率p 介于0.025与0.05之间;05.0025.0<<p 。
例2.设n X X X ,,, 21是取自正态总体),(2σμN 的一个样本,2s 为样本方差,求满足不等式95.05.122≥⎭⎬⎫⎩⎨⎧≤σS P 的最小n 值。
解 由随机变量2χ分布知,随机变量σ/12S n )(-服从2χ分布,自由度1-=n v ,于是,有{}{}95.0)1(5.1)1(5.1)1(2,05.02222=≤≥-≤=⎭⎬⎫⎩⎨⎧-≤-=v v v P n P n S n P χχχσ 其中2v χ表示自由度1-=n v 的2χ分布随机变量,2,05.0v χ是自由度为1-=n v 的水平05.0=α的2χ分布上侧分位数(见附表)。
我们欲求满足2,05.015.1v n χ≥-)(的最小1+=v n 值,由附表可见226,05.0885.3839)127(5.1χ=>=-, 22505.0652.375.401265.1,)(χ=<=-。
于是,所求27=n 。
例3.假设随机变量X 在区间[]1,+θθ上有均匀分布,其中θ未知:)(1n X X ,, 是来自X 的简单随机样本,X 是样本的均值,{}n X X X ,,min 1)1( =是最小观察值。
证明21ˆ1-=X θ 和 11ˆ12+-=n X )(θ 都是θ的无偏估计量。
解 由X 在[]1,+θθ上均匀分布,知2/)12(+==θEX EX i 。
1) 由θθθθ=-+=-+=-=∑∑==2121212221211ˆ111n i n i i n EX n E , 可见1ˆθ是θ的无偏估计量。
2) 为证明2ˆθ是θ的无偏估计。
我们先求统计量)1(X 的概率分布。
{}⎪⎩⎪⎨⎧>+≤≤-<=≤=。
若,;若;若)(111,,0θθθθθx x x x X P x F其密度为⎩⎨⎧+≤≤=。
其他,若,01,1)(θθx x f由于n X X ,,1独立且与X 同分布,知)1(X 的分布函数为 {}{}{}x X x X P x X P x X P x F n >>-=>-=≤=,,111)1()1(1 )()( {}{}x X P x X P n >>-= 11 []nx F )(11--=;[])1()1()()(1)()(11)1()1(+≤≤-+=-='=--θθθx x n x f x F n x F x f n n于是,有⎰⎰+-+-+==111)1()1()1()(θθθθθdx x x n dx x xf EX n⎰⎰+-+-+++-+-+=111)1)(1()1()1(θθθθθθθθdx x n x d x n n nθθ++=⎪⎭⎫ ⎝⎛+++-=11111n n n n 。
θθ=+-=11ˆ)1(2n EX E , 从而2ˆθ是θ的无偏估计。
在证2ˆθ的无偏估计时,先求估计量分布再求其数学期望。
此外,下面将看到,1ˆθ是矩估计量,)1(X 是最大似然估计量。
3) 有效性的验证,即验证两个无偏估计量哪一个更有效(方差较小),只需 计算它们的方差并加以比较,验证估计量的最小方差超出了本课程的要求。
读者只需了解一些常用的最小方差估计量。
例如,对于正态分布总体),(2σμN ,样本均值X 和修正样本方差2S 相应为μ和2σ的最小方差无偏估计量;事件频率n pˆ是它的概率p 的最小方差无偏估计量。
如果要求有效率,则用公式)ˆ()(0θθD D 计算,其中()2),(ln 1)()ˆ(⎥⎦⎤⎢⎣⎡∂∂=≥θθθθx f nE D D ——称为罗.克拉美不等式。
例4.设总X 服从正态分布),(20σμN ,其中方差20σ为已知常数;关于未知数学期望μ有两个二者必居其一的假设: 1100μμμμ==:,:H H ,其中0μ和1μ都有已知常数,并且10μμ<。
根据来自总体X 的简单随机样本n X X X ,,, 21,确定假设0H 的α水平否定域(即拒绝域),并计算第二类错误概率。
解 取统计量 nX U 0σμ-=做检验的统计量。
在假设00μμ=:H 成立的条件下,),(10~N U 。
由于{}{}{}{}ααααα=≤=-≤=≥=≥-122u U p u U P u U P u U P 。
所以以下四种都是假设0H 的水平α的否定域: {}{}αα221u U V u U V ≥=≥=;; {}{}αα-≤=-≤=1423u U V u U V ;, 其中αu 是标准正态分布α水平双侧分位数(见附表)。
在假设11:μμ=H 成立的条件下,统计量)1,(~∆N U ,其中001/)(σμμ-=∆n 。
因此,以)4,3,2,1(=i V i 为假设否定域的检验的第二类错误概率为:{}{}⎰∆--====iV x i i dx e V P H V P 2)(11221πμμβ。
特别(设)(x Φ是标准正态分布函数)1)()(212122)(122-∆-Φ+∆+Φ===⎰⎰∆-∆---∆--ααμππβαμααu du e dx eu u u u u x ;)(2122)(222∆-Φ==⎰∞-∆--ααπβu dx eu x ; )(2122)(322∆+Φ==⎰∞+-∆--ααπβu dx eu x ;)()(22121112)(2)(41212∆-Φ-∆+Φ-=+=--∞+∆--∞-∆--⎰⎰--ααμππβααu dx edx eu x u x 。
为了便于比较,设91101.0010=====n ;,,,σμμα,则13.0,28.1,65.1,39.02.01.0====∆u u u 。
查附表并经计算,容易得到9988.09999.00427.00855.04321====ββββ,,,。
计算结果表明,尽管四个检验的一类错误的概率都等于1.0=α,但它们的第二类错误的概率却不相同。
以2V 为否定域的检验的第二类错误的概率最小,为我们所选用。
例5.对二项分布),(p n B 作统计假设 3.0:,6.0:10==p H p H 。
假设0H 的否定域取为{}{}21c c V n n ≥≤=μμ ,其中n μ表示n 次试验中成功的次数。
对(1);3,9,1,1021====n c c n μ (2)6,17,7,2021====n c c n μ,求显著性水平α和第二类错误的概率β。
解 (1)显著性水平α是第一类错误的概率,于是 {}{}6.00=∈=∈=p V P H V P n μμα0479.04.06.04.06.0109101011010≈+=∑∑=-=-i i i ii iii C C 。
{}{}111H V P H V P n n ∈-=∈=μμβ {}3.01=∈-=p V P n μ 8506.07.03.07.03.011091010101010≈--=∑∑=-=-i i i ii iiiC C 。
(2){}{}6.00=∈=∈=p V P H V P n n μμα 0370.04.06.04.06.0201720702020≈+=∑∑==-i i i ii iiiC C 。
{}{}3.011=∈-=∈=p V P H V P n n μμβ 2277.07.03.07.03.0120172020702010≈--=∑∑=-=-i i i ii iiiC C 。
例6.谋装置的平均工作温度据制造厂家称不高于190℃。
今从一个由16台装置构成的随机样本册的工作温度的平均值和标准差分别为195℃和8℃。
根据这些数据能否说明平均工作温度比制造厂所说的要高?设05.0=α,并假定工作温度服从正态分布。
解 设工作温度为X ,根据题设),(~2σμN X 。
考虑假设 190,190:10>≤H H μ 由于总体方差2σ未知,故用t 检验。
这里,151,16=-==n v n 对给定的05.0=α,查表得75.15.1,1.0,20==t t v 。
于是由表情形知假设0H 的否定域为{}75.1≥=t V 。
由条件和0H 知8,195,1900===S X μ,因此5.216/8190195=-=t 。
由于75.15.2>=t ,所以否定域假设0H ,说明平均工作温度比制造厂说的要高。
例7 某电话交换台在一小时(60分钟)内每分钟接到电话用户的呼唤次数有如下纪录:问统计资料是否可以说明,每分钟电话呼唤次数服从泊松分布?()05.0=α 解 设X 表示每分钟电话呼唤次数,需要检验的假设 X H :0服从泊松分布。
泊松分布中未知参数λ的最大似然估计为∑===62601ˆk k kv λ。
我们用)6,,1,0(!2ˆ ==-k e k pk k k估计概率{})6,,1,0( ===k k X P p k ;用)4,3,2,1,0(ˆ==k pn E k k 估计{}k X =的期望频数。
为避免期望频数太小,将呼唤次数为5和6的情况,合并为5≥X 的情况,为第6组:其实际频数为2+1=3,期望频数为 16.3)(655=+=p p n E 。
计算结果列入下表:所以统计量1762.0)(5022=-=∑=k kk k E E v χ。
统计量2χ的自由度16--=m v ,其中1=m 是用到参数估计值的个数,故4=v 。
对于, 05.0=α,查表得488.924,05.0=χ;假设0H 的否定域为{}488.92≥=χV 。
由于2χ=0.1762<9.488,所以不否定假设0H ,即可以认为电话呼唤次数服从泊松分布。