应用数理统计作业答案

合集下载

(完整版)《应用数理统计》吴翊_习题解答

(完整版)《应用数理统计》吴翊_习题解答
《应用数理统计》作业题及参考答案(前三章)第一章 数理统计的基本概念P26
1.2设总体X的分布函数为F x,密度函数为f x,X1,X2,⋯,
最大顺序统计量Xn与最小顺序统计量X1的分布函数与密度函数。
解:Fnx P Xix P X1x,X2x,L,Xnx F xn.
n1
fnx Fnx n F x f x.
F1x P Xix 1 P X1x,X2x,L,Xnx.
1
P
X1
x P X2
x L P Xn
x
1
1
P
X1x 1
P X2x
L 1 P Xnx
n
1
1
F
x
n1
f1x
F1
x n 1
F x f
x.
5
5
5
1 P Xi10 1
1 P Xi10
1 1 P X 10
P Xmin10 1 P Xmin10
1 P X110,X210,L,X510
1.4试证:
n
i)xi
i1
xi
2ห้องสมุดไป่ตู้
n x a对任意实数
a成立。并由此证明当
x时,
2xia
i1
i1
达到最小。
ii)
n
xi
i1
2
xi
i1
2nx
其中x
n
xi
i1
证明:
i)
xi
n
xi
i1
xx
xi
i1
i1
当a
ii)
P27
i1
xi
xi
2 xix x a
时,
xi
i1

应用数理统计作业题及参考答案(第三章)

应用数理统计作业题及参考答案(第三章)

第三章 假设检验P1313.2 一种元件,要求其使用寿命不得低于1000(小时)。

现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。

已知该种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。

解:本题需检验0H :0μμ≥,1H :0μμ<.元件寿命服从正态分布,0σ已知,∴当0H成立时,选取统计量X u μ-=,其拒绝域为{}V u u α=<.其中950X =,01000μ=,25n =,0100σ=.则 2.5u ==-.查表得0.05 1.645u =-,得0.05u u <,落在拒绝域中,拒绝0H ,即认为这批元件不合格。

3.3 某厂生产的某种钢索的断裂强度服从正态分布()2N μσ,,其中40σ=(kg / cm 2)。

现从一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(kg / cm 2)。

设总体方差不变,问在0.01α=下能否认为这批钢索质量有显著提高?解:本题需检验0H :0μμ=,1H :0μμ>.钢索的断裂强度服从正态分布,0σ已知,∴当0H成立时,选取统计量u =,其拒绝域为{}1V u u α-=>.其中040σ=,9n =,020X μ-=,0.01α=.则 1.5u ==.查表得10.990.01 2.33u u u u αα-==-=-=,得0.99u u <,未落在拒绝域中,接受0H ,即认为这批钢索质量没有显著提高。

3.5 测定某种溶液中的水分。

它的10个测定值给出0.452%X =,0.035%S =。

设总体为正态分布()2N μσ,,试在水平5%检验假设:(i )0H :0.5%μ>; 1H :0.5%μ<. (ii )0H :0.04%σ≥; 1H :0.04%σ<. 解:(i )总体服从正态分布,0σ未知,当0H成立时,选取统计量t =(){}1V t t n α=<-.查表得()()0.050.9599 1.8331t t =-=-.而()4.114 1.83311t t n α==-<-=-.落在拒绝域中,拒绝0H .(ii )总体服从正态分布,μ未知, 当0H 成立时,选取统计量222nSχσ=,其拒绝域为(){}221V n αχχ=<-.查表得()20.059 3.325χ=.而()()()2222100.035%7.65610.04%n αχχ⨯==>-.未落在拒绝域中,接受0H .3.6 使用A (电学法)与B (混合法)两种方法来研究冰的潜热,样品都是-0.72℃的冰块,下列数据是每克冰从-0.72℃变成0℃水的过程中的吸热量(卡 / 克):方法A :79.98,80.04,80.02,80.04,80.03,80.03,80.04,79.97,80.05,80.03,80.02,80.00,80.02方法B :80.02,79.94,79.97,79.98,79.97,80.03,79.95,79.97假定用每种方法测得的数据都服从正态分布,且它们的方差相等。

应用数理统计作业题及参考答案(第二章)(2)

应用数理统计作业题及参考答案(第二章)(2)

应用数理统计作业题及参考答案(第二章)(2)第二章参数估计(续)P682.13 设总体X 服从几何分布:{}()11k P X k p p -==-,12k = ,,,01p <<,证明样本均值11ni i X X n==∑是()E X 的相合、无偏和有效估计量。

证明:总体X 服从几何分布,∴()1=E Xp,()21-=p D X p.1 ()()1111111=====??==∑∑ nn i i i i E XE X E X n E X nn n p p .∴样本均值11ni i X X n==∑是()E X 的无偏估计量。

2 ()22221111111==--===??=∑∑nn i i i i p p D XD X D X n nn np np . ()()()()1111ln ln 1ln 1ln 1-??=-=+--??;X f X p p p p X p .()111ln 111111fX p X X pppp p--=-=+?--;.()211222ln 111fX p X ppp ?-=-+-;.()()()()211122222ln 111111f X p X X I p E E E p p p p p --=-=--+=+--??????; ()()()()1222221111 111111111??-= +-=+-=+? ?---??pE X ppp p p p p p ()()() ()2221111111-+=+==---p ppp pp p pp .()()()222111111??'???? ???????===--n p pe p D X n I p n nppp .∴样本均值11ni i X X n==∑是()E X 的有效估计量。

3证法一:()21lim lim0→∞→∞-== n n p D X np,01p <<.∴样本均值11ni i X X n==∑是()E X 的相合估计量。

应用数理统计习题答案_西安交大(论文资料)

应用数理统计习题答案_西安交大(论文资料)

应用数理统计答案学号:姓名:班级:目录第一章数理统计的基本概念 (2)第二章参数估计 (14)第三章假设检验 (24)第四章方差分析与正交试验设计 (29)第五章回归分析 (32)第六章统计决策与贝叶斯推断 (35)对应书目:《应用数理统计》施雨著西安交通大学出版社第一章 数理统计的基本概念1.1 解:∵2(,)X N μσ∼ ∴ 2(,)n X N σμ∼∴)(0,1)X N μσ−∼分布∴(1)0.95P X P μ−<=<=又∵ 查表可得0.025 1.96u = ∴ 221.96n σ=1.2 解:(1) ∵ (0.0015)X Exp ∼∴ 每个元件至800个小时没有失效的概率为:8000.001501.2(800)1(800)10.0015x P X P X e dxe −−>==−<=−=∫∴ 6个元件都没失效的概率为: 1.267.2()P e e −−==(2) ∵ (0.0015)X Exp ∼∴ 每个元件至3000个小时失效的概率为:30000.001504.5(3000)0.00151x P X e dxe−−<===−∫∴ 6个元件没失效的概率为: 4.56(1)P e −=−1.4 解:ini n x n x ex x x P ni i 122)(ln 2121)2(),.....,(122=−−Π∑==πσμσ1.5证:∵21122)(na a x n x a x ni ni ii+−=−∑∑==∑∑∑===−+−=+−+−=ni i ni i ni i a x n x x naa x n x x x x 1222211)()(222a) 证:)(11111+=+++=∑n ni i n x x n x )(11)(1111n n n n n x x n x x x n n −++=++=++])()1(1 ))((12)[(11)](11[11)(11212111121211212112n n n i n n n i n i n i ni n n n i n i n in x x n n x x x x n x x n x x n x x n x x n S −+++−−+−−+=−+−−+=−+=++=+=+=+=++∑∑∑∑] )(11))1()((12)([112111212n n n n n n n n n x x n x n x x n x x n x x nS n −++−+−+−−++=++++])(11S [1 ])(1[nS 11212n 212n n n n n x x n n n x x n n n −+++=−+++=++ 1.6证明 (1) ∵22112211221()()()2()()()()()nni ii i nni i i i ni i X X X X X X X X X n X X X n X μμμμμ=====−=−+−=−+−−+−=−+−∑∑∑∑∑(2) ∵2221112221221()22ii i nn ni i i i i ni ni XX X X X nX X nX nX X nX =====−=−+=−+=−∑∑∑∑∑1.10 解: (1).∑∑====ni i n i i x E n x n E X E 11)(1)1()(p np n=⋅=1np mp x D n x n D X D ni in i i )1()(1)1()(121−===∑∑==))(1()(122∑=−=n i i x x n E S E)1(1)])1(1())1(([1)])()(())()(([1])()([1])([12222212212212p mp nn p m p mp n n p m p mp n n x E x D n x E x D n x nE x E n x x E n ni i i n i i n i i −−=+−−+−=+−+=−=−=∑∑∑=== 同理,(2). λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(λnx D n x n D X D ni in i i 1)(1)1()(121===∑∑==λnn x E x D n x E x D n x nE x E n S E ni i i n i i 1)])()(())()(([1])()([1)(2122122−=+−+=−=∑∑==(3). 2)(1)1()(11b a x E n x n E X E ni i n i i +===∑∑==na b x D nx n D X D ni ini i 12)()(1)1()(2121−===∑∑==12)(1)])()(())()(([1])()([1)(22122122a b nn x E x D n x E x D n x nE x E n S E ni i i n i i −⋅−=+−+=−=∑∑==(4). λ===∑∑==ni i n i i x E n x n E X E 11)(1)1()(nx D nx nD X D ni ini i 2121)(1)1()(λ===∑∑==221221221)])()(())()(([1])()([1)(λnn x E x D n x E x D n x nE x E n S E ni i i n i i −=+−+=−=∑∑==(5). μ===∑∑==ni ini i x E nx nE X E 11)(1)1()(nx D nx nD X D ni i ni i 2121)(1)1()(σ===∑∑==221221221)])()(())()(([1])()([1)(σ⋅−=+−+=−=∑∑==nn x E x D n x E x D n x nE x E n S E ni i i n i i1.11 解:由统计量的定义知,1,3,4,5,6,7为统计量,5为顺序统计量 1.17 证:),(~ λαΓX ∵xe x xf λαααλ−−Γ=∴1)()( 令kXY =ke ky k k e ky yf kyky ⋅Γ=⋅Γ=∴−−−−λαααλαααλαλ11)()( )()()(即 ),(~ky Y αΓ1.18 证:),(~ b a X β∵),()1()( 11b a B x xx f b a −−−=∴),(),( ),()1()( 11b a B b k a B b a B x x x X E b a k k +=−=∴∫∞+∞−−−),(),1()( b a B b a B X E +=∴ba a ab a b a b a a a a b a b a a a b b a b a b a +=Γ+Γ++ΓΓ=Γ++Γ+Γ+Γ=ΓΓ+Γ⋅++ΓΓ+Γ=)()()()()()()1()()1()()()()1()()1(),(),2()(2b a B b a B X E +=))(1()1()()()()2()()2(b a b a a a a b b a b a b a ++++=ΓΓ+Γ⋅++ΓΓ+Γ= 22)]([)()( X E X E X D −=∴2))(1())(1()1(b a b a ab ba ab a b a a a +++=+−++++= 1.19 解:∵ (,)X F n m ∼分布2212(1)022()((1))((1)()()()(1)()()n n m n mn m yn m y n mn nP Y y P X X y m myP X y n n n x x dx m mm ++−−+≤=+≤=<−Γ=+ΓΓ∫2222122221122()()()1((1()()11(1)(1)(,)n n m n m n m n m n m f y P Y y y y yy y yy B ++−−−−′=≤Γ=+ΓΓ−−−−=∴ 22(1)(,)n mn n Y X X m mβ=+∼分布1.20 解:∵ ()X t n ∼分布122212()()((2(1n n P Y y P X y P X xdxn ++−≤=≤=≤≤=+112211221212122()()()(1)()1()(1(()()n n n n n f y P Y y y y n y y nn n +++−−+−−′=≤Γ=+Γ=+ΓΓ∴ 2(1,)2nY X F =∼分布1.21 解: (1) ∵ (8,4)X N ∼分布∴ 4(8,)25X N ∼ 分布,即5(8)(0,1)2X N −∼ ∴ 样本均值落在7.88.2∼分钟之间的概率为:5(7.88)5(8)5(8.28)(7.88.2)()2220.383X P X P −−−≤≤=≤≤=(2) 样本均值落在7.58∼分钟之间的概率为:5(7.58)5(8)5(88)(7.58)(2225(8)(0 1.25)20.3944X P X P X P −−−≤≤=≤≤−=≤≤= 若取100个样品,样本均值落在7.58∼分钟之间的概率为:10(7.88)10(8)10(8.28)(7.88.2)(2222*(0.84130.5)0.6826X P X P −−−≤≤=≤≤=−= 单个样品大于11分钟的概率为:110.77340.2266P =−= 25个样品的均值大于9分钟的概率为210.97980.0202P =−= 100个样品的均值大于8.6分钟的概率为310.99870.0013P =−= 所以第一种情况更有可能发生1.23 解:(1) ∵ 2(0,)X N σ∼分布 ∴ 2(0,X N nσ∼分布∴ 22)(1)nXχσ∼∵ 222221()(ni i nXa X an X an σσ===∑∴ 21a n σ=同理 21b m σ=(2) ∵2(0,)X N σ∼分布 ∴222(1)X χσ∼分布由2χ分布是可加性得:2221()ni i X n χσ=∑∼()ninX c X t m ==∑∼ ∴c =(3) 由(2)可知2221()ni i X n χσ=∑∼2221122211(,)nni ii i n mn mi ii n i n X d Xnn dF n m XmXmσσ==++=+=+=∑∑∑∑∼∴ md n=1.25 证明:∵ 211(,)X N μσ∼分布 ∴ 2211((1)i X μχσ−∼∴ 1221111(()n i i X n μχσ=−∑∼同理 2222212(()n i i Y n μχσ=−∑∼ 1122222112211111222221122112()()(,)()()n n i i i i n n i i i i X n n X F n n Y n Y n μσμσμσμσ====−−=−−∑∑∑∑∼ 第二章 参数估计2.1 (1) ∵ ()X Exp λ∼分布∴ ()1E X λ=令 ˆ1X λ= 解得λ的矩估计为: ˆ1X λ= (2) ∵ (,)X U a b ∼分布∴ ()2a bE X +=2()()12b a D X −=令 1ˆˆ2ab A X +==22221ˆˆˆˆ()()1124n i i b a a b A X n =−++==∑ (22211n i i X X S n =−=∑)解得a 和b 的矩估计为:ˆˆaX bX =−=(3) 110()1E X x x dx θθθθ−=∗=+∫令 1ˆˆ1A X θθ==+∴ˆ1XXθ=− (4) 110()(1)!kk x kE X x x e dx k βββ−−=∗=−∫令ˆkX β= ∴ ˆkXβ=(5) 根据密度函数有2221()22()E X a aE X a λλλ=+=++根据矩估计有1222221ˆˆˆ22ˆˆˆa A X a a A S X λλλ+==++==+解得λ和a 的矩估计为:ˆˆaX λ==(6) ∵ (,)X B m p ∼ ∴ ()E X mp =令 1ˆmpA X == 解得p 的矩估计为:ˆXpm= 2.3解:∵ X 服从几何分布,其概率分布为:1()(1)k P X k p p −==−故p 的似然函数为: 1()(1)ni i x nnL p p p =−∑=−对数似然函数为:1ln ()ln ()ln(1)ni i L p n p x n p ==+−−∑令 1ln ()1()01nii L p n x n p p p =∂=−−=∂−∑ ∴ 1ˆpX= 2.4 解:由题知X 应服从离散均匀分布,⎪⎩⎪⎨⎧≤≤==其它01 1)(Nk N k x p2)(NX E =矩估计: 令 7102=∧N1420=∴∧N 极大似然估计:⎪⎩⎪⎨⎧≤≤=其它07101 1)(NN N L ∵要使)(N L 最大,则710=N710=∴∧N 2.5 解:由题中等式知:2196.196.196.1)025.01(025.0)(1S X +=+=∴+=+−Φ=∴=−Φ−∧∧∧−σμθσμμσθσμθ2.6 解:(1) 05.009.214.2=−=R ∵0215.005.04299.05=×==∴∧d Rσ(2)将所有数据分为三组如下所示:1x 2x 3x 4x5x 6x i R1 2.14 2.10 2.15 2.13 2.12 2.13 0.05 2 2.10 2.15 2.12 2.14 2.10 2.13 0.05 32.11 2.14 2.10 2.11 2.15 2.10 0.050197.005.03946.005.0)05.005.005.0(316=×==∴=++=∴∧d R R σ 2.7 解:(1)⎩⎨⎧+<<=其它 01x 1)(θθx f ∵ θθθθθθ≠+==+=++=∴∧21)()(2121)(X E E X E ∴ X =∧θ不是θ的无偏估计,偏差为21=−∧θθ(2) θ=−21(X E ∵ 21−=∴∧X θ是θ的无偏估计(3)22))(()())(()(θθθθ−+=−+=∧∧X E X D E D MSE41121+=n 2.8 证:由例2.24,令2211x a x a +=∧μ,则∧μ 为μ无偏估计应 满足121=+a a因此1μ,2μ,3μ都是μ的无偏估计)()()()(21)()(2513)()(95)9491)(()())(()()(1233212221212∧∧∧∧∧∧=∧<<===+=∴+==∑μμμμμμμD D D X D D X D D X D X D D a a X D X D a D i i i ∵∵2132121X X +=∴∧μ最有效2.9证: )(~λp X ∵ λλ==∴)( )(X D XEX ∵是λ=)(X E 的无偏估计,2*S 是λ=)( X D 的无偏估计)()1()())1((2*2*S E X E S X E αααα−+=−+∴λλααλ=−+=)1(∴2*)1(SX αα−+是λ的无偏估计2.10 解:因为2222((1))()(1)()(1)()1(1)()11(1)1E X S E X E S na E S n n a E S n n n a n nααααλαλαλαλλ∗∗+−=+−=+−−=+−−−=+−=− 所以 2(1)X S αα∗+−是λ的无偏估计量2.15 解:因为ˆθ是θ的有效估计量ˆˆˆ()()()E uE a b aE b a b u θθθ=+=+=+= 221ˆˆˆˆ()()()()D u D a b a D a D θθθ=+=≤ (其中,1ˆθ是θ的任意无偏估计量中的一个)所以 ˆu是u 的有效估计量 2.26 解: 因为总体服从正态分布,所以)01X U N μσ−=∼(,)对于给定的1α−,查标准正态分布表可得2u α,使得2()1P U u αα<=−即:22()1P X p X ααα−<<=−区间的长度2d L α=<,所以 22224u n L ασ>2.28 解:因为总体服从正态分布,所以)01X U N μσ−=∼(,), 222(1)nS V n χσ=−∼由因为U 和V 是相互独立的,所以(1)X T t n =−∼对于给定的1α−,查标t 分布表可得t α,使得 2()1P U t αα<=−,即:22()1P X X ααμα<<+=− 当30n =,35X =,15S =时,第一家航空公司平均晚点时间μ的95%的置信区间为:(29.3032,40.6968)对于给定的1α−,查标t 分布表可得t α,使得 ()1P U t αα>=−, 即:()1P X αμα<+=− 故μ的具有单侧置信上限的单侧置信区间为(,)X α−∞+ 所以经计算可得:第一家航空公司的单侧上限置信区间为(,39.7327)−∞第二种航空公司的单侧上限置信区间为(,36.3103)−∞所以选择第二家航空公司。

应用数理统计-施雨-课后答案-

应用数理统计-施雨-课后答案-

习题11.1 解:由题意95.01=⎭⎬⎫⎩⎨⎧<--u x p 可得:95.0=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧<-σσn n u x p而()1,0~N u x n σ⎪⎭⎫ ⎝⎛-- 这可通过查N(0,1)分布表,975.0)95.01(2195.0=-+=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧<--σσn n u x p 那么96.1=σn∴2296.1σ=n1.2 解:(1)至800小时,没有一个元件失效,则说明所有元件的寿命>800小时。

{}2.10015.08000015.00800|e 0015.0800--∞+-=∞+-==>⎰e e dx x p x x 那么有6个元件,则所求的概率()2.762.1--==e e p(2)至300小时,所有元件失效,则说明所有元件的寿命<3000小时{}5.4300000015.030000015.001|e 0015.03000----=-==<⎰e e dx x p x 那么有6个元件,则所求的概率()65.41--=e p1.3解: (1) 123{(,,)|0,1,2,,1,2,3}k x x x x k χ===因为~()i X P λ,所以 112233{,,}P X x X x X x ≤≤≤112233{}{}{}P X x P X x P X x =≤≤≤1233123!!!x x x e x x x ++-λλ=其中,0,1,2,,1,2,3k x k ==(2) 123{(,,)|0;1,2,3}k x x x x k χ=≥=因为~()i X Exp λ,其概率密度为,0()0,0x e x f x x -λ⎧λ≥=⎨ <⎩所以, 123(,,)3123(,,)x x x f x x x e-λ=λ,其中0;1,2,3k x k ≥=(3) 123{(,,)|;1,2,3}k x x x a x b k χ=≤≤=因为~(,)i X U a b ,其概率密度为1,()0,|a x b f x b a x a x b⎧≤≤⎪=-⎨⎪ <>⎩所以,12331(,,)()f x x x b a =-,其中;1,2,3k a x b k ≤≤= (4) 123{(,,)|;1,2,3}k x x x x k χ=-∞<<+∞= 因为~(,1)i X N μ,其概率密度为(2(),()x f x x 2-μ)-=-∞<<+∞所以,311(2123321(,,)(2)k k x f x x x e π2=--μ)∑=,其中;1,2,3k x k -∞<<+∞=1.4解:由题意可得:()⎪⎩⎪⎨⎧∞<<=--,其它00,21)(i 2ln i i 22i x e x x f u x σσπ则∏==ni x f x x f 1i n i )(),...(=⎪⎪⎩⎪⎪⎨⎧=∞<<∏=∑--=,其它0,...1,0,1n )2()(ln 212n 12i 2i x x e i n i i u x ni σπσ1.5证: 令21()()nii F a Xa ==-∑则'1()2()nii F a Xa ==--∑,''()20F a n => 令'1()2()0ni i F a X a ==--=∑,则可解得11ni i a X X n ===∑由于这是唯一解,又因为''()20F a n =>,因此,当11ni i a X X n ===∑时,()F a 取得最小值1.6证: (1)等式左边11((nnii i i XX X X 22==-μ)=-+-μ)∑∑111(2()()(n n n i i i i i X X X X X X 22====-)+-μ-+-μ)∑∑∑21(()ni i X X n X 2==-)+-μ∑左边=右边,所以得证. (2) 等式左边22111(2nn ni iii i i XX X X X nX 2===-)=-+∑∑∑ 22212nii XnX nX ==-+∑221ni i X nX ==-∑左边=右边,所以得证.1.7证:(1)∑=-=ni i n x n x 11∑+=-++=11111n i i n x n x 那么)(11_1_n n n x x n x -+++=∑∑=+=•+-++ni i n n i i x n n x n x n 111111111 =111111+=+++∑n n i i x n x n =∑=+ni i x n 111=_1+n x ∴原命题得证(2)21221-=-=∑n n i i nx x n s211122111-++=+-+=∑n n i i n x x n s那么⎥⎦⎤⎢⎣⎡-+++-+212)(111n n n x x n s n n =∑=+n i i x n 1211--+21n x n n +212)1(++n x n n --++nn x x n n 12)1(2+22)1(-+n x n n=∑=+n i i x n 1211--+222)1(n x n n +2111++n x n -212)1(1++n x n --++n n x x n n 12)1(2=∑=+n i i x n 1211-(111++n x n +-+n x n n 1)2由(1)可得:111++n x n +-+n x n n 1=-+1n x则上式=∑=+n i i x n 1211-21-+n x =21+n s∴原命题得证1.10解: 因为2222111111,()n n n i i i i i i X X S X X X X n n n =====-=-∑∑∑所以 (1) 二项分布(,)B m p11()()()ni i i E X E X E X mp n ====∑21111(1)()()()n ni i i i mp p D X D X D X n n n ==-===∑∑222211111()(())()()(1)n n i i i i n E S E X X E X E X mp p n n n==-=-=-=-∑∑(2) 泊松分布()P λ()E X =λ, ()D X n λ=, 21()n E S n-=λ(3) 均匀分布(,)U a b()2b a E X +=, 2)()12b a D X n (-=, 221()()12n E S b a n-=-(4) 指数分布()Exp λ 1()E X =λ, 1()D X n 2=λ, 21()n E S n 2-=λ (5) 正态分布2(,)N σμ ()E X =μ, 21()D X n σ=, 221()n E S nσ-=1.11解:(1)是统计量(2)不是统计量,因为u未知 (3)统计量 (4)统计量(5)统计量,顺序统计量 (6)统计量 (7)统计量(8)不是统计量,因为u未知1.14.解: 因为i X 独立同分布,并且~(,i X a Γλ),11ni i X X n ==∑所以1~(,nii Xna =Γλ)∑;令1nii Y X ==∑,则1X Y n =,由求解随机变量函数的概率密度公式可得 1()(),0)nana nx X f x nx e n x na --λλ=>Γ(1.15 解:(1))(m x 的概率密度为: [][])()(1)()!()!1(!)(1)(x f x F x F m n m n x f m n m m ------=又F(x)=2x 且f(x)=2x ,0<x<1则有x x x m n m n x f m n m m 2)1()!()!1(!)(2)1(2)(------=,0<x<1(2) )(1x 与)(n x 的联合概率密度为: [][])()()(1)()()11(!),(011))(1(y f x f y F x F y F n n y x f n n ----=--=y x x y n n n 22))(1(222⋅⋅---=222)()1(4---n x y xy n n 0<x<y<1对于其他x,y ,有0),())(1(=y x f n1.19证:现在要求Y=)X 1/(X m nm n +的概率密度。

应用数理统计第三章习题测验及答案

应用数理统计第三章习题测验及答案

习题三2.设总体的分布密度为:(1),01(;)0,x x f x ααα+<<=⎧⎨⎩其它1(,,)n X X L 为其样本,求参数α的矩估计量1ˆα和极大似然估计量2ˆα .现测得样本观测值为:0.1,0.2,0.9,0.8,0.7,0.7,求参数α的估计值 .解 计算其最大似然估计:()()11111(,)11ln (,)ln(1)ln nnnn i i i i nn ii L x x x x L x x n x αααααααα===⎡⎤=+=+⎣⎦=++∏∏∑K K1121ln (,)ln 01ˆ10.2112ln n n i i n ii d n L x x x d nx ααααα====+=+=--=∑∑K 其矩估计为:()1 3.40.10.20.90.80.70.766X =+++++= 3077.0121ˆ,212)1()1(110121=--==++=++=+=⎰++X XX x dx x EX αααααααα所以:12112ˆˆ,11ln n ii X nX X αα=⎛⎫⎪- ⎪==-+-⎪ ⎪⎝⎭∑, 12ˆˆ0.3077,0.2112αα≈≈.3. 设元件无故障工作时间X 具有指数分布,取1000个元件工作时间的记录数据,经分组后得到它的频数分布为:如果各组中数据都取为组中值,试用最大似然法求参数的点估计. .解 最大似然估计:11(,),ln ln i nx n nx n i L x x e e L n nx λλλλλλλ--====-∏K711120000ˆln 0,,2010001000i i i d n L nx X x v d X λλλ==-=====∑ 1ˆ0.05X λ==.4. 已知某种灯泡寿命服从正态分布,在某星期所生产的该种灯泡中随机抽取10只,测得其寿命(单位:小时)为:1067,919,1196,785,1126,936,918,1156,920,948 设总体参数都未知,试用极大似然法估计这个星期中生产的灯泡能使用1300小时以上的概率.解 设灯泡的寿命为x ,2~(,)x N μσ,极大似然估计为:2211ˆˆ,()ni i x x x n μσ===-∑ 根据样本数据得到:2ˆˆ997.1,17235.81μσ== . 经计算得,这个星期生产的灯泡能使用1300小时的概率为0.0075.5. 为检验某种自来水消毒设备的效果,现从消毒后的水中随机抽取50升,化验每升水中大肠杆 菌的个数(假定一升水中大肠杆菌个数服从Poisson 分布),其化验结果如下:试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率为最大? 解 设x 为每升水中大肠杆菌个数,~()x P λ,Ex λ=,由3题(2)问知,λ的最大似然估计为x ,所以().150/1*42*310*220*117*0ˆ=++++==X L λ所以平均每升氺中大肠杆菌个数为1时,出现上述情况的概率最大 .8. 设1,...,n X X 是来自总体X 的样本,并且EX =μ,DX = 2σ,2,X S 是样本均值和样本方差,试确定常数c ,使22X cS -是2μ的无偏估计量 .解2222222222()E X cS EX cES DX E X c c nσσμσμ-=-=+-=+-=所以1c n =.9. 设1ˆθ,2ˆθ是θ的两个独立的无偏估计量,并且1ˆθ的方差是2ˆθ的方差的两倍 .试确定常数c 1, c 2,使得11ˆc θ+22ˆc θ为θ的线性最小方差无偏估计量 . 解: 设22122,2D D θσθσ==112212121221(()11E c c c c c c c c c c θθμμμμ+=+=+=+==-),,()()222222211221211(2221D c c c c c c θθσσσ+=+=+-g g )()222111121321c c c c +-=-+当1212*33c -=-=,上式达到最小,此时21213c c =-= .10. 设总体X 具有如下密度函数,1,01(,)0,x x f x θθθθ-<<=>⎧⎨⎩,0其它1,...,n X X 是来自于总体X的样本,对可估计函数1()g θθ=,求()g θ的有效估计量ˆ()gθ,并确定R -C 下界 .解 因为似然函数1111L(,),ln ln (1)ln i i nn n n n i i x x x x L n x θθθθθ--====+-∑∏∏K111ln ln ln ln ()0i i i d n L x n x n x g d n n θθθθ⎛⎫⎛⎫=+=---=---= ⎪ ⎪⎝⎭⎝⎭∑∑∑ 所以取统计量1ln i T x n=-∑ 11111101ln ln ln ln i E X x x dx xdx x x x dx θθθθθθ--===-=-⎰⎰⎰得1ET θ==()g θ,所以1ln i T x n=-∑是无偏估计量 令()c n θ= 由定理2.3.2知 T 是有效估计量,由221()1()g DT c n n θθθθ-'===- 所以 C -R 方差下界为21n θ.11. 设1,...,n X X 是来自于总体X 的样本,总体X 的概率分布为:||1||(,)()(1),1,0,1,012x x f x x θθθθ-=-=-≤≤1) 求参数θ的极大似然估计量ˆθ; 2) 试问极大似然估计ˆθ是否是有效估计量?如果是,请求它的方差ˆD θ和信息量()I θ; 3 试问ˆθ是否是相合估计量?(书上没有这个问题) 解 1)()()111(,)1122ln ln (n )ln(1)iii ix x nx n x n i i i L x x L x x θθθθθθθ--=∑⎛⎫⎛⎫∑=-=- ⎪ ⎪⎝⎭⎝⎭=+--∏∑∑Kn 1ln 01(1)n xi xi d n L xi d θθθθθθ-⎛⎫=-=-= ⎪--⎝⎭∑∑∑ 得到θ最大似然估计量1ˆxi nθ=∑ 2)()()110011,10122Exi E xi E xi n n θθθθθ⎛⎫⎛⎫==-++-= ⎪ ⎪⎝⎭⎝⎭∑∑所以11Exi E xi n nθ==∑∑ 所以ˆθ是无偏估计量,()(1)n c θθθ=-,由定理2.3.2得到1ˆxi nθ=∑是θ有效估计量信息量c()1()(1)I n θθθθ==-3)1(1)ˆD 0,(n )c()nθθθθ-==→→∞ 所以,T 也是相合估计量 .12 从一批螺钉中随机地取16枚,测得其长度(单位:cm)为:2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15, 2.12,2.14,2.10,2.13,2.11,2.14,2.11设钉长分布为正态,在如下两种情况下,试求总体均值μ的90%置信区间,1)若已知σ=0.01cm ; 2)若σ未知;解 因为 2.125,16,0.171,X n s ===()0.950.9510.95, 1.65,15 1.7532t αμ===-1) 计算0.950.952.1209, 2.1291X b a X αμμ-===+== 所以 置信区间为[]1.1212.129,2) 计算((0.950.9515 2.1175,15 2.1325X t b X t α-==+== 所以 置信区间为[]2.1152.135,.13 随机地取某种炮弹9发做试验,测得炮口速度的样本标准差s=11(m/s),设炮口速度服从正态分布,求这种炮弹的炮口速度的标准差σ的置信度为95%的置信区间 .解 由题意标准差σ的置信度为0.95的置信区间为0.9750.0252222(1)(1)(,)(8)(8)n S n S χχ-- 计算得0.9750.0252222(1)(1)11,9,0.05,7.431,21.072(8)(8)n S n S S n a b αχχ--=======所以 置信区间为 [7.431,21.072].14. 随机地从A 批导线中抽取4根,并从B 批导线中抽取5根,测得其电阻(Ω)为:A 批导线:0.143,0.142,0.143,0.137B 批导线:0.140,0.142,0.136,0.138,0.140设测试数据分别服从21(,)N μσ和22(,)N μσ,并且它们相互独立,又212,,μμσ均未知,求参数12μμ-的置信度为95%的置信区间 .解 由题意,这是两正太总体,在方差未知且相等条件下,对总体均值差的估计:置信区间为121221(2)X Y tn n S n α--±+- 计算得2626A B 120.14125,0.1392,8.25*10, 5.2*10,4,5,0.05x y S S n n α--======= 26W W 0.9756.5710,0.00255,(7) 2.365,0.0022,0.0063S S t a b -====-=g所以[0.0022,0.0063]-.15. 有两位化验员A 、B ,他们独立地对某种聚合物的含氯量用相同方法各作了10次测定,其测定值的方差2s 依次为0.5419和0.6065,设2A σ与2B σ分别为A 、B 所测量数据的总体的方差(正态总体),求方差比2A σ/2B σ的置信度为95%的置信区间 . 解 由题意,这是两正太总体方差比的区间估计:置信区间为22AA22BB1212(,)1(1,1)(1,1)22S S S S F n n Fn n -----计算得 22A B 120.5419,0.6065,10,0.05S S n n α=====22AA22B B0.9750.0250.2217, 3.6008(9,9)(9,9)S S S S a b F F ====所以置信为 [0.2217,3.6008].。

应用数理统计刘达民课后题答案

应用数理统计刘达民课后题答案

应用数理统计刘达民课后题答案
1.列举几个前沿数理统计机器学习的旧方法:
(1)线性回归:线性回归是机器学习的最常见的方法之一,主要用于分析解释变量对一个目标变量的影响。

(2)Logistic回归:Logistic回归是机器学习的另一个常见方法,它主要用于分类问题,如预测一个目标变量是否属于两个类别之一。

(3)支持向量机:支持向量机(SVM)是一种常见的机器学习算法,也可以用于分类问题,其中使用最大化超平面和核函数来支持它的模型。

(4)贝叶斯网络:贝叶斯网络是另一种类别机器学习算法,用于解决具有依赖性的多类别分类任务。

(5)K均值聚类:K均值聚类是一种常见的聚类算法,用于将数据集的点分组为若干类。

2.试论述对假设检验有效性的因素。

假设检验的有效性取决于研究者正确指定和应用有效的假设检验来解决给定的问题。

其有效性的因素包括样本容量、误差概率、置信度水平和显著程度等。

(1)样本容量:样本容量是指研究者使用的实际观察样本的数量。

如果样本容量越大,假设检验结果的精确度就越高,因此,确保够大的样本容量可以显著提高假设检验的有效性。

(2)误差概率:误差概率指研究者指定的可接受错误率,如果误差概率较低,可以有效控制假设检验结果得出正确的结论,从而提高假设检验的有效性。

(3)置信度水平:置信度水平指研究者指定的置信度百分比,如95%的置信度水平,说明允许发生的作出错的机会只有5%,这样可以有效地增强假设检验的有效性。

(4)显著程度:显著程度指研究者指定的信度限制,例如P<0.05,即接受null hypothese。

提高显著性程度,可以有效提高假设检验的有效性。

应用数理统计课后习题参考答案

应用数理统计课后习题参考答案

习题五1试检验不同日期生产的钢锭的平均重量有无显著差异?(α=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5.假设样本观测值(1,2,3,4)ij y j =来源于正态总体2~(,),1,2,...,5i i Y N i μσ= .检验的问题:01251:,:i H H μμμμ===L 不全相等 .计算结果:表5.1 单因素方差分析表注释: 当=0.001表示非常显著,标记为 ‘***’,类似地,= 0.01,0.05,分别标记为 ‘**’ ,‘*’ .查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异.2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(α=0.05)解根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 .假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2~(,),1,2,...,5i i Y N i μσ= .其中样本容量不等,i n 分别取值为6,5,3,4 .检验的问题:012341:,:i H H μμμμμ===不全相等 .计算结果:表5.2 单因素方差分析表查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05,所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 .3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A ,另试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(α=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用.设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12.假设样本观测值(1,2,3,1,2,3,4)ij yi j ==来源于正态总体2~(,),1,2,3,ij ij Y N i μσ=1,2,3,4j = .记i α⋅为对应于i A 的主效应;记j β⋅为对应于j B 的主效应;检验的问题:(1)10:i H α⋅全部等于零,11:i H α⋅不全等于零;(2)20:j H β⋅全部等于零,21:j H β⋅不全等于零; 计算结果:表5.3 双因素无重复试验的方差分析表查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值,或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用.设每个工人在每台机器上的日产量都服从正态分布且方差相同 .试检验:(α=0.05)1) 操作工之间的差异是否显著? 2) 机器之间的差异是否显著?3) 它们的交互作用是否显著?解 根据问题,这是一个双因素等重复(3次)试验的问题,要考虑交互作用.设因素,A B 分别表示为机器和操作,试验指标为日产量,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ijk y i j ==来源于正态总体2~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j =,1,2,3k = .记i α⋅为对应于i A 的主效应;记j β⋅为对应于j B 的主效应;记ij γ为对应于交互作用A B ⨯的主效应; 检验的问题:(1)10:i H α⋅全部等于零,11:i H α⋅不全等于零; (2)20:j H β⋅全部等于零,21:j H β⋅不全等于零; (3)30:ij H γ全部等于零,31:ij H γ不全等于零;计算结果:表5.4 双因素无重复试验的方差分析表查表0.95(3,24) 3.01F =,0.95(2,24) 3.4F =,0.95(6,24) 2.51F =,计算值 3.01,A F <3.4, 2.51B A B F F ⨯>>,或0.05A p >>,而,B A B p p ⨯均显著小于0.05,所以拒绝2030,H H ,接受10H ,认为操作工之间的差异显著,机器之间的差异不显著,它们之间的交互作用显著 . 5 某轴承厂为了提高轴承圈退火的质量,制定因素水平分级如下表所示因素 上升温度℃ 保温时间(h)出炉温度℃水平1 800 6 400 水平28208500试填好正交试验结果分析表并对试验结果进行直观分析和方差分析 .解 根据题意,这是一个3因素2水平的试验问题 .试验指标为硬度的合格率 .应选择正交表44(2)L 来安排试验,随机生成正交试验表如下:方差来源 自由度 平方和 均方 F 值 P 值 因素A 因素B 相互效应A ×B误差 总和3 2 6 24 352.750 27.167 73.5 41.333 144.750.917 13.583 12.250 1.7220.5323 7.8871 7.11290.6645 0.00233** 0.00192**由此可见第三号试验条件为:上升温度800℃、保温时间6h 、出炉温度500℃ . 直观分析需要计算K 值,计算结果如下:直观分析 由计算的K 值知,因素A 、B 、C 的极差分别为70,40,40,因此主次关系为A B C >=,B ,C 相当 .由于试验指标为硬度的合格率,应该是越大越好,所以各确定因素的水平分别是121,,A B C ,即最佳的水平组合是121A B C ,即最佳搭配为:上升温度800℃、保温时间8h 、出炉温度400℃.采用方差分析法,计算得下表:表5.7 方差分析表方差来源平方和 自由度 均方差 F 值 A 1225 1 1225 1 B 400 1 400 0.33 C 400 1 400 0.33 误差 1225 1 1225 总和32504如果显著性检验水平取0.1α=,则查表得0.9(1,1)39.9F =,显然计算的F 值1,0.33A B C F F F ===均小于查表值,所以认为三个因素对结果影响都显著 .6问应选用哪张正交表安排试验,并写出第8号试验的条件;如果9组试验结果为(单位:kg/100m 2):62.925,57.075,51.6,55.05,58.05,56.55,63.225,50.7,54.45,试对该正交试验结果进行直观分析和方差分析.解 该问题属于3因素3水平的试验问题,试验指标为水稻产量 .根据题意应选择正交表49(3)L 来安排试验,随机生成正交表如下:由表可知,第8号试验的条件:品种(A 3)珍珠矮11号,插值密度(B 2)3.75棵/100m 2,施肥量(C 1)0.75kg/100m 2纯氨; 直观分析需要计算K 值,计算结果如下:同上题进行直观分析,得出K 值的大小关系为:111312212223333132,,K K K K K K K K K >>>>>>由直观分析看出:本例较好的水平搭配是:113A B C 采用方差分析法,计算得下表:表5.10 方差分析表方差来源平方和自由度 均方差F 值A 1.759 2 0.879 0.0223B 65.861 2 32.931 0.8361C 6.660 2 3.330 0.0845 误差78.776 239.388 39.3880.9(2,2)9F =,所以认为三个因素对结果影响都不显著.7 在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比A ,吡啶量B 和反应时间C 三个因素,它们各取了7个水平如下:原料配比A :1.0,1.4,1.8,2.2,2.6,3.0,3.4 吡啶量B :10,13,16,19,22,25,28 反应时间C :0.5,1.0,1.5,2.0,2.5,3.0,3.5试选用合适的均匀设计表安排试验,并写出第7号试验的条件;如果7组试验的结果(收率)为:0.33,0.336,0.294,0.476,0.209,0.451,0.482,试对该均匀试验结果进行直观分析并通过回归分析发现可能更好的工艺条件.解 根据题意选择均匀设计表47(7)U 来安排试验,有3个因素,根据使用表,实验安排如:表5.11 试验安排表6 6 5 4 0.4517 7 7 7 0.482 所以第7号实验的条件为:原配料比3.4,吡啶量28ml,反应时间3.5h.通过直观分析,最好的实验条件是:原配料比3.4,吡啶量28ml,反应时间3.5h. 通过回归分析,最合适的实验条件是:原配料比2.6,吡啶量16ml,反应时间0.5h.习题六1 从某中学高二女生中随机选取8名,测得其升高、体重如下:1 2 3 4 5 6 78身高(cm)160 159 160 157 169 162 165 154体重(kg)49 46 53 41 49 50 48 43在绝对距离下,试用最短距离法和离差平方和法对其进行聚类分析.解由R软件,用最短距离(左)和差离平方和法(右)对题目进行聚类分析如下图6.1,表6.1和表6.2:最短距离法离差平方和法图6.1 聚类树形图表6.1 聚类附表(最短距离法)步骤聚类合并系数首次出现的阶段类别下一步组1 组2 组1 组21 1 6 5.000 0 0 22 1 2 10.000 1 0 43 4 8 13.000 0 0 74 1 7 13.000 2 0 55 1 3 13.000 4 0 66 1 5 17.000 5 0 7表6.2 聚类附表(离差平方和法)2 已知五个变量的距离矩阵为03674012340444401592343331).;2);3)036034022020401000⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭试用最短距离法和最长距离法对这些变量进行聚类,并画出聚类图和二分树.解 针对距离矩阵1),采用两种方法计算如下. ①最短距离法的聚类步骤如下:12345036740159036020w w w w w ⎛⎫ ⎪⎪ ⎪ ⎪⎪⎪⎝⎭a )将()236,1w w f h =合并为一类,,{}11456,,,,H w w w h =距离矩阵如下0743023060⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭{}()457457),,,2b w w h w w f h ==合并为一类,{}2167,,,H w h h =距离矩阵如下:034030⎛⎫ ⎪⎪ ⎪⎝⎭{}()()1681689),,3,3c w h h w h f h f h ===合并为一类,最后,,聚类图和树状图如图6.2:图6.2 聚类图(左)与树状图(右)②最长距离法与最短距离法类似,步骤如下: a )()236,1w w f h =合并为一类,{}11456,,,,H w w w h =距离矩阵如下0746025090⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭ {}(){}4574572167),,,2,,,b w w h w w f h H w h h ===合并为一类,距离矩阵如下:067090⎛⎫⎪⎪ ⎪⎝⎭{}()()1681689),,69c w h h w h f h f h ===合并为一类,最后,,,聚类图和树状图如图6.3:图6.3 聚类图(左)与树状图(右)(2)针对距离矩阵2)012340234034040⎛⎫ ⎪⎪ ⎪ ⎪⎪⎪⎝⎭①最短距离法的聚类步骤如下 a )()216,1w w f h =合并为一类,{}13456,,,,0342043040H w w w h =⎛⎫⎪⎪ ⎪ ⎪⎝⎭距离矩阵如下{}()367367),,,2b w h h w h f h ==合并为一类,{}24567,,,,H w w h h =聚类矩阵如下:043040⎛⎫⎪⎪ ⎪⎝⎭{}(){}()4784789879),,3,,4c w h h w h f h h w h f h ====合并为一类,最后,,聚类图和树状图如图6.4:图6.4 聚类图(左)与树状图(右)②由于本题数据的特殊性,最长距离法与最短距离法结果相同(略). (3)044440333022010⎛⎫ ⎪⎪ ⎪ ⎪⎪⎪⎝⎭最短距离法的聚类步骤如下a ) ()456,1w w f h =合并为一类,{}11236,,,,H w w w h =距离矩阵如下0444033020⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭{}(){}36736724567),,,2,,,,b w h h w h f h H w w h h ===合并为一类,距离矩阵如下:044030⎛⎫⎪⎪ ⎪⎝⎭{}(){}()4784789879),,3,,4c w h h w h f h h w h f h ====合并为一类,最后,,,聚类图和树状图如图6.5:图6.5 聚类图(左)与树状图(右)由于本题数据的特殊性,最长距离法与最短距离法结果相同(略).3 在一项关于作物对土壤营养的反应的研究中,要测定土壤的总磷量和总氮量(占干物质重的百分比),今对10份土样测得数据如下:总氮量(%)0.120.63 1.19 2.30 1.29 0.73 0.52 0.33 0.61 0.470.66在绝对距离下,试用重心法对其进行聚类分析.解由R软件得到重心法聚类分析的结果如图6.6与表6.3:图6.6 聚类树形图表6.3 聚类过程记录表步骤聚类合并系数首次出现的阶段类别下一步组1 组2 组1 组21 1 8 .001 0 0 22 1 10 .002 1 0 43 6 9 .005 0 0 64 15 .010 2 0 75 2 4 .010 0 0 86 67 .027 3 0 77 1 6 .048 4 6 88 1 2 .459 7 5 99 1 3 2.572 8 0 04 1975年Dagnelie收集了11年的气象数据资料如下表变量年序x1x2x3x4其中:x 1—前一年11月12日的降水量;x 2—7月均温;x 3—7月降雨量;x 4—月日辐射,试对这四个气象因子进行主成分分析. 解 由R 软件分析得到如下表6.4,6.5:表6.4 各主成分的重要性:主成分1 主成分2 主成分3 主成分4 标准差 1.6103349 0.9890848 0.53407741 0.37854199 方差贡献率 0.6482947 0.2445722 0.07130967 0.03582351 累积贡献率0.64829470.89286680.964176491.00000000表6.5 因子荷载:主成分1 主成分2 主成分3 主成分4 X1 0.291 0.871 0.332 -0.214 X2 -0.506 0.425 -0.742 -0.111 X3 0.577 0.136 -0.418 0.688 X4-0.5710.2050.4040.685由于前两个主成分对应的累积贡献率已经达到89.287,因此选取主成分的数目为2.5 对某初中12岁的女生进行体检,测量其身高x 1、体重x 2、胸围x 3和坐高x 4,共测得58个样本,并算得1234(,,,)x x x x x ='的样本协方差为19.9410.5023.566.5919.7120.958.637.97 3.937.55S ⎛⎫ ⎪⎪= ⎪ ⎪ ⎪⎝⎭ 试进行样本主成分分析.解 首先计算样本的相关系数矩阵:10.484410.32240.887210.70330.59760.31251⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭设相关系数矩阵的特征值和特征向量分别为d 和v 阵,计算得到0.0546000 0 0.312600= 000.96470 000 2.6681d ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭即四个特征值依次为:2.6681,0.9647,0.3126,0.0546,前两个主成分的累计贡献率为:90.8471%,因此提取主成分为2.四个特征根相应的特征向量为0.06000.70600.5333 0.4620 0.7317 0.17430.34040.5642=0.60570.19320.60400.48060.30690.65870.48460.4870v -⎛⎫ ⎪-⎪ ⎪--- ⎪-⎝⎭ 因此,两个主成分的表达式为:112340.060.73170.60570.3069z x x x x =+-- 212340.7060.17430.19320.6587z x x x x =-+-+6 比较因子分析和主成分分析模型的异同,阐明两者的关系. 解(1)提取公因子的方法主要有主成分法和公因子法.若采取主成分法,则主成分分析和因子分析基本等价,该法从解释变量的变异的角度出发,尽量使变量的方差能被主成分解释;而公因子法主要从解释变量的相关性角度,尽量使变量的相关程度能被公因子解释,当因子分析目的重在确定结构时则用到该法.(2)主成分分析和因子分析都是在多个原始变量中通过他们之间的内部相关性来获得新的变量,达到既减少分析指标个数,又能概括原始指标主要信息的目的.但他们各有其特点:主成分分析是将n 个原始变量提取m 个支配原始变量的公因子,和1个特殊因子,各因子之间可以相关或不相关.(3)统用降维的方法,但差异也很明显:主成分分析把方差划分为不同的正交成分,而因子分析则把方差化分为不同的起因因子;因子分析中的特征值的计算只能从相关系数矩阵出发,且必须把主成分划分为因子.(4)因子分析提取的公因子比主成分分析提取的主成分更具有可解释性.(5)两者分析的实质及重点不同.主成分的数学模型为Y AX =,因子分析的数学模型为X AF ε=+.因而可知主成分分析是实际上是线性变换,无假设检验,而因子分析是统计模型,某些因子模型是可以得到假设检验的;主成分分析主要综合原始数据的信息,而因子分析重在解释原始变量之间的关系.(6)SPSS 数据的实现:两者都通过“analyzedata reduction Factor ···”过程实现,但主成分分析主要使用“descriptires ”,“extraction ”,“stores ”对话框,而因子分析处使用这些外,还可使用“rotaction ”对话框进行因子旋转.7 试对第4题的变量作因子分析,并将结果和上面的结果进行比较. 解 用SPSS 分析,计算结果如下表6.6-6.8:表6.6 反应压缩比情况表 提取方法: 主成分法计算的相关系数矩阵的特征值和方差贡献率:表6.7 方差解释度提取方法: 主成分法表6.8 主成分矩阵8 为研究某一树种的叶片形态,选取50片叶测量其长度x 1(mm )和宽度x 2(mm ),按样本数据求得其平均值和协方差矩阵为:129048134,92,4845x x S ⎛⎫=== ⎪⎝⎭求出相关系数阵R ,并由R 出发作因子分析;解1)求相关系数矩阵:904810.7303,48900.73031S R ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭ 2)用R 软件求R 的特征根及其相应的特征向量,软件输出结果如下:$values[1] 2.99393809 0.07273809 $vectors[,1] [,2] [1,] 0.7071068 -0.7071068 [2,] 0.7071068 0.7071068122.9939,0.0727,λλ∴==12(),()0.7071,0.7071-0.7071,0.7071T Tηη==3) 求载荷矩阵A :1.22350.19071.22350.1907A -⎛⎫= ⎪⎝⎭4)22121.5333, 1.5333,h h == 0.98810.154*0.98810.154A -⎛⎫= ⎪⎝⎭12121,1,0.3043,0.3043u u v v ===-=,222222000011112,0,()0.9074,20i i iii i i i i i A u B v C u v D u v =========-===∑∑∑∑9 1981年,生物学家Grogan 和Wirth 对两种蠓虫Af 和Apf 根据其触角长度x 1和翼长x 2进行了分类,分类的数据资料如下:Af 1 2 3 4 5 6 7 8 x 1 1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 x 2 1.27 1.74 1.64 1.82 1.90 1.70 1.82 1.82 Apf 1 2 3 4 5 6 x 1 1.14 1.18 1.20 1.26 1.28 1.30 x 2 1.78 1.96 1.86 2.00 2.00 1.96 (1)试建立Af 和Apf 的Fisher 判别模型;(2)对样本(1.24,1.80),(1.28,1.84),(1.40,2.04)进行判别分类. 解 (1)建立Fisher 判别模型991122121111(,)(1.42,1.75),(,)(1.23,1.93)99T TT T i i i i i i x x y y μμ======∑∑120.08480.1490.01980.0218,0.1490.39120.02180.039A A ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭12120.0080.0130.0130.0332A A n n ⎛⎫+== ⎪+-⎝⎭∑()120.19,0.18Tμμ-=-,()()121 1.325,1.842T μμ+= 1345.05135.42135.4283.33--⎛⎫= ⎪-⎝⎭∑, 带入Fisher 判别函数 ()12345.05135.42[(,)(1.325,1.84)]0.19,0.18135.4283.33Tx x -⎛⎫-- ⎪-⎝⎭1291.301741.336944.534x x =--(2)把三个样本(1.24,1.80),(1.28,1.84),(1.4,2.04)带入模型,得到结果:三个样本均属于Apf 类.10 在两个玉米品种之间进行判别:137玉米G 1和甜玉米G 2,选取的两个变量是:x 1—玉米果穗长;x 2—玉米果穗直径,两个类的样本容量为n 1=n 2=40,实际算得两个类的样本均值和样本协方差为:121218.5625.348.120 4.4589.661 3.720,,,5.98 4.12 4.458 4.350 3.720 3.410x x S S ⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭试建立G 1,G 2的Bayes 类线性判别函数.解 因为已知两类的样本均值和样本协方差为:12(18.56,5.98),(25.34,4.12)T T x x ==,128.120 4.4589.661 3.720,4.458 4.350 3.720 3.410S S ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭可计算得到修正的公共协方差矩阵和逆矩阵12120.2280.1450.1450.0992A A n n ⎛⎫+== ⎪+-⎝⎭∑,15.6393.738.25147.38--⎛⎫= ⎪-⎝⎭∑()()()121216.78,1.86,21.95,5.052TTμμμμ-=-+= 带入Fisher 判别函数()112121(())()2T W x x μμμμ-=-+-∑ ()()12 5.6393.73[(,)21.95,5.05] 6.78,1.868.25147.38Tx x -⎛⎫=-- ⎪-⎝⎭1274.396.951141.29x x =-+-。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用数理统计课后答案
第一章
3.解:
概率论基础
10 6 26 ( 1)P{2 X 10} P{ X 10} P{ X 2} ( ) ( ) 5 5 2 (0.8) 1 0.5672
P{ X 5} 1 P{ X 5} 1 - ( 56 ) (0.2) 0.5 7 9 3 5
解得 , 2 的极大似然估计值:
1 n ˆ xi x n i 1 1 n 2 ˆ 2 ( xi x) 2 sn n i 1
6 / 31
应用数理统计课后答案
则 , 2 的极大似然估计量:
1 n ˆ Xi X n i 1 1 n 2 ˆ 2 ( X i X )2 Sn n i 1
1 1 0.48 . F0.1 (7, 18 ) 2.08
F0.99 (7,10 )
1 1 0.15 . F0.01 (10 ,7) 6.62 1 1 0.34 . F0.05 (10 ,10 ) 2.98
F0.95 (10 ,10 )
3 / 31
应用数理统计课后答案
i 1
n 1

E{c ( X i 1 X i ) 2 } 2
i 1
n 1 i 1 n 1 i 1 n 1 i 1
n 1
即:E{c ( X i 1 X i ) 2 } c E ( X i 1 X i ) 2 c [ E ( X i21 ) E ( X i2 ) 2 E ( X i 1 ) E ( X i )] c [ 2 2 2 2 2 2 ] 2c(n 1) 2 2
( x ) }.
2 i 1 i
n
对数似然函数:
n n 1 ln L( , ) ln( 2 ) ln( 2 ) 2 2 2 2
2
(x )
i 1 i
n
2
对 , 2 求导并令其为零,即得对数似然方程组:
ln L 1 n 2 [ xi n ] 0 i 1 n ln L n 1 ( xi ) 2 0 2 2 2 2 2 2( ) i 1
f ( x; , ) 1 ( x )2 exp{ } 2 2 2
设 X 1 , X 2 , , X n . 为抽自总体 X 的样本, x1 , x 2 , , xn . 是样本的一个观测值,则似 然函数:
n
L( , )
2 i 1
( xi ) 2 1 1 1 exp{ } exp{ 2 n 2 2 2 2 (2 2 ) 2
1 x 1,
其他.
E( X )
1 xdx . 1 2
ˆ X. 令 E( X ) X 解得 的矩估计为:
极大似然估计: 设 X 1 , X 2 , , X n . 为抽自总体 X 的样本, x1 , x 2 , , xn . 是样本的一个观测值,则似 然函数:
i 1
n
对 求导并令其为零,即得对数似然方程:
d ln L( ) n n xi 0. d i 1
ˆ 1. 解得 的极大似然估计值: x
ˆ 1 . 则 的极大似然估计量: X
1 , (5) f ( x; ) 2 0,
矩估计:
1
(2) P{ X d } 0.5 1 P{ X d } 0.5 P{ X d } 0.5 d 6 ) 0.5 d 6 5 即d至多为 6. (
5.解:∵ X ~ E ( ) ∴
e x, f ( x) 0,
x 0, x 0.
综上所述:
y b 1 e a , FY ( y ) 0,
y b, y b.
FY ( y ) P{Y y} P{X 2 y}
当y 0时, FY ( y ) 0. 当y 0时, FY ( y ) P{ y x
2 sn
由(1)的可知:
1.2 1.006 P{x 1.2} 1 P{x 1.2} 1 ( ) 1 (1.59) 1 0.94408 0.05592 0.122 所以该星期生产的灯泡能使用 1.2kh 以上的概率为 0.05592.
6.解: c ( X i 1 X i ) 2是 2的无偏估计
第三章 参数估计
1.解:
( 1) x , (1) f ( x; ) 0,
矩估计:
0 x 1, 其他.
其中 1为未知参数.
E ( X ) x( 1) x dx
0
1
1 2
2 X 1 1 X
ˆ 令 E( X ) X 解得 的矩估计为:
1 e x, F (x) 0,
x 0, x 0.
(1) FY ( y) P{Y y} P{aX b y} P{ X
y b y b }(a 0) F ( ) a a
y b y b 当 0,即y b时,FY ( y ) 1 e a . a 当 y b 0,即y b时,F ( y ) 0. Y a
y } P{x
y } P{x y } P{x
y } F ( y ) 1 e
y
综上所述:
1 e y, FY ( y ) 0,
y 0, y 0.
1 / 31
应用数理统计课后答案
14.证明:
Cov( , ) Cov(aX b, cY d ) acCov( X , Y ) D( ) D(aX b) a 2 D( X )同理:D( ) c 2 D(Y )
i
ˆ 则 的极大似然估计量:
n
ln X
i 1
n
1.
i
e x , (3) f ( x; ) 0,
矩估计:
1 E ( X ) x e x dx . 0
x 0, x 0.

4 / 31
应用数理统计课后答案
ˆ 1 . 令 E( X ) X 解得 的矩估计为: X 极大似然估计:
极大似然估计:
设 X 1 , X 2 , , X n . 为抽自总体 X 的样本, x1 , x 2 , , xn . 是样本的一个观测值,则似 然函数:
L( ) ( 1)xi ( 1) n xi .
i 1 i 1
n
n
(0 xi 1, i 1,2, n)
2 0 .1 (15) 22.307.
2 0 ( z0.995 199 ) 2 66.4 7 . 9 .995 (100)
1 2
(3) (4)
: t0.9 (10 ) 1.3722 , : F0.9 (18,7)
t0,99 (6) 3.1 4 2,7
t0.95 (60 ) z0.95 0.5 1 9 .9
设 X 1 , X 2 , , X n . 为抽自总体 X 的样本, x1 , x 2 , , xn . 是样本的一个观测值,则似 然函数:
n
L( ) e xi n e
i 1
n

xi
i 1
.
( xi 0, i 1,2, n)
对数似然函数:
ln L( ) n ln xi .
对数似然函数:
ln L( ) n ln( 1) ln xi .
i 1
n
对 求导并令其为零,即得对数似然方程:
n d ln L( ) n ln xi 0. d 1 i 1
ˆ 解得 的极大似然估计值:
n
ln x
i 1
n
1.
n 1 1 L( ) n . 2 1,2, n)
由于似然函数是与 无关常数,所以不能通过求解似然方程来求解。下面构造顺 序统计量:
1 x(1) x( 2 ) x( n ) 1.
5 / 31
x (, 3), x [3, - 2.6), x [2.6, - 1), x [-1, 0.5), x [0.5, 1), x [1, 2.2), x [2.2, 2.5), x [2.5, 3), x [3, )
2 / 31
应用数理统计课后答案
16.解: (1) : z0.9 1.28 ,
z0.975 1.96 ,
z0.995 2.58 . z0.005 2.58 .
z0.999 3.10
(2)
2 : 0 .025 (8) 17.535, 2 0 , .95 (18) 9.391
z 0.1 1.28
ˆ Sn 由极大似然估计的不变性可知:
则 P( X t ) ( (2)
t

) (
ˆ t tX ) ( ). ˆ Sn
x1
1.07
x1
0.95
x1
1.20
x1
0.80
x1
1.13
x1
0.98
x1
0.90
x1
1.16
x1
0.92
x1
0.95
x
1 10 1.07 0.95 1.20 0.92 0.95 xi 1.006 10 i 1 10 1 10 ( xi x) 2 0.014884 sn 0.122 10 i 1
2 2 i 1
10
相关文档
最新文档