2012-2013年第一学期工科研究生数理统计课课外作业(1)

合集下载

应用数理统计作业题及参考答案(第一章)

应用数理统计作业题及参考答案(第一章)

应⽤数理统计作业题及参考答案(第⼀章)第⼀章数理统计的基本概念P261.2 设总体X 的分布函数为()F x ,密度函数为()f x ,1X ,2X ,…,n X 为X 的⼦样,求最⼤顺序统计量()n X 与最⼩顺序统计量()1X 的分布函数与密度函数。

解:(){}{}()12nn i n F x P X x P X x X x X x F x =≤=≤≤≤= ,,,.()()()()1n n n f x F x n F x f x -'=??=.(){}{}1121i n F x P X x P X x X x X x =≤=->>> ,,,. {}{}{}121n P X x P X x P X x =->>>{}{}{}121111n P X x P X x P X x =-?-≤??-≤??-≤()11nF x =-?-()()()()1111n f x F x n F x f x -'=??=?-.1.3 设总体X 服从正态分布()124N ,,今抽取容量为5的⼦样1X ,2X ,…,5X ,试问:(i )⼦样的平均值X ⼤于13的概率为多少?(ii )⼦样的极⼩值(最⼩顺序统计量)⼩于10的概率为多少?(iii )⼦样的极⼤值(最⼤顺序统计量)⼤于15的概率为多少?解:()~124X N ,,5n =,4~125X N ??∴ ??,. (i ){}{}()13113111 1.1210.86860.1314P X P X P φφ>=-≤=-=-=-=-=. (ii )令{}min 12345min X X X X X X =,,,,,{}max 12345max X X X X X X =,,,,.{}{}{}min min 125101*********P X P X P X X X <=->=->>> ,,,{}{}{}5551111011101110i i i i P X P X P X ===->=-?-()12~012X Y N -=,, {}{}121012*********X X P X P P P Y ---∴<=<=<-=<-{}()111110.84130.1587P Y φ=-<=-=-=.{}[]5min 10110.158710.42150.5785P X ∴<=--≈-=.(iii ){}{}{}{}{}55max max 1251151151151515115115i i P X P X P X X X P X P X =>=-<=-<<<=-<=-? {}5max 1510.9331910.70770.2923P X ∴>=-≈-=.1.4 试证:(i )()()()22211nni i i i x a x x n x a ==-=-+-∑∑对任意实数a 成⽴。

数理统计课外作业

数理统计课外作业

研究生“数理统计”课程课外作业中国地区生产总值与就业人口的一元非线性回归分析摘要:随着中国经济体制的改革,就业问题日益突出,促进就业特别是解决东西部就业差异的问题已经成为中国政府宏观调控的首要目标。

实现全国各地区生产总值与就业协调增长是现阶段中国面临的严峻挑战。

因为实现全国各地区生产总值与就业稳步协调增长是实现东西部共同发展,社会长期稳定,人民共同富裕,构建社会主义和谐社会的先决条件。

本文基于中国各地区生产总值存在明显差异与就业形势严峻的背景,收集2010年全国各地区生产总值与各地区就业人口的统计数据,结合一元非线性回归的方法,利用SPSS和Excel软件,建立了回归分析模型,并进行了显著性检验及相关分析,为政府制定相关政策提供参考依据。

关键词:地区生产总值;地区就业人口;回归分析1 问题提出,问题分析2008年爆发的金融危机给全球经济带来了巨大损失,中国的经济损失也是相当惨重。

当时温家宝总理提出政府最担心的两件事情:一是农民工返乡,二是大学生找工作。

直到今天,就业问题仍然是社会的热点话题。

很明显,就业问题无论对于过去,还是对于现在和未来的长期时间,都是一个非常敏感而值得重视的话题。

促进就业特别是解决东西部就业差异的问题已经成为中国政府宏观调控的首要目标。

随着中国经济体制的改革,就业问题日益突出,实现全国各地区生产总值与就业协调增长是现阶段中国面临的严峻挑战。

因为实现全国各地区生产总值与就业稳步协调增长是实现东西部共同发展,社会长期稳定,人民共同富裕,构建社会主义和谐社会的先决条件。

回归分析是用来近似地表达变量平均变化的一种统计分析方法,是处理多个变量之间相关关系的一种有力的数学工具。

本文基于中国各地区生产总值存在明显差异与就业形势严峻的背景,收集2010年全国各地区生产总值与各地区就业人口的统计数据,结合一元非线性回归的方法,利用SPSS 和Excel软件,建立了回归分析模型,并进行了显著性检验及相关分析,为政府制定相关政策提供参考依据。

应用数理统计课外作业设计

应用数理统计课外作业设计

学号 20110813121 姓名卢丽丽学院资环学院专业安全技术及工程成绩实验数据处理中一元线性回归的应用摘要:我们处理实验数据时数理统计方法往往能帮助我们很好的处理,并且能得到很好的结果,回归分析主要是从大量反映某些变量间关系的观测值出发,分析变量问相关程度及相关关系,并建立回归模型去拟合变量间的关系,从而达到对变量之间关系的认识的方法。

其中一元线性回归模型在很多实验中能很好的帮我们预测未来数据和预测数据范围。

本文运用一元线性回归模型对试验中电流与时间的关系进行了分析,发现,试验中电流随时间逐渐减小,并呈线性递减关系。

通过求得的模型,我们进行了预测。

一、问题提出,问题分析在现代社会,随着科技的发展,人们生活水平提高,可是污染也越来愈严重,特别是重金属的污染,同时治理污染的方法也在改善。

重金属污染修复技术也得到发展,我们在做重金属的电动修复实验过程中,对其修复区的电流进行了观测,有观测值我们作出散点图,发现电流与时间有明显线性关系,我们用一元线性回归的方法分析这组数据,并预测未来电流的变化,以更好的掌握实验条件,为实验数据提供合理的解释。

二、数据描述下面是随着时间电流的变化数据,表中时间是指通电时间。

表1 电流随时间变化表根据数据,我们利用Excel作出散点图,如图1图1 电流随时间变化的散点图由图中点的趋势我们可以看出,电流随时间基本呈线性关系,我们求出其相关系数如下表:表2 电流与时间相关系数表三、模型建立(1)提出假设条件,明确概念,引进参数根据上面分析,我们知道,电流随时间基本呈线性关系,我们假设电流与时间是线性的,我们用一元线性回归模型进行拟合,并用F 检验法和t 检验法进行模型检验,各函数符号代表含义如下:x :电流; y :实验时间i x :各点电流值 i y :各点实验时间α:显著性水平,设α=0.05 (2)模型构建我们假定这组数据满足一元线性回归模型: 一元线性模型:⎩⎨⎧++=),0(~210σεεββN x y (3)模型求解先用最小二乘估计方法求出模型如下: 计算基本数据,如下表:表3 基本数据表6010600==x 49.49109.494==y 4.1002549.4960106.1966810101-=⨯⨯-=⋅-=∑=y x y x l i i i xy1188060104788010221012=⨯-=-=∑=x x l i i xx189.888149.491079.3337310221012=⨯-=-=∑=y y l i i yy8439.0118804.10025ˆ1-=-==xxxy l l β124.100ˆˆ10=-=x y ββ 6425.420ˆ21222=-=-=xx yy R T E l l S S S β 2512.786425.4202ˆ2==-=n S E σ回归直线为:x x y 8439.0124.100ˆˆˆ10-=+=ββ 该方程说明,在刚开始实验时,加的电流为100.124mA 。

重庆大学研究生数理统计大作业

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析摘要篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。

本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。

正文一、问题描述随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。

本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。

篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。

倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。

因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。

二、数据描述抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:以上数据由腾讯篮球中心提供,特此说明。

三、模型建立(1)假设条件假定球员每场的发挥均为独立同分布事件, (2)模型构建以上场时间为自变量Xi ,单场得分为应变量Yi ,建立正态线性模型式:()012,1,2,,;0,,,,,i i i ii i i Y x i n N ββεεσεεε=++=⎧⎪⎨⎪⎩且相互独立 其中β0、β1为模型参数。

研究生课程数理统计习题及答案

研究生课程数理统计习题及答案

研究生课程数理统计习题及答案数理统计习题答案第一章1.解: ()()()()()()()12252112222219294103105106100511100519210094100103100105100106100534n i i n i i i i X x n S x x x n ===++++====-=-⎡⎤=-+-+-+-+-⎣⎦=∑∑∑2. 解:子样平均数 *11li i i X m x n ==∑()118340610262604=⨯+⨯+⨯+⨯=子样方差 ()22*11l i i i S m x x n ==-∑()()()()222218144034106422646018.67⎡⎤=⨯-+⨯-+⨯-+⨯-⎣⎦=子样标准差4.32S =3. 解:因为i i x ay c-=所以 i i x a cy =+11ni i x x n ==∑()1111ni i ni i a cy n na cy n ===+⎛⎫=+ ⎪⎝⎭∑∑1nii c a y n a c y==+=+∑ 所以 x a cy =+ 成立()2211nxi i s x x n ==-∑()()()22122111ni i ini i nii a cy a c y n cy c yn c y y n====+--=-=-∑∑∑因为 ()2211n y i i s y yn ==-∑ 所以222x ys c s = 成立()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--====4. 解:变换 2000i i y x =-11n i i y y n ==∑()61303103042420909185203109240.444=--++++-++= ()2211n y i i s y y n ==-∑()()()()()()()()()222222222161240.444303240.4441030240.4449424240.44420240.444909240.444185240.44420240.444310240.444197032.247=--+--+-+⎡⎣-+-+-+⎤--+-+-⎦=利用3题的结果可知2220002240.444197032.247x y x y s s =+===5. 解:变换 ()10080i i y x =-13111113n i i i i y y y n ====∑∑ []12424334353202132.00=-++++++-+++++=()2211n y i i s y y n ==-∑()()()()()()22222212 2.0032 2.005 2.0034 2.001333 2.003 2.005.3077=--+⨯-+-+⨯-⎡⎣⎤+⨯-+--⎦=利用3题的结果可知2248080.021005.30771010000yx yx s s -=+===⨯ 6. 解:变换()1027i i y x =-11li i i y m y n ==∑()13529312434101.5=-⨯-⨯+⨯+=-2710yx =+= ()2211lyi i i s m y y n ==-∑()()()()22221235 1.539 1.5412 1.534 1.510440.25⎤=⨯-++⨯-++⨯+++⎡⎣⎦= 221 4.4025100x y s s ==170 170174178*11li i i x m x n ==∑()1156101601416426172121682817681802100166=⨯+⨯+⨯+⨯+⨯+⨯+⨯=()22*11l i i i s m x x n ==-∑()()()()()()()2222222110156166141601662616416628168166100121721668176166218016633.44=⨯-+⨯-+⨯-+⨯-⎡⎣⎤+⨯-+⨯-+⨯-⎦= 8解:将子样值从头排列(由小到大)-4,,,,,0,0,,,,,,()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--====9解: 121211121211n n i ji j n x n x n n x n n ==+=+∑∑112212n x n xn n +=+()12221121n n ii s x x n n +==-+∑()200.1460.3670.75790.9910110x x F x x x x ⎧⎪≤<⎪⎪≤<=⎨≤<⎪⎪≤<⎪≥⎩15415816216617017417812. 解: ()ix P λ i Ex λ= i Dx λ= 1,2,,i n =⋅⋅⋅1122111111n n i i i i nni i i i n E X E x Ex n n n n DX Dx Dx n n n nλλλλ============∑∑∑∑13.解:(),i x U a b 2i a bEx += ()212i b a Dx -= 1,2,,i n =⋅⋅⋅ 在此题中()1,1ix U - 0i Ex = 13i Dx = 1,2,,i n =⋅⋅⋅112111101113n ni i i i n n i i i i E X E x Ex n n DX D x Dx n n n==========∑∑∑∑14.解:因为 ()2,iX N μσ 0i X Eμσ-= 1i X Dμσ-=所以()0,1i X N μσ- 1,2,,i n =⋅⋅⋅由2χ散布概念可知()222111nni ii i X Y Xμμσσ==-⎛⎫=-= ⎪⎝⎭∑∑服从2χ散布所以 ()2Yn χ15. 解:因为 ()0,1i X N 1,2,,i n =⋅⋅⋅ ()1230,3X X X N ++0E=1=所以()0,1N()221χ同理() 221χ由于2χ散布的可加性,故()222123Yχ=+可知13C=16. 解:(1)因为()20,iX N σ1,2,,i n=⋅⋅⋅()0,1iXNσ所以()22121niiX Ynχσσ=⎛⎫=⎪⎝⎭∑(){}11122YY yF y P Y y Pσσ⎧⎫=≤=≤⎨⎬⎩⎭()22yf x dxσχ=⎰()()211'221Y Yyf y F y fχσσ⎛⎫==⨯⎪⎝⎭因为()212222200nxnxe xnf xxχ--⎧⎪>⎪⎛⎫=⎨Γ⎪⎪⎝⎭⎪≥⎩所以()2112222200nynnYye ynf yyσσ--⎧⎪>⎪⎛⎫=⎨Γ⎪⎪⎝⎭⎪≤⎩(2)因为()20,iX N σ1,2,,i n=⋅⋅⋅()0,1iXNσ所以()22221niiX nYnχσσ=⎛⎫=⎪⎝⎭∑(){}()22222220nyY nY ny F y P Y y P f x dx σχσσ⎧⎫=≤=≤=⎨⎬⎩⎭⎰()()222'22Y Y ny n f y F y f χσσ⎛⎫==⎪⎝⎭ 故 ()221222202200n nny n n Y n y e y n f y y σσ--⎧⎪>⎪⎛⎫=⎨Γ ⎪⎪⎝⎭⎪≤⎩(3)因为 ()20,i X N σ 1,2,,i n =⋅⋅⋅()10,1ni N =所以()22311n i Y n χσ=⎛= ⎝(){}()()22333210yn Y Y F y P Y y P y f x dx n σχσ⎧⎫=≤=≤=⎨⎬⎩⎭⎰()()()233'2211Y Y y f y F y f n n χσσ⎛⎫== ⎪⎝⎭()()221000x x f x x χ-⎧>=≤⎩故 ()232000y n Y y f y y σ-⎧>=≤⎩(4)因为 ()20,iX N σ 1,2,,i n =⋅⋅⋅所以()()1224210,11ni ni N Y χσ==⎛= ⎝(){}()()()()()224224442210'2211yY Y Y y F y P Y y P f x dxy f y F y f σχχχσσσσ⎧⎫=≤=≤=⎨⎬⎩⎭⎛⎫== ⎪⎝⎭⎰故 ()242000y Y y f y y σ-⎧>=≤⎩17.解:因为 ()X t n存在彼此独立的U ,V()0,1UN ()2Vn χ使X =()221Uχ则 221U X V n=由概念可知()21,F n χ18解:因为 ()20,i X N σ 1,2,,i n =⋅⋅⋅()10,1ni N =()221n mi i n X m χσ+=+⎛⎫⎪⎝⎭∑所以()1nniX Y t m ==(2)因为()0,1iX N σ1,2,,i n m =⋅⋅⋅+()()221221ni i n mi i n X n X m χσχσ=+=+⎛⎫ ⎪⎝⎭⎛⎫ ⎪⎝⎭∑∑所以 ()221122211,ni n i ii n m n m i ii n i n X m X n Y F n m X n X mσσ==++=+=+⎛⎫⎪⎝⎭==⎛⎫ ⎪⎝⎭∑∑∑∑19.解:用公式计算()20.010.019090χ=查表得 0.01 2.33U = 代入上式计算可得 ()20.01909031.26121.26χ=+=20.解:因为 ()2X n χ 2E n χ= 22D n χ=由2χ散布的性质3可知()0,1N{}P X c P ≤=≤22lim t n P dt -→∞-∞≤==Φ 故 {}P X c ≤≈Φ第 二 章1.,0()0,0()()1()111x x x x xe xf x x E x f x xdx xe dxxe e d x e xλλλλλλλλλλλλ-+∞+∞--∞+∞+∞--+∞-⎧≥=⎨<⎩=⋅==-+=-==⎰⎰⎰令从而有 1x λ∧=2.()111121).()(1)(1)1111k k x x E x k p p p k p ppp ∞∞--===-=-==⎡⎤--⎣⎦∑∑令1p =X所以有1p X∧=2).其似然函数为1`11()(1)(1)ni x i i nX nn i L P P p p p -=-=∑=-=-∏1ln ()ln ()ln(1)n i i L P n p X n p ==+--∑1ln 1()01ni i d L n X n dp p p ==--=-∑解之得11nii np XX∧===∑3. 解:因为整体X服从U(a ,b )所以()2122!2!!()12ni i a b n E X r n r X X X X a b S X b X =∧∧+=--⎧=⎪⎪⎨-⎪=⎪⎩⎧=-⎪⎨⎪=+⎩∑222(a-b )() D (X )=12令E (X )= D (X )=S ,1S =n a+b2()a4. 解:(1)设12,,n x x x 为样本观察值则似然函数为:111()(),01,1,2,,ln ()ln ln ln ln 0n ni i i nii inii L x x i nL n x d L nxd θθθθθθθθ-====<<==+=+=∏∑∑(-1)解之得:11ln ln nii nii nxnxθθ=∧==-==∑∑(2)母体X 的期望1()()1E x xf x dx x dx θθθθ+∞-∞===+⎰⎰而样本均值为:11()1nii X x n E x X X Xθ=∧===-∑令得5.。

数理统计教程课后重要答案习题

数理统计教程课后重要答案习题

第一章:统计量及其分布19.设母体ξ服从正态分布N(),,2σμξ和2n S 分别为子样均值和子样方差,又设()21,~σμξN n +且与n ξξξ,,,21 独立, 试求统计量111+--+n n S nn ξξ的抽样分布. 解: 因为ξξ-+1n 服从⎪⎭⎫⎝⎛+21,0σn n N 分布. 所以()1,0~121N nn n σξξ+-+ 而()1~222-n nS nχσ且2n S 与ξξ-+1n 独立,, 所以()1~1111--÷+--+n t S n n n n S nnn σξξ分布. 即111+--+n n S nn εε服从()1-n t 分布. 20.(),,,1,,n i i i =ηξ是取自二元正态分布N()ρσσμμ222121,,,的子样,设()∑∑∑===-===n i i i ni n i i n S n n 12111,1,1ξξηηξξξ2,()2121∑=-=n i i n S ηηη和 ()()()()∑∑∑===----=ni i ni ii ni ir 12211ηηξξηηξξ试求统计量()122221--+---n S rS S S ηξηξμμηξ的分布.解: 由于().21μμηξ-=-E ()()=-+=-ηξηξηξ,c o v 2D D D nn nn2122212σσρσσ-+.所以()()n 212221212σρσσσμμηξ-+---服从()1,0N 分布 .()()()()()()()[]211212121222122ηξηξηηξξηηξξ---=----+-=-+∑∑∑∑====i ini i i ni i ni i ni S rS S S ni i ηξ-是正态变量,类似于一维正态变量的情况,可证ηξηξS rS S S 222-+与ηξ-相互独立.()()1~22221222122--+-+n S rS S S n χσρσσσηξηξ, 所以 统计量()122221--+---n S rS S S ηξηξμμηξ()()()()1)2(222122212221222121--+-+-+---=n S rS S S n nσρσσσσρσσσμμηξηξηξ服从()1-n t 分布.第二章:估计量1. 设n ξξ,,1 是来自二点分布的一个子样,试求成功概率p 的矩法估计量.解: p E =ξ ξ=∴pˆ 3. 对容量为n 的子样,求密度函数()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计3. 对容量为n 的子样,求密度函数 ()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计量. 解: ()322adx x a ax E a=-=⎰ξ 令ξ=3a 得ξ3ˆ=a . 4. 在密度函数 ()()10,1<<+=x x a x f a中参数a 的极大似然估计量是什么? 矩法估计量是什么? 解: (1) ()()()∏∏==+=+=ni i ni nni x x L 111ααααα ()i i x ∀<<1∴()().ln 1ln ln 1⎪⎪⎭⎫⎝⎛⋅++=∏=n i i x n L ααα令()0ln 1ln 1=++=∂∂∑=i ni x nL ααα, 得 ∑=--=ni iL xn1ln 1ˆα。

研究生数理统计问答题答案2013(最新整理)

研究生数理统计问答题答案2013(最新整理)

1.检验的显著性水平:在假设检验中,若小概率事件的概率不超过α,则称α为检验水平或显著性水平。

检验的P 值:拒绝原假设的最小显著水平称为假设检验中的P 值。

2.参数估计的类型:① 点估计;② 区间估计;参数的点估计的方法:① 矩估计法 基本思想:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。

因此,只要总体X 的k 阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。

② 极大似然估计法 基本思想:设总体分布的函数形式已知,但有未知参数θ,θ可以取很多值,有θ的一切可能取值中选一个使样本观察值出现的概率为最大的值作为θ的估计值,记作 ,并称为θ的极大似∧θ然估计值。

这种求估计值的方法称为极大似然估计法。

参数的点估计的评价方法:无偏性;有效性;一○1○2○3致性。

3.假设检验的思想:先假设总体具有某种特征,然后再通过对样本的加工,即构造统计量推断出假设的结论是否合理。

假设检验是带有概率性质的反证法。

推理依据:第一,假设检验所采用的逻辑推理方法是反证法。

第二,合理与否,所依据的是“小概率事件实际不可能发生的原理”。

参数假设检验步骤:提出原假设○1和备择假设;选择适当的○2统计量,并确定其分布形式;选择显著性水平α ,确定○3临界值;作出结论。

○4 5.正交试验数据分析方法:直接对比法就是对试验结○1果进行简单的直接对比。

直观分析法是通过对每一○2因素的平均极差来分析问题。

所谓极差就是平均效果中最大值和最小值的差。

有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳因素水平组合。

4.方差分析的目的:方差分析的目的是通过分析,判定某一因子是否显著,当因子显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。

方差分析是对多个总体均值是否相等这一假设进行检验。

思想:检验μ1=μ2=……μγ是通过方差的比较来确定的,即:要考虑均值(观测值)之间的差异,差异的产生来自两个方面,一方面是由因素中的不同水平造成的,称为系统性差异;另一方面是由随机性而产生的差异。

数理统计习题(汇总)

数理统计习题(汇总)

150 162 175 165
(1) 求 Y 对 X 的线性回归方程; (2) 检验回归方程的显著性; (3) 求回归系数 b 的 95%的置信区间; (4) 取 x 0 =90,求 y 0 的预测值及 95%的预测区间。 8. 为了考察影响某种化工产品转化率的因素 , 选择了三个有关因素: 反应温度 (A)、反应时 间( B)、用碱量(C),而每个因素取三种水平,列表如下: 水平 因子 温度(A) 时间(B) 用碱量(C) 1 80℃( A1 ) 90 分( B1 ) 5%( C1 ) 2 90℃( A2 ) 120 分( B2 ) 6%( C2 ) 3 90℃( A3 ) 150 分( B3 ) 7%( C3 )
X ________, E ( X ) ______, D( X ) ______ .
3. 设 X 1 , X 2 , , X n 相互独立,且 X i N (0,1).(i 1, 2, , n) 则 的________分布。
2 4. 设 X N (0,1).Y ( n). X 与 Y 独 立 ,则 随 机 变 量 T
2
9. 某厂生产一种乐器用的合金弦线,按以往的资料知其抗拉强度(单位: kg cm 2 )服从 正态分布 N (10560,802 ) ,今用新配方生产了一批弦线,欲考察这批弦线的抗拉强度是 否有提高,为此随机抽取 10 根弦线做抗拉试验,测得其抗拉强度均值为 x 10631.4 , 均方差 s 81.00 。 (检验水平 0.05 ) 。 10. 某厂生产一种保险丝,规定保险丝熔化时间的方差不能超过 400。今从一批产品中
2 2 2 sB 1024( h2 ) ,取置信水平为 0.99 ,试求:
(1)
2 1 的区间估计。 2 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

工科研究生“数理统计”课程课外作业
一、说明
(一)课外作业要求
请同学们结合现实生活或专业背景,说明参数估计、假设检验、回归分析、方差分析、正交设计(这些方法中至少选择一个)的应用。

要求由同学们自行提出问题、搜集数据(提供原始数据)和假设条件,建立模型,并运用统计分析方法和统计分析软件进行模型求解,对计算结果进行说明和解释。

请注意:不能复制现有成果,同学之间也不能相互复制内容。

(二)课外作业评价标准
以问题表述的清晰性、条件假设的合理性、建模的科学性和创造性、模型表达的正确性、计算方法选择的合理性、结果的正确性和文字表述的清晰程度、格式的规范性(科研论文格式规范)为主要标准。

(三)课外作业提交形式——制纸报告(用A4纸打印)
包括报告题目、摘要、正文、参考文献和附录五个部分。

正文内容应包括问题描述、数据描述、模型建立、求解和检验、模型结果分析等内容。

报告用Word 文本格式,中文字使用宋体、小四号字,英文用Roman 字体5 号字,数学符号用MathType 输入。

(四)课外作业提交时间
具体提交方式与时间,请与助教联系,但最迟提交时间为考试前,过期不收。

二、报告基本格式如下
研究生“数理统计”课程课外作业
姓名:学号:
学院:专业:
类别:上课时间:
成绩:
能源消费与经济发展的关系
摘要:
随着科技的发展世界的进步,各国对于能源的需求量日益增加,作为有限资源的自然能源累积消耗过大,且呈现出稀缺的趋势。

在经济发展的道路上,能源的消费量与消费结构在逐渐变化。

中国经济的发展与能耗的关系如何是本篇文章的研究内容。

为求证能源各种类与国内生产总值指数之间是否存在线性关系,假设回归模型并运用数理统计知识求解方程,用EViews软件的最小二乘法程序对于样本数据进行回归分析。

并对回归的结果进行分析和统计检验。

一、问题提出,问题分析。

大型的工业发展需要消耗大量的能源,而居民生活水平的提高也增加了对于各种能源的需求量。

用电量已经成为经济状况的重要指标,由此可初步预测能源的消费总量与经济发展成正相关。

但能源的种类众多,传统能源与新型能源的消耗与经济发展的关系应该区别分析。

根据国家统计局公布的数据,能源消耗的统计中分为四类:煤炭,石油,天然气,水电核电风电。

为了便于计算,经济发展的指标我采用的是以1978年为100的国内生产总值指数。

二、数据描述
计算所使用的样本数据为1990年至2010年内每年的能源消耗总量以及各分类的比例和国内生产总值指数。

其中国内生产总值指数以1978年为100进行核算。

数据来源于国家统计局官方网站(/)中的2011年统计年鉴(/tjsj/ndsj/2011/indexch.htm )。

数据表格附在附录上。

三、模型建立:
(1)提出假设条件,明确概念,引进参数;
假设i Y 为各年的国内生产总值,i X 为各年能源的消耗总量,1234,,,i i i i Z Z Z Z 分别为煤炭,石油,天然气,水电核电风电历年的消耗量(1990,1991...2010i )。

图1.国内生产总值与能源消耗总量的关系
由图1.可以知道,能源消耗量确实是与经济发展成正的线性关系。

需要具体分析每个不同的能源种类对于经济发展的作用。

(2)模型构建; 设定回归模型为
011223344i i i i i i Y Z Z Z Z βββββε=+++++
式(1)中01224(,,,,)T ββββββ=为回归系数。

残差项2~(0,)i N εσ,而且
(,)0,i j Cov i j εε=≠。

(3)模型求解。

由最小二乘法估计参数,
2010
2220
112233441990
()()E
E
i
i i i i i S S y z z z z ββ
ββββ===
-----∑
ˆβ选择为2min ()E
S β
β的最优解。

2
()
0E S ββ
∂=∂ 得到ˆβ
的LS 估计 1ˆ()T T Z Z Z Y β
-= ˆˆY
Z β=
四、计算方法设计和计算机实现。

统计计算中应用的软件为EViews 。

导入统计局公布的数据,应用EViews 的最小二乘法程序,输出的结果如表2所示。

表2应用EViews 输出的结果
由表2.,的估计的回归方程为
1234ˆ155.22230.0005850.0174420.0352300.029286i i i i i
Y Z Z Z Z =--+++ 残差平方和为:
Sum squared resid =20839.39
所以
2
2
20839.39
ˆ1302.46191
16
i
n k ε
σ
==
=--∑
从而可以得到回归标准差为
ˆ1302.461936.0896σ
== 由表2.直接得到的回归标准差为
S.E. of regression =36.08964
五、主要的结论或发现。

现实经济意义:1ˆβ为负值,经济的发展随着煤炭消耗量的降低而增加,煤炭属于传统能源,对于环境污染较大且效率较低,在科技高速发展的同时会减少对煤炭的需求量,此项结果的符号与预期相符。

但由于中国还处于工业化阶段,同时又是煤炭的
资源大国,煤炭的回归系数相对其他几个种类来说比较小。

3ˆβ的数值是三个系数中最高的,天然气属于新型清洁能源,顺应了现今保护生态环境与自然和谐相处的原则,经济低碳发展的同时天然气的应用得到了大力的推广,可见天然气的在未来的经济发展的会起到巨大的作用。

六、结果分析与检验。

(1)拟合优度检验
由表2.,可以得到样本可决系数为
R-squared = 0.996334
修正样本可决系数为
Adjusted-squared = 0.995418
计算结果表明,估计的样本回归方程较好地拟合了样本观测值。

(2)F 检验
提出检验的原假设为
01234:0H ββββ====
备择假设为
1:H 至少有一个i β不等于零(1,2,3,4i =)
对于表2.,得F 统计量为 F-statistic = 1087.236
对于给定的显著水平0.05α=,从F 值表中查出分子自由度为4,分母自由度为18的F 分布上的侧分位数0.05(4,18) 2.96F =,因为F =1087.236>2.96,所以否定0H ,总体回归方程是显著的,即能源各个种类的消耗量与国内生产总值指数之间存在着显著的线性关系。

(3)t 检验
提出检验的原假设为
0:0,1,2,3,4i H i β==
由表2.得出t 统计量为
12340.591516
4.786037
1.978355
2.272793
t statistic t statistic t statistic t statistic ββββ--=---=--=--=
对于给定的显著水平0.05
α=,从表中查出自由度为18的t分布双侧分位数为
0.05/2(18) 2.101
t=。

24
,t t的绝对值都大于2.101,所以否定原假设,即认为石油和水电核
电风电的消耗量对于国内生产总值指数有显著影响。

因为
13
,t t的绝对值都小于2.101,所以不否定原假设,即认为煤炭和天然气对国内生产总值指数没有显著的影响。

于是建立回归模型时可不用将这两项作为解释变量进入模型。

参考资料
1.张晓峒,《计量经济学基础》,南开大学出版社;
2.张晓峒,《EViews 使用指南与案例》,机械工业出版社;
3.白砂堤津耶,瞿强,《通过例题学习计量经济学》,中国人民
大学出版社;
4.杨虎,刘琼荪,钟波,《数理统计》,高等教育出版社。

附录
附录1.1990-2010年能源消费总量及结构和国内生产总值。

相关文档
最新文档