2011-2012年研究生“应用数理统计”课外作业设计

合集下载

中南大学研究生应用统计试卷资料

中南大学研究生应用统计试卷资料

精品文档中南大学考试试卷日月9 2011年11 时间100分钟2011 -- 2012 学年1 学期卷考试形式:闭32 学时2 学分应用统计课程100 %分,占总评成绩总分100专业年级:2011级各专业硕士注意:此页不作答题纸,请将答案写在答题纸上。

全部计算结果保留小数点后两位。

临界值查表在试题最后面。

nn11??22)X(X?XSX==,定义:样本均值为样本方差为ii n?1n1?ii?1一.填空:(每小空3分,共计24分)?i( )2??XX,,X,, )1.样本则~N (取自总体X n2122?????n X?X?X②)①~~( ??????n/????1?i????22SD XE④③=( ) =( )X,X,,X X的样本,对连续总体分布的柯尔哥莫洛夫检验2. 为取自连续总体n12H:F(x)?F(x),其检验统计量为()00??1的置信区间W,则置信区间3. 对某个参数的W有可能包含此参数,也有可能不包含此参数,但不包含此参数的概率为( )22?????)1?XP{?3}?1}?P,{X?2}?2(1?(),{PX?X其中.的分布律为设总体,4?x?x?1,x?x?2,xx?3。

求实际中能观察到该样本未知,现有一样本值:561432?)?L((值的概率)????0:H:XXX,,?0H,1)(~XN。

已知假设,的样本,为X .设5 101216精品文档.精品文档H0.49}??{XW)的检验拒绝域为,则检验犯第一类错误的概率为(0?n1?2?????X,X, X,,??X问,)二、(12的样本,分)总体X~N (为取自总体X n21i2n1?i 2????X?E,的无偏估计?有效估计?要求写出求解过程。

是否为(提示:???22???DX? )?X,X,,X 设) 三、(12分是取自密度函数n21?)?(x????xe??(x,)f???x0??????X,X,X?min,Xc??X,已知:考虑的形如的估计,其中的样本,????2???c[?E]?DX,求使得达到最小的的均方误差,求此时的均方误差值。

应用数理统计作业题及参考答案(第二章)(2)

应用数理统计作业题及参考答案(第二章)(2)

第二章 参数估计(续)P682.13 设总体X 服从几何分布:{}()11k P X k p p -==-,12k = ,,,01p <<,证明样本均值11ni i X X n==∑是()E X 的相合、无偏和有效估计量。

证明: 总体X 服从几何分布,∴()1=E Xp,()21-=p D X p.1 ()()1111111==⎛⎫⎛⎫===⋅⋅==⎪ ⎪⎝⎭⎝⎭∑∑ nn i i i i E XE X E X n E X nn n p p .∴样本均值11ni i X X n==∑是()E X 的无偏估计量。

2 ()22221111111==--⎛⎫⎛⎫===⋅⋅=⎪ ⎪⎝⎭⎝⎭∑∑nn i i i i p p D XD X D X n nn np np . ()()()()1111ln ln 1ln 1ln 1-⎡⎤=-=+--⎣⎦;X fX p p p p X p .()111ln 111111fX p X X pppp p∂--=-=+∂--;.()()211222ln 111fX p X ppp ∂-=-+∂-;.()()()()211122222ln 111111f X p X X I p E E E p p p p p ⎡⎤⎡⎤⎡⎤∂--=-=--+=+⎢⎥⎢⎥⎢⎥∂--⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦; ()()()()12222221111111111111⎛⎫-=+-=+⋅-=+⋅ ⎪---⎝⎭pE X ppp p p p p p ()()()()2221111111-+=+==---p ppp pp p pp .()()()2422111111⎡⎤'⎛⎫⎢⎥ ⎪⎢⎥⎝⎭⎣⎦===-⋅⋅⋅⋅-n p pe p D X n I p n nppp .∴样本均值11ni i X X n==∑是()E X 的有效估计量。

3证法一:()21lim lim0→∞→∞-== n n p D X np,01p <<.∴样本均值11ni i X X n==∑是()E X 的相合估计量。

应用数理统计课外作业设计

应用数理统计课外作业设计

学号 20110813121 姓名卢丽丽学院资环学院专业安全技术及工程成绩实验数据处理中一元线性回归的应用摘要:我们处理实验数据时数理统计方法往往能帮助我们很好的处理,并且能得到很好的结果,回归分析主要是从大量反映某些变量间关系的观测值出发,分析变量问相关程度及相关关系,并建立回归模型去拟合变量间的关系,从而达到对变量之间关系的认识的方法。

其中一元线性回归模型在很多实验中能很好的帮我们预测未来数据和预测数据范围。

本文运用一元线性回归模型对试验中电流与时间的关系进行了分析,发现,试验中电流随时间逐渐减小,并呈线性递减关系。

通过求得的模型,我们进行了预测。

一、问题提出,问题分析在现代社会,随着科技的发展,人们生活水平提高,可是污染也越来愈严重,特别是重金属的污染,同时治理污染的方法也在改善。

重金属污染修复技术也得到发展,我们在做重金属的电动修复实验过程中,对其修复区的电流进行了观测,有观测值我们作出散点图,发现电流与时间有明显线性关系,我们用一元线性回归的方法分析这组数据,并预测未来电流的变化,以更好的掌握实验条件,为实验数据提供合理的解释。

二、数据描述下面是随着时间电流的变化数据,表中时间是指通电时间。

表1 电流随时间变化表根据数据,我们利用Excel作出散点图,如图1图1 电流随时间变化的散点图由图中点的趋势我们可以看出,电流随时间基本呈线性关系,我们求出其相关系数如下表:表2 电流与时间相关系数表三、模型建立(1)提出假设条件,明确概念,引进参数根据上面分析,我们知道,电流随时间基本呈线性关系,我们假设电流与时间是线性的,我们用一元线性回归模型进行拟合,并用F 检验法和t 检验法进行模型检验,各函数符号代表含义如下:x :电流; y :实验时间i x :各点电流值 i y :各点实验时间α:显著性水平,设α=0.05 (2)模型构建我们假定这组数据满足一元线性回归模型: 一元线性模型:⎩⎨⎧++=),0(~210σεεββN x y (3)模型求解先用最小二乘估计方法求出模型如下: 计算基本数据,如下表:表3 基本数据表6010600==x 49.49109.494==y 4.1002549.4960106.1966810101-=⨯⨯-=⋅-=∑=y x y x l i i i xy1188060104788010221012=⨯-=-=∑=x x l i i xx189.888149.491079.3337310221012=⨯-=-=∑=y y l i i yy8439.0118804.10025ˆ1-=-==xxxy l l β124.100ˆˆ10=-=x y ββ 6425.420ˆ21222=-=-=xx yy R T E l l S S S β 2512.786425.4202ˆ2==-=n S E σ回归直线为:x x y 8439.0124.100ˆˆˆ10-=+=ββ 该方程说明,在刚开始实验时,加的电流为100.124mA 。

2012-2013年第二学期工科研究生数理统计课课外作业

2012-2013年第二学期工科研究生数理统计课课外作业

研究生“数理统计”课程课外作业姓名:学号:学院:专业:类别:上课时间:成绩:紫红薯糖蛋白提取工艺的优化——正交设计与方差分析法的应用摘要:采用超声波辅助法提取紫红薯中的糖蛋白。

选取超声功率、料液比、提取数量、超声时间四个因素进行L9(34)正交试验,对正交试验结果进行极差分析、方差分析及配对比较。

试验结果表明:影响紫红薯糖蛋白提取得率的主要因素按显著性排序,依次是提取数量、料液比、超声功率、超声时间。

方差分析显示,提取次数、料液比、超声功率3个因素的影响都极显著,而超声时间不显著。

由极差分析和配对比较得出结论:超声功率150 W、料液比1:10、提取数量3次、超声时间20 min为紫红薯糖蛋白的最佳提取工艺参数。

关键词:正交方差分析糖蛋白超声波辅助法提取得率1 问题提出及分析紫红薯中的糖蛋白是一类糖类同多肽或蛋白质以共价键连接而形成的结合蛋白[1],在生物体内以不同形式存在而发挥作用,是细胞膜、细胞间基质、血浆、粘液、激素等重要组成成分[2, 3],糖蛋白及其复合物具有如抗氧化、免疫调节作用、体外抗肿瘤活性、抗糖尿病活性等多方面的生物活性,因此开发紫红薯糖蛋白具有重要的意义。

而紫红薯糖蛋白的提取受到多方面因素的影响,因此必须对影响因素进行分析并找到紫红薯糖蛋白提取工艺优化条件。

2 数据描述本文援引罗秋水等[4]的研究数据,阐述正交设计及方差分析法在提取紫红薯糖蛋白工艺研究方面的应用。

表1为紫红薯糖蛋白提取影响因素。

表2为紫红薯糖蛋白提取试验的正交设计试验结果。

表1正交试验因素水平表水平A(超声功率/W)B(料液比)C(提取数量/次)D(超声时间/min)1 120 1:8 1 202 135 1:10 2 303 150 1:12 3 40表2 正交设计及试验结果编号因素提取得率/%A (超声功率/W )B (料液比)C (提取数量/次)D (超声时间/min ) 正交 1 1(120)1(1:8) 1(1) 1(20) 0.1504 0.1411 2 1 2(1:10) 2(2) 2(30) 0.2258 0.2310 3 1 3(1:12)3(3) 3(40) 0.3603 0.3923 4 2(135)1 2 3 0.1815 0.1791 5 2 2 3 1 0.4428 0.4406 6 2 3 1 2 0.2863 0.2794 7 3(150)1 32 0.3428 0.3469 83 2 1 3 0.3308 0.3495 933210.30410.29803 模型建立3.1 建立正交设计方案根据表1中的正交试验因素及其水平,采用软件SPSS 生成正交设计。

“应用数理统计”课外作业设计

“应用数理统计”课外作业设计

学号姓名学院专业成绩典型燃煤中汞的赋存规律摘要:近年来,燃煤引起的汞污染越来越受到人们关注。

中国能源结构以燃煤为主,但由于中国煤质地区差异较大,造成现有烟气脱汞技术对煤质适应性较差,因此针对中国典型煤种中汞的赋存规律进行研究,对促进烟气脱汞技术的发展和环境保护具有重要意义。

论文针对烟煤和无烟煤,通过总汞测定、X射线荧光光谱分析等手段,对15个典型煤样中汞的赋存状态和规律进行了实验研究。

随着煤炭变质程度的增高,煤中总汞含量有增高趋势,各地区煤总汞含量差别较大,在本实验范围内,汞含量大致呈现北低南高的特征。

α= 0. 05时,煤样中的总汞含量与硅含量、硫含量、氯含量的相关性系数分别为0.509、0.600和0.682,具有较好的相关性。

关键词:CO2;赋存规律;相关性1提出问题并分析问题大气中的汞有两种不同类型的排放源:天然源和人类源。

主要还是以人类活动排放为主。

在自然界中汞以各种形式存在,例如以硫化汞的形式存在于岩石中。

这些汞经过一系列的自然过程进入大气。

天然源释放到大气中的主要是Hg0,还有一些二甲基汞、挥发性无机汞化合物等。

煤中汞的赋存形式是影响汞排放的一个重要因素。

有学者提出煤中存在与有机煤岩组分结合的有机汞化合物,但主要还是以与无机物结合形式存在[1]。

对于煤中汞的存在形式,许多学者都进行了研究。

Finkelman在煤中发现了含汞的硫化物和硒化物,Cahill和Shiley发现煤中的方铅矿含汞,Dvornikov还提出煤中的汞主要以辰砂、金属汞和有机汞化合物的形式存在[1]。

煤在地质化学中被归为亲硫元素,因而,煤中的汞主要存在于黄铁矿(FeS2)和朱砂(HgS)中[2]。

文献[1]的研究证实了煤中大多数汞以固溶物形式分布于黄铁矿中,特别是后期成因的黄铁矿。

与煤中汞的含量分布研究相比,我国对煤中汞的赋存状态研究相对薄弱。

目前对煤中汞赋存状态的研究,采集的样品大多为我国西南地区的高硫煤或某些高汞煤,主要讨论煤中的汞与黄铁矿或硫分之间关系。

应用数理统计实验讲义2011-12-30

应用数理统计实验讲义2011-12-30

应⽤数理统计实验讲义2011-12-30⽬录绪⾔MATLAB基础知识⼀、MATLAB软件简介 (1)1、MATLAB的主要功能 (1)2、MATLAB的⼯作环境 (1)3、MATLAB的⼯作原理 (2)⼆、MATLAB⼊门 (2)1、数学运算符及特殊字符 (2)2、常⽤库函数 (2)3、命令⾏的编写 (3)4、变量与表达式 (3)5、M⽂件的建⽴、编写、保存与调⽤ (4)6、MATLAB的在线帮助 (4)7、路径的设置 (4)第⼀章数理统计的基本概念⼀、直⽅图与经验分布函数图的绘制 (5)⼆、常见的概率分布 (7)三、MATLAB为常见分布提供的五类函数 (7)1、概率密度函数 (7)2、累积分布函数 (8)3、逆累积分布函数 (8)4、随机数发⽣函数 (8)5、均值和⽅差 (8)四、常⽤的统计量 (9)第⼆章参数估计⼀、统计⼯具箱中的参数估计 (10)1、利⽤mle函数对概率分布中的参数进⾏估计 (10)第三章假设检验⼀、正态总体的参数假设检验 (13)(⼀)检验问题、检验统计量及拒绝域 (13)(⼆)参数假设检验函数 (14)(三)参数假设检验函数的格式说明及例题 (14)1、[h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail) (14)2、[h,p,ci,stats] = ttest(x,mu0,alpha,tail) (15)3、[h,p,ci,stats] = ttest2(x,y,alpha,tail) (16)4、[h,p,ci,stats] = vartest(x,sigma02,alpha,tail) (17)5、[h,p,ci,stats] = vartest2(x,y,alpha,tail) (18)⼆、⾮参数假设检验 (19)(⼀)各检验⽅法的功能与优缺点 (19)(⼆)⾮参数假设检验函数 (20)(三)⾮参数假设检验函数的格式说明及例题 (21)1、[h,p,stats] = chi2gof(x,name1,val1,name2,val2,...) (21)2、[table,chi2,p,label] = crosstab(x,y) (23)3、[h,p,ksstat,cv] = kstest(x,cdf,alpha,tail) (25)4、[h,p,lstat,cv]= lillietest(x,alpha,distr) (25)5、[h,p,jbstat,cv] = jbtest(x,alpha) (26)6、[h,p,ksstat] = kstest2(x,y,alpha,tail) (28)7、[p,h,stats] = ranksum(x,y,alpha) (28)8、normplot(x) (29)9、qqplot(x,y) (30)第四章回归分析⼀、线性回归模型 (33)⼆、回归分析中研究的主要问题 (33)三、回归分析函数 (34)(⼀)回归分析函数 (34)(⼆)回归分析函数的格式说明及例题 (34)1、[b,bint,r,rint,stats] = regress(y,X,alpha) (34)2、stepwise(X,y,inmodel,penter,premove) (43)3、多项式拟合 (polyfit)、多项式求值 (polyval)等函数 (47)第五章⽅差分析⼀、⽅差分析模型与假设检验⽅法 (51)(⼀)单因素⽅差分析数学模型 (51)1、单因素⽅差分析数学模型 (51)2、假设检验 (51)(⼆)双因素等重复试验⽅差分析 (51)1、双因素等重复试验⽅差分析的数学模型 (51)2、假设检验 (51)(三)双因素⽆交互作⽤的⽅差分析 (52)1、双因素⽆交互作⽤⽅差分析的数学模型 (52)2、假设检验 (52)⼆、⽅差分析函数 (53)(⼀)⽅差分析函数 (53)(⼆)⽅差分析函数的格式说明及例题 (53)1、[p,table,stats] = anova1(X,group) (53)2、c = multcompare(stats,param1,val1,param2,val2,...) (55)3、[p,table,stats] = anova2(X,reps) (57)附:Matlab 2007b PLP(注册码)18-41519-34649-39940-00621-01988-02577-01245-51575-44112-12966-44686-37374-43430-36283-64095-18584-34803-54175-05965-54469-56859-47170-56703-00300-00857-63903-48349-07297-57752-37962-48933-62342-43508-41646-31266-38461-54713-50260-57403-18654-13756-59612-18880最⼤似然估计──Maximum likelihood esti mates (MLE)置信区间──Confidence intervals (ci)Q-Q图──Quantile-quantile plot绪⾔MATLAB基础知识⼀、MATLAB软件简介1967年美国Mathwork公司推出了、基于矩阵运算的“Matrix Laboratory” (缩写为MATLAB) 的交互式软件包. MATLAB既是⼀种直观、⾼效的计算机语⾔, 同时⼜是⼀个科学计算平台. 它为数据分析和数据可视化、算法和应⽤程序开发提供了最核⼼的数学和⾼级图形⼯具. 根据它提供的500多个数学和⼯程函数, ⼯程技术⼈员和科学⼯作者可以在它的集成环境中交互或编程以完成各⾃的计算. MATLA-B⼀般⽤于线性代数、概率统计、图像处理、样条分析、信号处理、⼩波分析、振动理论、神经⽹络、⾃动控制、系统识别、算法优化和财政⾦融等各个⽅⾯.不过, MATLAB作为⼀种新的计算机语⾔, 要想运⽤⾃如, 充分发挥它的威⼒, 也需要系统的学习. 但由于使⽤MATLAB编程运算与⼈进⾏科学计算的思路和表达⽅式完全⼀致, 所以不像学习其他⾼级语⾔如Basic、Fortan和C语⾔等那样难于掌握. 下⾯的内容均是基于MATLAB7.5版本.1、MATLAB的主要功能(1) 数值计算功能(Numeric)(2) 符号计算功能(Symblic)(3) 图形和可视化功能 (Graphic)(4) MATLAB的活笔记本功能(Notebook)(5) 可视化建模和仿真功能(Simulink)2、MATLAB的⼯作环境MATLAB的⼯作环境主要包括:·【Command Window】命令窗⼝;·【File Editor】⽂本编辑窗⼝;·【Figure Window】图形窗⼝.图0-1MATLAB 6.x的命令窗、⽂本编辑窗、图形窗、菜单栏和⼯具栏MATLAB 7.5还包含⼏个辅助视窗, 组成其“桌⾯系统”. 它们分别为:·【Workspace】⼯作台窗⼝;·【Command History】指令历史纪录窗⼝;·【Current Directory】当前⽬录选择窗⼝.图0-2MATLAB 7.5的桌⾯系统和命令窗⼝3、MATLAB的⼯作原理(1) 语⾔结构:MATLAB语⾔ = 窗⼝命令 + M⽂件(2) 窗⼝命令:在MATLAB命令窗⼝中输⼊的MATLAB语句, 并直接执⾏它们完成相应的运算、绘图等.(3) M⽂件:在MATLAB⽂本编辑窗⼝中⽤MATLAB语句编写的磁盘⽂件, 扩展名为“.M”.⼆、MATLAB⼊门1、数学运算符及特殊字符数组的算术运算符: + - .* ./ .\ .^矩阵的算术运算符: + - * / \ ^关系运算符: < <= > >= = = ∽=逻辑运算符: & 与; | 或; ~ ⾮三种运算的顺序依次为: 算术运算、关系运算、逻辑运算.pi 数学常数, 即3.1415926535897....eps 系统的浮点 (Floating-ponit) 精确度. 在PC机上, 它等于522Inf 正⽆穷⼤, 定义为1 0ans 计算结果的默认变量名NaN 不定值, 由 Inf/Inf或0/0等运算产⽣2、基本库函数(1) 常⽤三⾓函数:sin, cos, tan, cot, sec, csc, asin, acos, atan, acot, asec, acsc等(2) 常⽤基本函数:sqrt(x)—开平⽅abs(x)—取绝对值exp(x)—以e为底的指数log(x)—⾃然对数log10(x)—以10为底的对数log2(x)—以2为底的对数sum(x)—求和prod(x)-求积max(x)—最⼤值min(x)—最⼩值fix(x)—对称取整sign(x)—符号函数length(x)—矩阵⾏数与列数中的最⼤值size(x)—矩阵的⾏数与列数注意: (1) 由于MATLAB是基于矩阵的运算,所以上⾯的x均表⽰矩阵, 数可看作是1×1的矩阵.(2) 对⾮向量型矩阵, 如不作特殊说明, 都是列优先.3、命令⾏的编写随时输⼊指令并按回车键, 即时给出结果;在指令最后不⽤任何符号并按回车键, 将显⽰最后结果;在指令最后⽤“; ”并按回车键, 将只计算但不显⽰最后结果.同时输⼊⼏条指令时, ⽤“, ”或“; ”隔开.【例0-1】数学运算符、特殊字符与基本库函数的应⽤>>3*(-5), 2/5, [1 2 3].*[2 4 5], [1 2 3]./[2 4 5], [2,4,5].^2ans = -15ans = 0.4000ans = 2 8 15ans = 0.5000 0.5000 0.6000ans = 4 16 25>> sin(pi/4), log(exp(1))ans = 0.7071ans = 14、变量与表达式在MATLAB中, 把由下标表⽰次序的标量的集合称为矩阵或数组. MATLAB是基于矩阵运算的, 因此其基本数据结构只有⼀个:矩阵. ⼀个数也是矩阵, 只不过它是1⾏×1列的矩阵. MATLAB中的变量可⽤来存放数据, 也可⽤来存放向量或矩阵, 并进⾏各种运算.变量命名的规则为:·变量名、函数名是要区分⼤⼩写字母的;·第⼀个字符必须是英⽂字母;·字符间不可留空格;·最多只能有31个字符 (只能有英⽂字母、数字和下连字符) .表达式由变量名、运算符和函数名等组成. 如x/sin(x), 其中x为变量名, /为运算符, sin为函数名.MATLAB语句有两种最常见形式: 1) 表达式; 2) 赋值语句: 变量 = 表达式.【例0-2】赋值语句的使⽤>> x=1; y=x/sin(x)y = 1.1884>> x=[pi/6,pi/4,pi/3,pi/2]; sin(x)ans =0.5000 0.7071 0.8660 1.0000>> x=0:0.1:2*pi; y=sin(x); plot(x,y)图0-3y=sin(x)的曲线图5、M ⽂件的建⽴、编写、保存与调⽤(1) 进⼊⽂本编辑窗⼝的⽅式: 在菜单栏“File ”下直接点击“新建…”进⼊⽂本编辑窗⼝. (2) M ⽂件的分类与格式:①命令⽂件: 由⼀系列MATLAB 语句组成, 运⾏时将⾃动执⾏⼀系列命令直⾄给出最后结果, ⽽不交互地等待键盘输⼊. 命令⽂件定义的变量为全局变量, 存放于内存.②函数⽂件: 第⼀⾏必须包含“function ”, 主要功能是建⽴⼀个函数. 函数⽂件定义的变量为局部变量.function 因变量名= 函数名(⾃变量名)注意: 函数⽂件要求函数名和⽂件名相同, 且函数名、⽂件名与变量名的命名规则⼀样. (3) 退出⽂本编辑窗⼝: 录⼊完毕, 存盘退出⽂本编辑窗⼝则可.【例0-3】已知1232,3,1x x x =-==, ⽽2112112122233,y z zz x y z z z x x =+?=??=-=+, 试求12,y y 的值. ·在⽂本编辑窗⼝中编写命令⽂件f0_3.m:x1=-2;x2=3;x3=1; z1=3*x1^2; z2=x2+x3; y1=z1+z2 y2=z1-z2·在命令窗⼝中运⾏命令⽂件f0_3.m:>> f0_3y1 = 16 y2 = 8【例0-4】求()lg f x =0,5,10x x x ===处的函数值.·在⽂本编辑窗⼝中编写函数⽂件f0_4.m:function y=f0_4(x)y=log10(sqrt((x-5).^2+(x-100).^2)); ·在命令窗⼝中调⽤函数⽂件f0_4.m:>>x=[0,5,10]; y=f0_4(x); y = 2.0005 1.9777 1.9549 6、MATLAB 的在线帮助 (1) 从菜单栏上的“help ”进⼊ (2) 其它命令窗⼝帮助clc —— 清除显⽰屏上的内容 clear —— 清除内存变量和函数what —— 列出当前⽬录下的M 、MAT 、MEX ⽂件 who ——列出当前⼯作空间 (Workspace) 的变量名7、路径的设置在保存M ⽂件时, MATLAB 的默认位置是C:\MATLAB6p5\work. 如果⽤户将编写的M ⽂件保存在E:\experiment ⽬录下, 则从MATLAB 窗⼝的“File ”菜单中单击⼦菜单“Save As …”, 选择E:\experiment, 再输⼊本M ⽂件的⽂件名, 按“保存”键返回则可.第⼀章数理统计的基本概念⼀、直⽅图与经验分布函数图的绘制hist(A,n)——对矩阵A 按列作统计频数直⽅图, n 为条形图的条数 ni=hist(A,n)——对矩阵A 按列得各划分区间内的统计频数注意: 当A 为向量时, 上述所有命令直接作⽤在向量上, ⽽不是列优先.[Fn,x0]=ecdf(x) —— 得到样本x 的经验分布函数值Fn, 当x 中有m 个不同的数 (记为向量x0) 时, 则Fn 的个数为m+1个ecdfhist(Fn,x0, m) —— 绘制数据x 的频率(密度)直⽅图, 其中Fn 与x0是由ecdf 函数得到的样本x 的经验分布函数值Fn 与分段点x0, m 为条形的个数, m 的默认值为10cdfplot(x) —— 绘制样本x 的经验分布函数图例如:>> x = [6 4 5 3 6 8 6 7 3 4]; >> [Fn,x0]=ecdf(x)Fn = 0 0.2000 0.4000 0.5000 0.8000 0.9000 1.0000 x0 = 3 3 4 5 6 7 8 >> cdfplot(x)图1-1 经验分布函数图【例1-1】(P 10例1.6)在齿轮加⼯中, 齿轮的径向综合误差i F ''?是个随机变量, 今对200件同样的齿轮进⾏测量, 测得i F ''?的数值 (mm) 如下, 求作i F ''?的频率密度直⽅图, 并作出i F ''?的经验分布函数图形.16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 24 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24 17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18·编写命令⽂件example1_6.m:F=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 24.... 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21.... 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28.... 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13....14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16.... 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28.... 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18.... 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33.... 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24....17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18];%(1)下⾯作频数直⽅图 figure(1) hist(F,8)title('频数直⽅图');xlabel('齿轮的径向综合误差(mm)'); %(2)下⾯作频率(密度)直⽅图 [Fn,x0]=ecdf(F); figure(2)ecdfhist(Fn,x0,8); title('频率(密度)直⽅图');xlabel('齿轮的径向综合误差(mm)'); %(3)下⾯作经验分布函数图 figure(3) cdfplot(F)title('经验分布函数图');xlabel('齿轮的径向综合误差(mm)'); ·运⾏命令⽂件example1_6.m:>> example1_6频数直⽅图齿轮的径向综合误差(mm)频率(密度)直⽅图齿轮的径向综合误差(mm)5101520253035齿轮的径向综合误差(mm)F (x )经验分布函数图图1-2⼆、常见的概率分布表1-1常⽤概率分布及代码1) 概率密度函数(分布名+pdf)2) (累积)分布函数(分布名+cdf)3) 逆(累积)分布函数(分布名+inv)4) 随机数发⽣器(分布名+rnd)5) 均值和⽅差(分布名+stat)1、概率密度函数表1-2概率密度函数(pdf)注意: Y=normpdf (X, mu, sigma)的sigma是指标准差, ⽽⾮.N的概率密度图.【例1-2】绘制标准正态分布(0,1)x=-4:0.1:4;y=normpdf(x,0,1);plot(x,y)title('N(0,1)的概率密度曲线图')图1-3 标准正态分布的概率密度图2、累积分布函数表1-3 累积分布函数(cdf)【例1-3>> P=normcdf (2,0,1)-normcdf(-2,0,1) ans = 0.9545 3、逆累积分布函数 (⽤于求分位点)表1-4 逆累积分布函数(inv)22(i) 0.9u ;(ii) 0.25(4)t ;(iii) 0.1(14,10)F ;(iv) 20.025(50)χ.>> u_alpha=norminv(0.9,0,1)不是平⽅u_alpha = 1.2816 >> t_alpha=tinv(0.25,4)t_alpha = -0.7407 >> F_alpha=finv(0.1,14,10)F_alpha = 0.4772>> X2_alpha=chi2inv(0.025,50)X2_alpha = 32.3574 4、随机数发⽣函数表1-5 随机数发⽣函数(rnd)5表1-6 常见分布的均值和⽅差函数(stat)注意: MATLAB 中的指数分布的概率密度函数是1,0 ()0,0xue xf x u x -?>?=??≤?.四、常⽤的统计量表1-7 常⽤统计量说明:(1) y=var(X) ——计算X 中数据的⽅差, 其中211var()()1ni i X x x n ==--∑. y=var(X, 1) ——211var(,1)()n i i X x x n ==-∑, 得到样本的⼆阶中⼼矩 (转动惯量).(2) C =cov(X) ——返回⼀个协⽅差矩阵, 其中输⼊矩阵X 的每列元素代表着⼀个随机变量的观测值. 如果X 为n ×m 的矩阵, 则C 为m ×m 的矩阵.(3) var(X)=diag(cov(X)), std(X)=sqrt(diag(cov(X))).作业: P 26-28 1.1, 1.12第⼆章参数估计参数估计包含两种常⽤⽅式: 点估计和区间估计.Matlab 统计⼯具箱给出了常⽤概率分布中参数的点估计 (采⽤最⼤似然估计法-MLE) 与区间估计, 另外还提供了部分分布的对数似然函数的计算功能. ⼀、统计⼯具箱中的参数估计1、利⽤mle 函数对概率分布中的参数进⾏估计格式: [phat,pci] = mle(data,'distribution',dist, 'alpha', alpha,'ntrials',n) 引号内照抄功能: 根据样本数据data, 给出由dist 指定分布的参数的MLE 估计与区间估计. 说明:(1) phat 与pci 中的“p ”为分布中的参数, 可表⽰多个参数;(2) phat 为参数的最⼤似然估计值, pci 为参数的置信⽔平为1α-的置信区间, 其中α由alpha 的取值确定;(3) dist 为总体分布的指定类型, 其取值为表1-1中的代码; (4) 当dist 为’norm ’时, phat 中的参数“p ”是指,µσ, ⽽⾮2,µσ.(5) alpha 为显著性⽔平, 取值在0-1之间. 0.05α=是默认值, 此时本选项可省略;(6) 'ntrials',n 只在dist 为bino (⼆项分布(,)b n p )时才选⽤, n 为(,)b n p 是的n, 此时待估参数为p.【例2-1】(书P 66习题2.3) 使⽤⼀测量仪器对同⼀值进⾏了12次独⽴测量, 其结果为 (单位: mm)232.50 232.48 232.15 232.52 232.53 232.30 232.48 232.05 232.45 232.60 232.47 232.30并设测量值2~(,)X N µσ, 试求2,µσ的最⼤似然估计与区间估计(0.05α=). (1) 问题分析:设总体X ──测量值, 且2~(,)X N µσ.今抽得⼀容量为12的样本, 本问题是求参数2,µσ的最⼤似然估计与置信⽔平为0.95的区间估计. (2) 问题求解:2,µσ的最⼤似然估计分别为: 2211??,()nMLE MLEi i X X X n µσ===-∑; µ的置信⽔平为1α-的置信区间为: 1212(1),(1)X n X n αα--??--;2σ的置信⽔平为1α-的置信区间为: 22**22122(1)(1),(1)(1)n S n S n n ααχχ-??--??--.·编写命令⽂件exercise2_3.m:x=[232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30];[hat,ci]=mle(x,'distribution','norm') ·运⾏命令⽂件exercise2_3.m:>> exercise2_3hat = 232.4025 0.1598 pci (:,1)所有⾏第⼀列 ci = 232.2965 0.1182 232.5085 0.2834(3) 问题结果 :22??232.4025,0.15980.0255MLE MLE µσ===,µ的置信区间为[232.2965,232.5085],2σ的置信区间为22[0.1182,0.2834][0.0140,0.0803]=.【例2-2】(书P 69习题2.22) 随机地从⼀批零件中抽取16个, 测得长度 (单位: cm) 为:2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11设零件长度的分布为正态的, 试求总体均值的90%的置信区间: ①若0.01σ=(cm);②若σ未知.(1) 问题分析:设总体X ──零件长度, 则2~(,)X N µσ. 本问题是求参数µ的置信区间. (2) 问题求解:①若0.01σ=: µ的置信⽔平为1α-的置信区间为1212,X X αα--. ·编写函数⽂件zestimate.m:function muci=zestimate(x,sigma,alpha) n=length(x); xhat=mean(x);u_alpha=norminv(1-alpha/2,0,1); delta1=sigma/sqrt(n)*u_alpha; muci=[xhat-delta1,xhat+delta1]; ·调⽤函数⽂件zestimate.m: >> x=[2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11]; >> sigma=0.01; >>alpha=0.1;>> muci=zestimate(x,sigma,alpha) muci = 2.1209 2.1291 ②若σ未知: µ的置信⽔平为1α-的置信区间为1212(1),(1)X n X n αα--??--. ·编写命令⽂件exercise2_22_2.m:x=[2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11];[phat,pci]= mle(x,'distribution','norm','alpha',0.1); muci=pci(:,1)·运⾏命令⽂件exercise2_22_2.m:>> exercise2_22_2muci = 2.1175 2.1325 (3) 问题结果:①当0.01σ=时, µ的置信⽔平为0.90的置信区间为[2.1209, 2.1291]; ②当σ未知时, µ的置信⽔平为0.90的置信区间为[2.1175,2.1325].【例2-3】(书P 66例2.31) 对⼀批产品, 欲通过抽样检查其不合格率. 今抽取产品100件, 发现不合格品有4件, 求不合格率的0.95的双侧置信区间. (1) 问题分析:设总体1,0X ?=??本产品为不合格品本产品为合格品, 即~(1,)X b p .今抽得⼀容量为100的样本145100(1,0)x x x x ====== , 本问题即要求参数p 的双侧置信区间.(2) 问题求解:选⽤下列两种⽅法计算:①利⽤P 6522221212()(2)0n u p nX u p nX αα--+-++<近似计算(棣莫弗-拉普拉斯中⼼极限定理);②利⽤Matlab 中⼆项分布参数估计函数mle 计算 (借助F 分布). ·编写命令⽂件example2_31.m:alpha=0.05; n=100;%(1) 利⽤中⼼极限定理近似计算 u=norminv(1-alpha/2,0,1); a=n+u^2;b=-(2*n*(4/n)+u^2); c=n*(4/n)^2;p=[(-b-sqrt(b^2-4*a*c))/(2*a),(-b+sqrt(b^2-4*a*c))/(2*a)]%⼀元⼆次⽅程求根公式%(2) 利⽤mle 计算[pcat,pci]=mle([1,1,1,1,zeros(1,96)],'distribution','bino','ntrials',1) ·运⾏命令⽂件example2_31.m:>> example2_31p = 0.0157 0.0984%近似计算结果pcat = 0.0400 pci = 0.0110 0.0993%mle 计算结果(3) 问题结果:①利⽤中⼼极限定理得到p 的近似估计区间为[0.0157, 0.0984]; ②利⽤mle 得到p 的估计区间为[0.0110, 0.0993].作业: P 67-69 2.24, 2.25第三章假设检验假设检验分为两种: 参数假设检验与⾮参数假设检验. ⼀、正态总体的参数假设检验(⼀)检验问题、检验统计量及拒绝域表3-1的说明:对⼀个正态总体2~(,)X N µσ, 抽取样本12,,,n X X X ;对两个正态总体211~(,)X N µσ, 222~(,)Y N µσ, 且X 与Y 独⽴, 分别抽取样本112,,,n X X X 与212,,,n Y Y Y .表3-1 正态总体的参数假设检验其中, 22211*22*12(1)(1)2wn S n S S n n -+-=+-.(⼆)参数假设检验函数表3-2 统计⼯具箱中的参数假设检验函数 (test)(1) [h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail)中的sigma 是指标准差σ, ⽽⾮2σ; (2) [h,p,ci,stats] = vartest(x,sigma20,alpha,tail)中的sigma20是指20σ, ⽽⾮0σ.(三)参数假设检验函数的格式说明及例题1、[h,p,ci,zval] = ztest(x,mu0,sigma,alpha,tail) ⽅差已知时, 对单正态总体均值µ与实数0µ的关系进⾏Z 检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰10:H µµ≠ (缺省值) ; tail='right'表⽰10:H µµ>;tail= 'left'表⽰10:H µµ<. (原假设则为00:H µµ≥)·输出变量含义:h ——如果h=0, 则接受0H ; 如果h=1, 则拒绝0H ⽽接受备择假设1H ;p ——在当前样本下拒绝0H 的最⼩显著性⽔平, 即犯第I 类错误的最⼩概率00(|拒绝为真)P H H ; ci ——均值µ的置信⽔平为1α-的置信区间; zval ——Z统计量X Z =的观测值.α是我们设定的显著性⽔平, p 是最⼩显著性⽔平, 因此当p<α时, 则拒绝0H ;当0µ落⼊ci 中, 则接受0H .【例3-1】(书P 76例3.4) ⼀台包装机装洗⾐粉, 额定标准重量为500g, 根据以往经验, 包装机的实际装袋重量服从正态分布2(,)N µσ, 其中15σ=g, 为检验包装机⼯作是否正常, 随机抽取9袋, 称得洗⾐粉净重数据如下 (单位: g) : 497 506 518 524 488 517 510 515 516若取显著性⽔平0.01α=, 问这包装机⼯作是否正常? (1) 问题分析:设总体X ──每袋洗⾐粉的重量, 2~(,)X N µσ, 且2215σ=已知. 今抽得⼀容量为9的样本, 本问题是检验假设: 00100:,:(500)H H µµµµµ=≠=.(2) 问题求解:选取检验统计量X u =, 则0H 的拒绝域为12||u u α->.>> x=[497,506,518,524,488,517,510,515,516]; >> [h,p,ci,zval]=ztest(x,500,15,0.01,'both')h = 0%接受00:500H µµ== p = 0.0432%0H为真条件下12||Z u α-=> 成⽴的最⼩的α值 (参照书P 84例3.7)ci = 497.2320 522.9903 %σ已知时µ的置信⽔平为0.95的双侧置信区间 zval = 2.0222%Z统计量X Z =的值.(3) 问题结果:由于h = 0, 故接受00:H µµ=, 即认为包装机⼯作正常.2、[h,p,ci,stats] = ttest(x,mu0,alpha,tail) ⽅差未知时, 对单正态总体均值进⾏t 检验. ·输出变量含义:stats 包含三个结果:tstat ——t统计量X t =;df ——t 分布的⾃由度; sd ——样本标准差.【例3-2】(书P 79例3.5) 某部门对当前市场的价格情况进⾏调查. 以鸡蛋为例, 所抽查的全省20个集市上, 售价分别为 (单位: 元/500克)3.05, 3.31, 3.34, 3.82, 3.30, 3.16, 3.84, 3.10, 3.90, 3.18, 3.88, 3.22, 3.28, 3.34, 3.62, 3.28, 3.30, 3.22, 3.54, 3.30.已知往年的平均售价⼀直稳定在3.25元/500克左右, 在显著性⽔平0.025α=下, 能否认为全省当前的鸡蛋售价明显⾼于往年? (1)问题分析:设总体X ──每500克的鸡蛋价格, 2~(,)X N µσ, 且2σ未知. 今抽得⼀容量为20的样本, 本问题是检验假设: 00100:,:( 3.25)H H µµµµµ=>=.(2) 问题求解:选取检验统计量X t =则0H 的拒绝域为1(1)t t n α->-.>> x=[3.05,3.31,3.34,3.82,3.30,3.16,3.84,3.10,3.90,3.18,...3.88,3.22,3.28,3.34,3.62,3.28,3.30,3.22,3.54,3.30]; >> [h,p,ci,stats]=ttest(x,3.25,0.025,'right')h = 1 p = 0.0114ci = 3.2731 Infstats = tstat: 2.4763 df: 19 sd: 0.2691 (3) 问题结果:由于h = 1, 故接受10:H µµ>, 即认为全省当前的鸡蛋售价明显⾼于往年.3、[h,p,ci,stats] = ttest2(x,y,alpha,tail) 两⽅差相等但未知时, 对两个正态总体均值关系进⾏t 检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰112:H µµ≠ (缺省值) ; tail='right'表⽰112:H µµ>;tail= 'left'表⽰112:H µµ<. (原假设则为012:H µµ≥)·输出变量含义:stats 包含三个结果:tstat ——t统计量)X Y t =的值;df ——t 分布的⾃由度;sd——两样本的合并标准差w S =.【例3-3(1)】(书P 81例3.6) 某⼯⼚⽣产某种电器材料. 要检验原来使⽤的材料与⼀种新研制的材料的疲劳寿命有⽆显著性差异, 各取若⼲样品, 做疲劳寿命试验, 所得数据如下 (单位: ⼩时) :原材料: 40, 110, 150, 65, 90, 210, 270新材料: 60, 150, 220, 310, 380, 350, 250, 450, 110, 175⼀般认为, 材料的疲劳寿命服从对数正态分布, 并可以假定原材料疲劳寿命的对数ln X 与新材料疲劳寿命的对数ln Y 有相同的⽅差, 即可设21ln ~(,)X N µσ, 22ln ~(,)Y N µσ. 在显著性⽔平0.05α=下, 能否认为两种材料的疲劳寿命没有显著性差异? (1) 问题分析:设总体X ──原材料的疲劳寿命, 211ln ~(,)X N µσ;设总体Y ──新材料的疲劳寿命, 222ln ~(,)Y N µσ, 且22212σσσ==未知.今从两个总体中各抽得⼀样本, 本问题是检验假设: 012112:,:H H µµµµ=≠.(2) 问题求解:选取检验统计量X Y t =, 则0H 的拒绝域为112||(2)t t n n α->+-.>> x=[40,110,150,65,90,210,270];>> y=[60,150,220,310,380,350,250,450,110,175]; >> [h,p,ci,stats]=ttest2(log(x),log(y),0.05,'both')h = 0 p = 0.0626ci = -1.3095 0.0379stats = tstat: -2.0116 df: 15 sd: 0.6414 (3) 问题结果:由于h = 0, 故接受012:H µµ=, 即认为两种材料的疲劳寿命没有显著差异.【例3-3(2)】(浙⼤四版P 187例4) 做以下的实验以⽐较⼈对红光或绿光的反应时间(以s 计). 实验在点亮红光或绿光的同时, 启动计时器, 要求受试者见到红光或绿光点亮时, 就按下按钮, 切断计时器, 这就能测得反应时间. 测量的结果如下表:问能否认为⼈们对红光的反应要⽐绿光快? (显著性⽔平取0.05α=) (1) 问题分析(本题是配对数据检验):设(1,,8)i i i D X Y i =-= 是来⾃正态总体2(,)D D N µσ的样本, 2,D Dµσ均未知. 本问题是检验假设: 01:0,:0D D H H µµ≥<.(2) 问题求解:选取检验统计量D t =则0H 的拒绝域为1(1)t t n α->-.>> x=[0.30 0.23 0.41 0.53 0.24 0.36 0.38 0.51]; >> y=[0.43 0.32 0.58 0.46 0.27 0.41 0.38 0.61]; >> d=x-y; >> [h,p,ci,stats] = ttest(d,0,0.05,'left')h = 1 p = 0.0270ci = -Inf -0.0113stats = tstat: -2.3113 df: 7 sd: 0.0765 (3) 问题结果:由于h = 1, 故接受1:0D H µ<, 即认为⼈对红光的反应要⽐绿光快.4、[h,p,ci,stats] = vartest(x,sigma02,alpha,tail) 均值未知时, 对单正态总体⽅差进⾏2χ检验. 并可通过指定tail 的值来控制备择假设的类型. tail 的取值及表⽰意义如下: tail='both' 表⽰2210:H σσ≠ (缺省值) ; tail='right'表⽰2210:H σσ>;tail= 'left'表⽰2210:H σσ<. (原假设则为2200:H σσ≥)。

应用数理统计课程设计

应用数理统计课程设计

应用数理统计课程设计简介应用数理统计是一门集数学、统计学、计算机科学和应用领域的交叉学科,为各类学科和领域提供可靠的数据分析、决策支持和信息掌控能力。

在该课程设计中,我们将学习如何利用统计学方法和技术分析数据,建立模型,并应用于实际问题中。

设计目标本次课程设计旨在让学生:1.掌握常见的统计方法和模型,如回归分析、方差分析等;2.学会使用统计软件工具(如SPSS)来进行数据分析;3.能够将统计分析应用于实际问题中,解决实际需求。

课程内容和进度本课程设计将包括以下内容:1.基本统计概念和原理;2.假设检验和置信区间;3.平均数、方差、标准差、相关系数与回归分析;4.方差分析;5.数据可视化和描述性统计。

课程进度安排如下:教学内容学时数基本统计概念和原理 4假设检验和置信区间 4平均数、方差、标准差、相关系数与回归分析 6方差分析 4数据可视化和描述性统计 6课程设计课程设计的重点是如何将所学的统计学知识应用到实际问题中。

以下是本课程设计中的两个重要项目:项目一:影响服装销量的因素分析我们以一家服装店为例,利用SPSS软件对该店近期的销售数据进行分析,找出影响服装销售的因素,并建立回归模型。

具体步骤如下:1.收集该店近期的销售数据和各项产品信息;2.对销售数据进行数据清洗和预处理,如去掉无效数据、处理缺失数据、将数值型数据转化成标称型数据等;3.利用SPSS软件进行数据分析和建模,选择适当的统计方法和模型,进行分析,找出影响销售的重要因素;4.建立回归模型,预测未来的销售情况。

项目二:医学研究中的数据分析我们以某医学研究为例,探究药物对人体生理指标的影响,分析实验中的数据,并建立相应的统计模型。

具体步骤如下:1.收集研究数据,如生理指标测量数据、样本信息等;2.对数据进行清洗和预处理,去掉无效数据、处理缺失数据、将数值型数据转化成标称型数据等;3.利用SPSS软件进行数据分析和建模,选择适当的统计方法和模型,进行分析;4.根据分析结果对药物对患者生理指标的影响进行评估和预测。

应用数理统计(中国矿业大学)2012年卷

应用数理统计(中国矿业大学)2012年卷



( 87.80, 278.69) ≈ (9.37, 16.69).
(2分)
√ 三:(15分) 设炮弹着落点 (x, y) 离目标 (原点) 的距离为 z = x2 + y2 , 若设 x 和 y 为独立同分布的随机变量, 其共同分布为 N (0, σ2) ,可得 z 的分布密度为:
z
z2
p(z) = σ2 exp(− 2σ2 ),
H0 : P (Ai) = 1/6 i = 1, 2, · · ·, 6.
(2分) 因为分布不含未知参数, 又 k = 6, α = 0.05, 查表可得 χ2α(k − 1) = χ20.05(5) = 11.07. 又
χ2 = ∑6 (fi − npi)2 = 4.4 < 11.07.
i=1
npi
z > 0,
这个分布称为瑞利分布. (1): 设 z1, z2, · · ·, zn 为来自上述瑞利分布的一个样本, 求 σ2 的极大似然估计, 证明它是 σ2 的无偏估计; (2): 求瑞利分布中 σ2 的费希尔信息量 I(σ2).
解:(1): 易知 z1, z2, · · ·, zn 的似然函数为
1dy = 1 − e−z/2.
e−z/2
e−z/2
6
所以 Z = −2 ln Y 的密度函数为
fZ (z)
=
FZ′ (z)
=
1 e−z/2, y 2
>
0,
fZ(z) = 0,
z≤0
(8分)
又 Γ(1) = 1, 2, · · ·, n
F= Y /m
服从自由度为 (n, m) 的 F 分布, 记为 F ∼ F (n, m).
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生“应用数理统计”课程课外作业
一、说明
(一)课外作业要求
请同学们结合现实生活或专业背景,说明参数估计、假设检验、回归分析、方差分析、正交设计(这些方法中至少选择一个)的应用。

要求由同学们自行提出问题、搜集数据(指出数据来源或提供原始数据)和假设条件,建立模型,并运用统计分析方法和统计分析软件进行模型求解,对计算结果进行说明和解释。

请注意,不能复制现有成果,同学之间也不能相互复制。

(二)课外作业评价标准
以问题表述的清晰性、条件假设的合理性、建模的科学性和创造性、模型表达的正确性、计算方法选择的合理性、结果的正确性和文字表述的清晰程度、格式的规范性(科研论文格式规范)为主要标准。

(三)课外作业表现形式——报告
包括报告题目、摘要、正文、参考文献和附录五个部分。

正文内容应包括问题描述、数据描述、模型建立、求解和检验、模型结果分析等内容。

报告用Word 文本格式,中文字使用宋体、小四号字,英文用Times New Roman字体5 号字,数学符号用MathType 输入。

(论文题目用小三号黑体,正文章节标题用四号黑体,各子标题用小四号黑体)参考文献格式如:
[1] 作者,书籍名称,出版社,出版地,出版年月
[2] 作者,文章名称,期刊名称,卷,页数,年份
(四)课外作业提交形式和时间
用A4纸打印出来,具体提交方式与时间:
提交时间14周星期五(纸质),
地点:在答疑教室(授课老师通知)。

,电子稿以邮件的形式发送至我的邮箱:xia_xiao_chao@,(14周周五晚上12点截止),包括论文、数据表格、软件运行程序、图表(一起打包压缩),注意:交的纸质报告与电子报告必须一致!如果有出入作为抄袭处理!
二、报告基本格式如下
(报告封面)
重庆大学《应用数理统计》课程课外报告
学号:
姓名:
学院:
专业:
成绩:日期:年月日
题目
摘要(四号黑体):(200-400字)
(摘要内容:小四号宋体)
正文
一、问题提出,问题分析。

(四号黑体)
内容(小四号宋体)
二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据)(四号黑体)
内容(小四号宋体)
三、模型建立:(四号黑体)
(1)提出假设条件,明确概念,引进参数;
内容(小四号宋体)
(2)模型构建;
内容(小四号宋体)
(3)模型求解。

内容(小四号宋体)、
四、计算方法设计和计算机实现。

(四号黑体)
内容(小四号宋体)
五、主要的结论或发现。

(四号黑体)
内容(小四号宋体)
六、结果分析与检验。

(四号黑体)
内容(小四号宋体)
参考资料(四号黑体)
内容(小四号宋体)
附录(四号黑体)
内容(中文小四号宋体),英文、数字小四号Times New Roman字体。

相关文档
最新文档