研究生数理统计之回归分析

研究生数理统计之回归分析
研究生数理统计之回归分析

硕士生《数理统计》例题及答案

《数理统计》例题 1.设总体X 的概率密度函数为: 2 2 1)(ββ x e x f -= )0(>β 试用矩法和极大似然法估计其中的未知参数β。 解:(1)矩法 由于EX 为0, πβββββ βββββββ2 00 2 2 2 22 2 1][) ()2 (2) ()2(21 2)(2 2 2 2 2 2 2 2 2 2 = +-=- =- - ===???? ?∞ +-∞+- ∞ +- - ∞ +- ∞ ++∞ ∞ -dx e xe e d x x d xe dx e x dx x f x EX x x x x x πβ2 222 1= -=X E EX DX 令2S DX =得:S π β2 ?= (2)极大似然法 ∑= ==- =- ∏ n i i i x n n i x e e L 1 2 22 2 1 11 1 β ββ β ∑=- -=n i i x n L 1 22 1 ln ln ββ 2 31 ln 2n i i d L n x d βββ==-+∑ 令0ln =β d L d 得∑==n i i x n 1 2 2?β

2. 设总体X 的概率密度函数为: ?? ???<≥--=αα βαββαφx x x x ,0),/)(exp(1 ),;( 其中β>0,现从总体X 中抽取一组样本,其观测值为(2.21,2.23,2.25,2.16,2.14,2.25,2.22,2.12,2.05,2.13)。试分别用矩法和极大似然法估计其未知参数βα和。 解:(1)矩法 经统计得:063.0,176.2==S X β αβαβ φα β α α β ααβ α β α α β α α +=-=+-=-===∞ +-- ∞ +-- ∞ +-- -- ∞ +-- ∞ +∞ +∞-?? ? ?x x x x x e dx e xe e xd dx e x dx x x EX ][) (1 )( ) (222][) (1 222 22 2βαβαβαβ β α α αβ α β α α β α α ++=+=+-=-==--∞ +∞ +-- --∞ +-- ∞ +?? ?EX dx e x e x e d x dx e x EX x x x x 222)(β=-=EX EX DX 令???==2S DX X EX 即???==+2 2S X ββα 故063.0?,116.2?===-=S S X βα (2)极大似然法 ) (1 1 1),;(αβ β α β β βα---- == =∏X n n X n i e e x L i )(ln ln αβ β-- -=X n n L )(ln ,0ln 2αβ βββα-+-=??>=??X n n L n L 因为lnL 是L 的增函数,又12,,,n X X X α≥L 所以05.2?)1(==X α

概率论与数理统计总复习 公式概念定理

概率论与数理统计总复习 第一章 概率论的基本概念 1. 事件的关系及运算 互不相容事件:AB =Φ 即A,B 不能同时发生。 对立事件:A B =ΩU 且AB =Φ 即A B B ==Ω- 差事件:A B - 即 A 发生但B 不发生的事件 切记: ()A B AB A AB A B B -==-=-U 2. 概率的性质 单 调 性 : 若 B A ?,则 )()()(A P B P A B P -=- 加法定理:)()()() (AB P B P A P B A P -+=Y )()()()()(AB P C P B P A P C B A P -++=Y Y )()()(ABC P CA P BC P +-- 例1 设 ,,()0.7,()0.4,A C B C P A P A C ??=-= ()0.5P AB =,求()P AB C -。 解:()()()P A C P A P AC -=- ()()P A P C =- (AC C =Q ) 故 ()()()0.70.40.3P C P A P A C =--=-= 由此 ()()()P AB C P AB P ABC -= - ()()P AB P C =- (ABC C =Q ) 0.50.30.2=-=

注:求事件的概率严禁画文氏图说明,一定要用概率的性质 计算。 3. 条件概率与三个重要公式 乘法公式 全概率公式 1()()(/)n i i i P A P B P A B ==∑ 贝叶斯公式(求事后概率) 例2、(10分)盒中有6个新乒乓球,每次比赛从其中任取两个球来用,赛后仍放回盒中,求第三次取得两个新球的概率。 解:设A i ——第2次摸出i 个新球(i =0,1,2), B ——第3次摸出两个新球 ∵ A 0,A 1,A 2构成Ω的一个划分 ∴ 由全概率公式 其中 故 ; )/()()(A B P A P AB P =()(/) (/)() i i i P B P A B P B A P A = 2 ()()(|) k k k P B P A P B A ==∑201102 244224012222 666186(),()()151515C C C C C C P A P A P A C C C ======202002 334242012222 666631 (|)(|)(|)151515 C C C C C C P B A P B A P B A C C C ======4 ()0.16 25 P B ==

数理统计课程设计一元线性回归

二氧化碳吸附量与活性炭孔隙结构的线性回归分析 摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。选取分布大致呈直线的一组数据为拟合的样本数据.对样本数据利用最小二乘法进行回归分析,参数确定,并对分析结果进行显著性检验。同时利用ma tl ab 的r egress 函数进行直线拟合。结果表明:孔径在3。 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。 关键字:活性炭 孔容 CO2吸附量 m atla b 一、问题分析 1。1.数据的收集和处理 本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴张双全,罗雪岭等人的研究成果[1]。以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的C O2吸附量和孔容的关系.数据如下表所示: 表1:孔分布与CO2吸附值 编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。因为处理方式不同得到不同结果是互不影响的,可以看出C O2的吸附量的值是互相独立 编号 孔容/(11 10L g μ--?) CO 2吸附 量 1/()mL g -? 0。5~0。8nm 0.8~1.2nm 1。2~1。8nm 1.8~2。2nm 2.2~2。2n m 2。5~3。0nm 3.0~3。5 nm 1 7.18 16.2 24.4 75.2 70 96 115 64 2 6.59 14.4 18.4 53.7 50 85。6 91 55.1 3 4.5 4 11 18.9 71 6 5 78.3 91 53.7 4 5.13 13.4 29。9 10。3 90 7 6 122 53。 7 5 4.16 10.5 18。9 83.8 78 80。5 113 61。7 6 4。92 12。1 23.4 81.6 72 56 99 53.6 7 5.0 8 12.6 23.8 93.5 86 77.8 122 65。5 8 5.29 13 25。1 88.4 69 66.4 107 57。7 9 7.47 16.9 26.9 46。4 78 93.2 107 58.2 10 5.44 13 21.4 44.1 91 98.6 137 76。6 11 1。81 64。6 18.3 53.1 114 110 142 75 12 1.24 27.7 39。5 126 114 98。6 183 98.7

概率论与数理统计公式表

第1章随机事件及其概率 (1)排列组合公式 )! ( ! n m m P n m- =从m个人中挑出n个人进行排列的可能数。 )! (! ! n m n m C n m- =从m个人中挑出n个人进行组合的可能数。 (2)加法和乘法原理加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。 (3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个) 顺序问题 (4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 (5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用ω来表示。 基本事件的全体,称为试验的样本空间,用Ω表示。 一个事件就是由Ω中的部分点(基本事件ω)组成的集合。通常用大写字母A,B,C,…表示事件,它们是Ω的子集。 Ω为必然事件,?为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 (6)事件的关系与运算①关系: 如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):B A? 如果同时有B A?,A B?,则称事件A与事件B等价,或称A等于B:A=B。 A、B中至少有一个发生的事件:A B,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者B A,它表示A发生而B不发生的事件。 A、B同时发生:A B,或者AB。A B=?,则表示A与B不可能同时发生,称事件A与事件B 互不相容或者互斥。基本事件是互不相容的。 Ω-A称为事件A的逆事件,或称A的对立事件,记为A。它表示A不发生的事件。互斥未必对立。 ②运算: 结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC) 德摩根率: ∞ = ∞ = = 1 1i i i i A A B A B A =,B A B A =

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

北航数理统计回归分析大作业

应用数理统计第一次大作业 学号: 姓名: 班级: 2013年12月

国家财政收入的多元线性回归模型 摘 要 本文以多元线性回归为出发点,选取我国自1990至2008年连续19年的财政收入为因变量,初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的“最优”回归方程: 46?578.4790.1990.733y x x =++ 从而得出了结论,最后我们用2009年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。 关键词:多元线性回归,逐步回归法,财政收入,SPSS 0符号说明 变 量 符号 财政收入 Y 工 业 X 1 农 业 X 2 受灾面积 X 3 建 筑 业 X 4 人 口 X 5 商品销售额 X 6

进出口总额X7

1 引言 中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。 国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,批发和零售贸易餐饮业,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。 2解决问题的方法和计算结果 2.1 样本数据的选取与整理 本文在进行统计时,查阅《中国统计年鉴2010》中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上

(完整word版)西安交通大学数理统计研究生试题

2009(上)《数理统计》考试题(A 卷)及参考解答 一、填空题(每小题3分,共15分) 1,设总体X 和Y 相互独立,且都服从正态分布2 (0,3)N ,而12 9(,,)X X X 和 129(,,)Y Y Y 是分别来自X 和Y 的样本,则U = 服从的分布是_______ . 解:(9)t . 2,设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 3,“两个总体相等性检验”的方法有_______ 与____ ___. 解:秩和检验、游程总数检验. 4,单因素试验方差分析的数学模型含有的三个基本假定是_______ . 解:正态性、方差齐性、独立性. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计是?β=_______ . 解:1?-''X Y β= ()X X . 二、单项选择题(每小题3分,共15分) 1,设12(,, ,)(2)n X X X n ≥为来自总体(0,1)N 的一个样本,X 为样本均值,2S 为 样本方差,则____D___ . (A )(0,1)nX N ; (B )22()nS n χ; (C ) (1)()n X t n S -; (D ) 2 122 (1)(1,1)n i i n X F n X =--∑. 2,若总体2(,)X N μσ,其中2σ已知,当置信度1α-保持不变时,如果样本容量 n 增大,则μ的置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,分别用α,β表示犯第一类错误和第二类错误的概率,则当样本容量n 一定时,下列说法中正确的是____C___ . (A )α减小时β也减小; (B )α增大时β也增大;

北航应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β 的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

数理统计-回归分析

国家财政收入的逐步回归分析应用数理统计课程论文 2012届材料科学与工程学院 学号 姓名

2012年11月18日

摘要 财政作为一国政府的活动,是政府职能的具体体现,主要有资源配置、收入再分配和宏观经济调控三大职能。财政收入是政府部门公共收入,是国民收入分配中用于保证政府行使其公共职能,实施公共政策以及提供公共服务的资金需求。财政收入的增长状况关系着一个国家经济的发展和社会的进步。本文选取了我国自1979至2010年间的财政收入数据,并选取了7个可能的影响因素,利用SPSS 统计软件,运用多元线性回归的逐步回归方法建立了国家财政收入的回归模型。得出了影响国家财政收入的显著性变量,并将所得到的模型给予了合理的经济解释。 关键词:财政收入 SPSS 回归分析

目录 1.引言 (1) 1.1 理论回归方程 (1) 1.2研究意义 (1) 1.3 研究内容及方法 (1) 2.数据统计 (2) 2.1 数据的收集 (2) 2.2 散点图 (3) 2.3 逐步回归分析 (5) 3. 结论和讨论 (8) 3.1 结论 (8) 3.2 讨论 (8) 参考文献 (9)

1.引言 1.1 理论回归方程 Y=β0+β1X1+β2X2+……+βp X p +ε E (ε) =0, Var (ε) =σ2 式中,β0,β1,β2,……βp,σ2是与X1,X2,……X p无关的未知参数 ε是不可观测的随机变量。 1.2研究意义 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。财政收入对国民经济的运行及社会发展具有重要影响。 1.3 研究内容及方法 影响财政收入的因素有很多,如工业总产值、农业总产值、建筑业总产值、社会消费品零售总额等。如何找到影响财政总收入的各个因素,并建立它们与财政收入的数学模型是十分必要的。基于此目的,本文从国家统计信息网上选取了1997-2010年间的年度财政收入及主要影响因素的数据,包括工业总产值、农业总产值、建筑业总产值、社会消费品零售总额等,并进一步采用多元逐步回归分析方法对以上因素进行了显著性分析,从而确定了关于财政收入的最优多元线型回归方程。

数理统计考研复试题库及答案

2(1)未知函数u 的导数最高阶为2,u ``,u `,u 均为一次,所以它是二阶线性方程。 (2) 为y 最高阶导数为1,而y 2为二次,故它是一阶非线性常微分方程。 (3) 果y 是未知函数,它是一阶线性方程;如果将x 看着未知函数,它是一阶非线 性方程。 3. 提示:所满足的方程为y ``-2 y `+y=0 4. 直接代入方程,并计算Jacobi 行列式。 5.方程变形为dy=2xdx=d(x 2),故y= x 2+C 6. 微分方程求解时,都与一定的积分运算相联系。因此,把求解一个微分方程的过程称为一个微分方程。微分方程的解又称为(一个)积分。 7. 把微分方程的通解用初等函数或通过它们的积分来表达的方法。注意如果通解能归结为初等函数的积分表达,但这个积分如果不能用初等函数表示出来,我们也认为求解了这个微分方程,因为这个式子里没有未知函数的导数或微分。 8. y `=f(x,y)主要特征是f(x,y)能分解为两个因式的乘积,其中一个因式仅含有x,另一因式仅含y ,而方程p(x,y)dx+q(x,y)dy=0是可分离变量方程的主要特征,就像f(x,y)一样,p,q 分别都能分解成两个因式和乘积。 9 (1) 积分得x=-cosx+c (2) 将方程变形为x 2 y 2 dy=(y-1)dx 或1-y y 2=2x dx ,当xy ≠0,y ≠1时积分得 22x +y+ln 1-y +x 1=c (3)方程变形为 y dy +1=x x sin cos dx,当y ≠-1,sinx ≠0时积分得 y=Csinx-1 (4)方程变形为 exp(y)dy=exp(2x)dx,积分得 exp(y)= 2 1 exp(2x)+C (5)当y ≠±1时,求得通积分ln 1 1 +-y y =x+c (6)方程化为 x 2 ydx=(1- y 2 )(1+x 2 )dx 或2 2 1x x +dx=y y 21-dy,积分得 x -arctgx -ln y + 2 1y 2 =C

概率论与数理统计公式集合

概率论与数理统计必考知识点 一、随机事件和概率 1、随机事件及其概率 运算律名称 表达式 交换律 A B B A +=+ BA AB = 结合律 C B A C B A C B A ++=++=++)()( ABC BC A C AB ==)()( 分配律 AC AB C B A ±=±)( ) )(()(C A B A BC A ++=+ 德摩根律 B A B A =+ B A A B += 2、概率的定义及其计算 公式名称 公式表达式 求逆公式 ) (1)(A P A P -= 加法公式 ) ()()()(AB P B P A P B A P -+=+ 条件概率公式 ) () ()(A P AB P A B P = 乘法公式 ) ()()(A B P A P AB P = )()()(B A P B P AB P = 全概率公式 ∑== n i i i A B P A P B P 1 )()()( 贝叶斯公式 (逆概率公式) ∑∞ == 1 ) ()() ()()(i i j j j j A B P A P A B P A P B A P 伯努利概型公式 n k p p C k P k n k k n n ,1,0,)1()(=-=- 两件事件相互独立相 应公式 ) ()()(B P A P AB P =;)()(B P A B P =;)()(A B P A B P =;1)()(=+A B P A B P ; 1)()(=+A B P A B P

二、随机变量及其分布 1、分布函数性质 )()(b F b X P =≤ )()()(a F b F b X a P -=≤< 2、离散型随机变量 分布名称 分布律 0–1分布),1(p B 1 ,0,)1()(1=-==-k p p k X P k k 二项分布),(p n B n k p p C k X P k n k k n ,,1,0,)1()( =-==- 泊松分布)(λP ,2,1,0,! )(===-k k e k X P k λλ 几何分布)(p G ,2,1,0, )1()(1=-==-k p p k X P k 超几何分布),,(n M N H ) ,min(,,1,,)(M n l l k C C C k X P n N k n M N k M +== =-- 3、连续型随机变量 分布名称 密度函数 分布函数 均匀分布),(b a U ?? ???<<-=其他,0,1 )(b x a a b x f ?? ? ????≥<≤--<=b x b x a a b a x a x x F ,1,,0)( 指数分布)(λE ???? ?>=-其他, 00 ,)(x e x f x λλ ? ??≥-<=-0,10, 0)(x e x x F x λ 正态分布),(2σμN +∞<<∞-= -- x e x f x 2 2 2)(21)(σμσ π ?∞ --- = x t t e x F d 21 )(2 22)(σμσπ 标准正态分布)1,0(N +∞<<∞-=- x e x x 2 221)(π ? ?∞ --- = x t t e x F d 21)(2 22)(σμσπ

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1 三因子多水平实验方案

概率论与数理统计 重要公式

一、随机事件与概率 公式名称 公式表达式 德摩根公式 B A B A =,B A B A = 古典概型 ()m A P A n = =包含的基本事件数基本事件总数 几何概型 () ()()A P A μμ= Ω,其中μ为几何度量(长度、面积、体积) 求逆公式 )(1)(A P A P -= 加法公式 P(A ∪B)= P(A+B)=P(A)+P(B)-P(AB) 当P(AB)=0(A 、B 互斥)时,P(A ∪B)=P(A)+P(B) 减法公式 P(A-B)=P(A)-P(AB),B A ?时P(A-B)=P(A)-P(B) 条件概率公式 乘法公式 )() ()(A P AB P A B P = ()()()()()P AB P A P B A P B P A B == ()()()()P ABC P A P B A P C AB = 全概率公式 1 ()()()n i i i P A P B P A B ==∑ 从原因计算结果 贝叶斯公式 (逆概率公式) 1 ()() ()()() i i i n i i i P B P A B P B A P B P A B == ∑ 从结果找原因 两个事件 相互独立 ()()()P AB P A P B =;()()P B A P B =;)()(A B P A B P =;

二、随机变量及其分布 1、分布函数 ()()(),()()() ()k k x x x P X x F x P X x P a X b F b F a f t dt ≤-∞ ?=?=≤=<≤=-???∑? 概率密度函数 计算概率: 2、离散型随机变量及其分布 分布名称 分布律 0-1分布 X ~b(1,p) 1,0,)1()(1=-==-k p p k X P k k 二项分布(贝努利分布) X ~B(n,p) n k p p C k X P k n k k n ,,1,0,)1()( =-==- 泊松分布 X ~p(λ) (),0,1,2,! k P X k e k k λλ-== = 3、续型型随机变量及其分布 分布名称 密度函数 分布函数 均匀分布 x ~U(a,b) ?? ?? ?<<-=其他,0,1 )(b x a a b x f 0, (),1, =-0 , 00,)(x x e x f x λλ ???? ?≤>-=-0 , 00 , 1)(x x e x F x λ 正态分布 x ~N(2,σμ) 2 2 ()21()2μσπσ -- = -∞<<+∞ x f x e x 22 ()21 ()d 2μσπσ -- -∞ = ?t x F x e t 标准正态分布 x ~N(0,1) 2 2 1()2?π - = -∞<<+∞ x x e x 212 1 ()2t x x e dt π --∞ Φ= ? 1 )(=? +∞ ∞ -dx x f ?=≤≤b a dx x f b X a P )()(

研究生数理统计第三章习题答案

习 题 三 1.正常情况下,某炼铁炉的铁水含碳量( )2 4.55,0.108 X N .现在测试了5炉铁水,其含 碳量分别为4.28,4.40,4.42,4.35,4.37.如果方差没有改变,问总体的均值有无显著变化?如果均值没有改变,问总体方差是否有显著变化()0.05α=? 解 由题意知,()2 4.55,0.108X N ,5n =,5 1 1 4.3645i i x x ===∑,0.05α=, ()52 2 01 10.095265i i s x μ==-=∑. 1)当00.108σ=已知时, ①设统计假设0010: 4.55,: 4.55H H μμμμ==≠=. ②当0.05α=时,0.97512 1.96u u α - ==,临界值12 0.108 1.960.09475 c u n ασ - = = ?=, 拒绝域为000{}{0.0947}K x c x μμ=->=->. ③004.364 4.550.186x K μ-=-=∈,所以拒绝0H ,接受1H ,即认为当方差没有改变时,总体的均值有显著变化. 2)当0 4.55μ=已知时, ①设统计假设2 2 2 2 2 2 0010:0.108,:0.108H H σσσσ==≠=. ②当0.05α=时,临界值 ()()()()222210.02520.975122 111150.1662,5 2.566655c n c n n n ααχχχχ-= =====, 拒绝域为2 2 2 2 0212 2 2 2 0000{ }{ 2.56660.1662}s s s s K c c σσσσ=><=><或 或 . ③ 2 02 2 00.09526 8.16700.108 s K σ= =∈,所以拒绝0H ,接受1H ,即均值没有改变时,总体方差有显著变化. 2.一种电子元件,要求其寿命不得低于1000h .现抽取25件,得其均值950x h =.已知该种元件寿命( )2 ,100 X N μ ,问这批元件是否合格()0.05α=?

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

应用数理统计习题答案 西安交大 施雨

应用数理统计答案 学号: 姓名: 班级:

目录 第一章数理统计的基本概念 (2) 第二章参数估计 (14) 第三章假设检验 (24) 第四章方差分析与正交试验设计 (29) 第五章回归分析 (32) 第六章统计决策与贝叶斯推断 (35) 对应书目:《应用数理统计》施雨著西安交通大学出版社

第一章 数理统计的基本概念 1.1 解:∵ 2 (,)X N μσ ∴ 2 (,)n X N σμ ∴ (0,1)N 分布 ∴(1)0.95P X P μ-<=<= 又∵ 查表可得0.025 1.96u = ∴ 2 2 1.96n σ= 1.2 解:(1) ∵ (0.0015)X Exp ∴ 每个元件至800个小时没有失效的概率为: 800 0.00150 1.2 (800)1(800) 10.0015x P X P X e dx e -->==-<=-=? ∴ 6个元件都没失效的概率为: 1.267.2 ()P e e --== (2) ∵ (0.0015)X Exp ∴ 每个元件至3000个小时失效的概率为: 3000 0.00150 4.5 (3000)0.00151x P X e dx e --<===-? ∴ 6个元件没失效的概率为: 4.56 (1)P e -=- 1.4 解:

i n i n x n x e x x x P n i i 1 2 2 )(ln 2121)2(),.....,(1 22 =-- ∏∑ = =πσμσ 1.5证: 2 1 1 2 2)(na a x n x a x n i n i i i +-=-∑∑== ∑∑∑===-+-=+-+-=n i i n i i n i i a x n x x na a x n x x x x 1 2 2 2 2 11) ()(222 a) 证: ) (1111 1+=+++=∑n n i i n x x n x ) (1 1 )(1 1 11n n n n n x x n x x x n n -++=++=++

北航数理统计回归分析大作业

数理统计(课程大作业1) 逐步回归分析 学院:机械工程学院 专业:材料加工工程 日期:2014年12月7日

摘要:本文介绍多元线性回归分析方法以及逐步回归法,然后结合实际,以我国1995-2012年的财政收入为因变量,选取了8个可能的影响因素,选用逐步回归法对各影响因素进行了筛选分析,最终确定了其“最优”回归方程。 关键字:多元线性回归 逐步回归法 财政收入 SPSS 1 引言 自然界中任何事物都是普遍联系的,客观事物之间往往都存在着某种程度的关联关系。为了研究变量之间的相关关系,人们常用回归分析的方法,而回归分析是数理统计中一种常用方法。数理统计作为一种实用有效的工具,广泛应用于国民经济的各个方面,在解决实际问题中发挥了巨大的作用,是一种理论联系实践、指导实践的科学方法。 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。 本文将以回归分析为方法,运用数理统计工具探求财政收入与各种统计指标之间的关系,总结主要影响因素,并对其作用、前景进行分析和展望。 2 多元线性回归 2.1 多元线性回归简介 在实际问题中,某一因素的变化往往受到许多因素的影响,多元回归分析的任务就是要找出这些因素之间的某种联系。由于许多非线性的情形都可以通过变换转化为线性回归来处理,因此,一般的实际问题都是基于多元线性回归问题进行处理的。对多元线性回归模型简要介绍如下: 如果随机变量y 与m )2(≥m 个普通变量m x x x 21,有关,且满足关系式: εββββ++++=m m x x x y 22110 2,0σεε==D E (2.1) 其中,2210,,,σββββm 是与m x x x 21,无关的未知参数,ε是不可观测的随机变量,),0(~2N I N σε。

相关文档
最新文档