数理统计基础知识

数理统计期末复习题1

2009期末复习题 注:这份答案是在2009年最后一晚做出来的,时间比较紧,所以可能有些地方不严谨,有什么错误还请各位多包涵。 处理一个问题有很多合理的办法,这份答案所列出的只不过代表个人的想法,仅供参考。 这份答案算是送大家的新年礼物吧,预祝大家期末考试顺利,一年都有好运 孟帅 1. 设随机变量X 和Y 相互独立,且都服从正态分布N(0,32),而 921,,,X X X 和921,,,Y Y Y 分别是来自总体X 和Y 的样本,则统计量U = 29 22 21 921Y Y Y X X X ++++++ 服从什么分布?为什么? 解:分子分母同除以9得到 服从N (0,1), 服从X 2(9)分布,因此U 服从 t (9)分布(课本92页) 2.某大学来自A,B 两市的新生中分别抽取10名和11名男生调查身 高,测得他们的身高分别为cm x 176=,cm y 172=,样本方差分别为3.1121=S , 1.92 2=S 。不妨设两个城市的男生的身高分别服从正态分布),(2 1σμN 和 ),(22σμN ,求21μμ-的 95%的置信区间,并请在0.05水平下判断两个城 市的男生身高是否相等? 解: 但是 未知,构造111页) 9 1i X ∑9119i i X =∑ 92 1 3 i i Y =()∑ 22 212σ=σ=σ2σ1 2 X Y --μ-μ

。 =10, =11, =11.3, =9.1, =176, =172。代入T 表达式得到 T= 。 T 服从t ( + -2)查附表7得到 =2.093 得到 的置信区间为: (1.088,6.912) 这个区间不包含0,可以直接判定在0.05水平下两城市男生身 高不相等。如果想严谨一点就在进行假设检验: 原假设:两城市男生身高相等;备择:两城市男生身高不等。 检验统计量 ,和 比较。 如果T 大于 ,拒绝原假设,否则接受。 3.随机调查了某校200名沙眼患者,经用某种疗法治疗一定时期后治愈168人,试求总体治愈率的95%置信区间。 解:样本率p=0.84,用大样本正态近似法求解,置信区间为: ( , )(课本115页) S ω1n 2n 21 S 22 S X Y 1n 2 n ()1241.3915 -μ-μ() 12μ-μ()2 19t 0.05X Y -()219t 0.05() 2 19t 0.052 p u α-2 p u α+

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

数理统计的基础知识

第五章数理统计的基础知识 在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。 但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。 例如:1、某种电子元件的寿命服从什么分布是完全不知道的。 2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0-1) 分布,但其中的参数p未知。 对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。 数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。 数理统计研究的内容非常广泛,可分为两大类: 一是:怎样有效地收集、整理有限的数据资料。 二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。 第一节数理统计的基本概念 一、总体与总体的分布 在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。总体中所包含的个体的个数称为总体的容量.容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系. 在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X。 例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。 但在实际问题中,我们仅仅关心灯泡的使用寿命(记X表示该批灯泡的寿命)。则X就是我们研究的总体(所有灯泡寿命的集合),每一个灯泡的寿命就是一个个体。 再如:考查某一群体的身高和体重,则全体人员的(身高、体重)是总体,每个人的身高和体重是个体。 由此给出定义: 总体:对所研究对象的某些指标进行试验,将试验的全部可能的观测值称为总体记为X。 个体:每一个可能的观测值称为个体。 对不同的个体,X的取值一般是不同的。例如在试验中观察若干个个体就会得到X的一种数值,但在试验或观察之前,无法确定会得到一组什么样的数值,所以X是一个随机变量或随机向量,而X的分布也就完全描述了我们所关心的指标,即总体的分布。 为方便起见,以后我们将X的可能取值的全体组成的集合称为总体,或直接称随机变量X为总体,X的分布也就是总体的分布。 例如:正态总体:是指表示总体某个数量指标的随机变量服从正态分布。 【注1】总体的分布一般情况下是未知的,这就需要利用总体中部分个体的数据资料来

北航应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β 的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

第六章数理统计学的基本概念

第六章数理统计的基本概念 一、教学要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、主要内容 1.总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2.简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。 如果样本()满足 (1)相互独立; (2) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本()的联合概率

函数(联合密度函数为)

3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X 的 一个样本,是一个n 元函数,如果中不含任何总体的未知参数,则称 为一个统计量,经过抽样后得到一组样本观测值 ,则称 为统计量观测值或统计量值。 4. 常用统计量 (1)样本均值: (2)样本方差: (3)样本标准差: 它们的观察值分别为: 这些观察值仍分别称为样本均值、样本方差和样本标准差。 (4)样本(k 阶)原点矩 1 1,1,2,n k k i i A X k n ===∑L (5)样本(k 阶)中心矩 1 1(),2,3,n k k i i B X X k n ==-=∑L 其中样本二阶中心矩21 1(),n k i i B X X n ==-∑又称为未修正样本方差。 (6)顺序统计量 将样本中的各个分量由小到大的重排成 (1)(2)()n X X X ≤≤≤L 则称(1)(2)(),,n X X X L 为样本顺序统计量,()(1)n X X -为样本的极差。 (7)样本相关系数: 1 1 2 211 ()()()() 11()()n n i i i i i i xy n n x y i i i i x x y y x x y y r S S x x y y n n ====----= = --∑∑∑∑

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显着影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显着性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显着性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显着水平下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一

应用数理统计习题答案 西安交大 施雨

应用数理统计答案 学号: 姓名: 班级:

目录 第一章数理统计的基本概念 (2) 第二章参数估计 (14) 第三章假设检验 (24) 第四章方差分析与正交试验设计 (29) 第五章回归分析 (32) 第六章统计决策与贝叶斯推断 (35) 对应书目:《应用数理统计》施雨著西安交通大学出版社

第一章 数理统计的基本概念 1.1 解:∵ 2 (,)X N μσ ∴ 2 (,)n X N σμ ∴ (0,1)N 分布 ∴(1)0.95P X P μ-<=<= 又∵ 查表可得0.025 1.96u = ∴ 2 2 1.96n σ= 1.2 解:(1) ∵ (0.0015)X Exp ∴ 每个元件至800个小时没有失效的概率为: 800 0.00150 1.2 (800)1(800) 10.0015x P X P X e dx e -->==-<=-=? ∴ 6个元件都没失效的概率为: 1.267.2 ()P e e --== (2) ∵ (0.0015)X Exp ∴ 每个元件至3000个小时失效的概率为: 3000 0.00150 4.5 (3000)0.00151x P X e dx e --<===-? ∴ 6个元件没失效的概率为: 4.56 (1)P e -=- 1.4 解:

i n i n x n x e x x x P n i i 1 2 2 )(ln 2121)2(),.....,(1 22 =-- ∏∑ = =πσμσ 1.5证: 2 1 1 2 2)(na a x n x a x n i n i i i +-=-∑∑== ∑∑∑===-+-=+-+-=n i i n i i n i i a x n x x na a x n x x x x 1 2 2 2 2 11) ()(222 a) 证: ) (1111 1+=+++=∑n n i i n x x n x ) (1 1 )(1 1 11n n n n n x x n x x x n n -++=++=++

1-数理统计基础

1、数理统计基础 1.1 随机变量 1.1.1随机事件和概率 观测或试验的一种结果,称为一个事件。在一定条件下进行大量重复试验时,每次都发生的事件,称为必然事件(Ω);反之,每次都不发生的事件,称为不可能事件(Φ);有时发生有时不发生的事件,称为随机事件或偶然事件(A )。 随机事件的特点是在一次观测或试验中,它可能出现,也可能不出现,但在大量重复观测或试验中呈现统计规律性。用来描述事件发生可能性大小的量就是概率。 概率的统计定义是:在相同条件下进行n 次重复试验,事件A 发生了m 次,称m 为事件的频数,称m /n 为事件的频率。当n 足够大时,频率m /n 稳定地趋向于某一个常数p ,此常数p 称为事件A 的概率,记为)(A P =p ,即: )(A P =n m n ∞→lim =p (1.1) 即概率是频率的极限值。 由概率的定义可归纳出概率的三个基本性质: (1)必然事件Ω的概率等于1,即)(Ωp =1; (2)不可能事件Φ的概率等于0,即)(Φp =0; (3)任何事件的概率都介于0和1之间,即0≤)(A P ≤1。 小概率原理:当某一事件的概率非常接近于0时,说明这个事件在大量的试验中出现的概率非常小,这样的事件称为小概率事件。小概率事件虽然不是不可能事件,但在一次连续试验中出现的可能性很小,一般可以认为不会发生,此即为小概率原理。 概率的三个定理: (1)互补定理:某事件发生的概率与不发生的概率之和为1。当发生的概

率为p,则不发生的概率为1-p。全部基本事件之和为必然事件。 (2)加法定理:相互独立而又互不相容的各个事件,其概率等于它们分别 出现之和。例如,A 1,A 2 ,…A n 为相互独立而又互不相容的事件,其中任一事件 出现的概率为各个事件概率的总和,即 P(A)=P(A 1)+P(A 2 )+…+P(A n )=∑ = n i i A P 1 ) ((1.2) (3)乘法定理:相互独立的事件同时发生的概率是这些事件各自发生的概率的乘积,即 P(A 1A 2 …A n )=P(A 1 )P(A 2 )…P(A n )=∏ = n i i A P 1 ) ((1.3) 1.1.2 随机变量与分布函数 每次试验的结果可以用一个变量X的数值来表示,这个变量的取值随偶然因素而变化,但又遵从一定的概率分布规律,这种变量称为随机变量。 随机变量根据其取值的特征可以分为离散型随机变量和连续型随机变量。 离散型随机变量试验结果的可能值可以一一列举出来,即随机变量X可取的值是间断的、可数的。 连续型随机变量试验结果的可能值不能一一列举出来,即随机变量X可取的值是连续充满在一个区间的。 随机变量的特点是以一定的概率在一定的区间范围内取值,但并不是所有的观测值都能以一定的概率取某一固定值。因此人们关心的是随机变量在某一个区间取值的概率是多少?即P(a≤X≤b)=? 根据概率的加法定理,某随机变量X在区间[a,b]的取值概率为: P(a≤X≤b)=P(X<b)-P(X<a)显然只要求出P(X<b)和P(X<a)即可,这比求出P(a≤X≤b)简单得多。 对于任何实数x,事件(X<x)的概率当然是x的函数,令F(x)=P(X <x)表示(X<x)的概率,并定义F(x)为随机变量X的概率分布函数,

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1 三因子多水平实验方案

2009(上)《数理统计》考试题(A卷)及参考解答

2009(上)《数理统计》考试题(A 卷)及参考解答 一、填空题(每小题3分,共15分) 1,设总体X 和Y 相互独立,且都服从正态分布2(0,3)N ,而129(,,)X X X 和129(,,)Y Y Y 是分别来自X 和Y 的样本,则U = 服从的分布是_______ . 解:(9)t . 2,设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2 ?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 3,“两个总体相等性检验”的方法有_______ 与____ ___. 解:秩和检验、游程总数检验. 4,单因素试验方差分析的数学模型含有的三个基本假定是_______ . 解:正态性、方差齐性、独立性. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计是?β=_______ . 解:1?-''X Y β= ()X X . 二、单项选择题(每小题3分,共15分) 1,设12(,,,)(2)n X X X n ≥ 为来自总体(0,1)N 的一个样本,X 为样本均值,2 S 为样本方差,则 ____D___ . (A )(0,1)nX N ; (B )2 2()nS n χ ; (C ) (1)()n X t n S - ; (D )2 12 2 (1)(1,1)n i i n X F n X =--∑ . 2,若总体2(,)X N μσ ,其中2σ已知,当置信度1α-保持不变时,如果样本容量n 增大,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,分别用α,β表示犯第一类错误和第二类错误的概率,则当样本容量n 一定时,下列说法中正确的是____C___ . (A )α减小时β也减小; (B )α增大时β也增大; (C ),αβ其中一个减小,另一个会增大; (D )(A )和(B )同时成立. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方

数理统计的基本知识习题 1++

习题一 1.1 任意抛掷一颗骰子,观察出现的点数.设事件A 表示“出现偶数点”,事件B 表示“出现的点数能被3整除”. (1) 写出试验的基本事件空间,把事件A 及B 表示为基本事件的集合; (2) 事件 B A AB B A A ,,,, 分别表示什么事件? 并把它们表示为基本事件(即样本点)的集合. 1.2 袋中有10个球,分别标有号码1~10, 其中1, 2, 3, 4, 5号球为红球, 6, 7, 8号球为白球, 9, 10号球为黑球.设试验为 (1) 从袋中任取一球,观察其颜色; (2) 从袋中任取一球,观察其号码. 分别写出两个试验的基本事件空间,并指出其中的基本事件是否是等可能的. 1.3 设A ,B ,C 为三个事件,试将下列事件用A ,B ,C 表示出来: (1) 三个事件都不发生; (2) 三个事件不都发生; (3) 三个事件恰有一个发生; (4) 三个事件恰有两个发生; (5) A 发生,B 与C 都不发生; (6) A 与B 都发生,C 不发生; (7) 三个事件至少有一个发生; (8) 三个事件至少有两个发生; (9) 三个事件至多有两个发生; (10) 三个事件至多有一个发生. 1.4 设A ,B 为随机事件,试证明下列等式: (1) B B A B A =; (2) BC AC C B A -=-)(; (3) AB A B A B B A -=-=-)( ; (4) )()()(A B B A AB B A --=- . 1.5 从分别标有1至n 2的n 2张卡片中无放回地任取3张,求卡片号大于、小于和等于n 的各有一张的概率. 1.6 某班有12名学生是在1987年出生的,求: (1) 这12名学生中至少有两人是在同一天出生的概率; (2) 这12名学生中至少有一人是五月一日出生的概率.

清华大学应用数理统计课后习题及答案

清华大学应用数理统计课后习题及答案 习题三 1 正常情况下,某炼铁炉的铁水含碳量2 (4.55,0.108)X N :.现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)? 解 由题意知 2 ~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立 统计原假设 0010:,:H H μμμμ=≠ 拒 绝 域 为 {} 00K x c μ=->,临界值 1/2 1.960.108/0.0947c u α-==?=, 由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性 变化. 设立统计原假设 2 2 2 2 0010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时 22220.0250.9751 1()0.03694,(5)0.83,(5)12.83,n i i S X n μχχ==-===∑% 22 10.02520.975(5)/50.166,(5)/5 2.567c c χχ==== 拒绝域为 {} 222200201//K s c s c σσ=><%%或 由于2 2 / 3.167 2.567S σ=>%,所以拒绝0H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为 x =950h .已知该种元件寿命2(100,)X N σ:,问这批元件是否合格 (0.05α=)? 解 由题意知 2 (100,)X N σ:,设立统计原假设 0010:,:,100.0.05.H H μμμμσα≥<== 拒绝域为 {} 00K x c μ=->

研究生应用数理统计基础庄楚强,何春雄编制 课后答案

研究生 习题2: 2-7. 设 )1,0(~N ξ,),,,,,(654321ξξξξξξ为其一样本,而26542321)()(ξξξξξξη+++++=, 试求常数c ,使得随机变量ηc 服从2 χ分布。 2-7解:设3211ξξξη++=,所以 )3,0(~1N η 6542ξξξη++=,所以 )3,0(~2N η 所以 )1,0(~3 1 N η , )1,0(~3 2 N η )2(~)(3 1332 22212 22 1χηηηη+=??? ??+??? ?? 由于 2 22 1ηηη+= 因此 当 3 1=c 时,)2(~2 χηc 。 2-8. 设 ),,,(1021ξξξΛ为)3.0,0(2 N 的一个样本,求 ? ?? ???>∑=101244.1i i P ξ 。(参考数据:) 2-8解:因为 )3.0,0(~),,,(2 1021N ξξξξΛ=, 所以 )1,0(~3 .0N ξ , 即有)10(~3.0210 12 χξ∑=?? ? ??i i 所以 ??? ???>∑=101244.1i i P ξ??????>=∑=1012223.044.13.0i i P ξ??????>=∑=10122163.0i i P ξ ? ?? ???≤-=∑=10122163.01i i P ξ1.09.01=-= 2-14. 设总体)4,1(~N ξ,求{}20≤≤ξP 与{} 20≤≤ξP ,其中ξ是样本容量为16的样 本均值。(参考数据:)

2-14解: {}20≤≤ξP )0()2(F F -=)210()212( -Φ--Φ=)2 1 ()21(-Φ-Φ= 1)2 1 (2-Φ=3830.016915.02=-?= 由于 )4,1(~N ξ , 所以 )1,0(~21 1 16 21N -=-ξξ {} 20≤≤ξP ????? ?-≤-≤-=21122112110ξP ? ?? ???≤-≤-=22112ξP )2()2(-Φ-Φ=9545.019725.021)2(2=-?=-Φ= 2-17. 在总体)20,80(2 N 中随机抽取一容量为100的样本,问样本平均值与总体均值的差 的绝对值大于3的概率是多少?(参考数据:) 2-17解:因为 )20,80(~2 N ξ, 所以 )1,0(~2 80 100 20 80 N -= -ξξ 所以 {}380>-ξP {} 3801≤--=ξP ?? ? ?????? ?≤--=232801ξP ? ?? ???≤ -≤--=23280 231ξP )]5.1()5.1([1-Φ-Φ-= ]1)5.1(2[1-Φ-=1336.0)93319.01(2)5.1(22=-=Φ-= 2-25. 设总体ξ的密度函数为 ?? ?<<=其它 102)(x x x p 取出容量为4的样本),,,(4321ξξξξ,求: (1) 顺序统计量)3(ξ的密度函数)(3x p ;(2))3(ξ的分布函数)(3x F ;(3)??? ? ??>21)3(ξP 。 2-25解:(1)由 ()()[][])()(1)(! !1! )(1)(x p x F x F k n k n x p k n k k -----= ξ 所以 当 10<

《应用数理统计》吴翊李永乐第一章数理统计的基本概念课后习题

第一章 数理统计的基本概念 课后习题参考答案 设对总体X 得到一个容量为10的子样值:,,,,,,,,,,试分别计算子样均值X - 和子样方差 2S 的值。 解:12,n X X X 为总体X 的样本, 根据 121 ()n X X X X n = +++ 求得X =; 根据2 21 1()n i i S X X n ==-∑ 求得2 S =。 设总体X 的分布函数为()x F ,密度函数为()x f ,n X X X ,,,21 为X 的子样,求最大顺序统计量()n X 与最小顺序统计量()1X 的分布函数与密度函数。 : 解: 将总体X 中的样本按照从小到大的顺序排列成()()()n X X X ≤≤≤ 21 ()()()()()()[]n n n n x F x x P x x P x x P x x P x F =<<<=<= 21 ()()[]()()x f x nF x F x f n n n 1' -== ()()()()() ()[]()[]()[]()[] n n n x F x x P x x P x x P x x P x x P x x P x x P x F --=<-<-<--=≥≥≥-=<=1111111212111 ()()[]()[] ()x f x F n x F x f n 1 111'--== 设总体X 服从正态分布N(12,4),今抽取容量为5的子样521,,,X X X ,试问: ' (1)子样的平均值X 大于13的概率为多少 (2)子样的极小值(最小顺序统计量)小于10的概率为多少 (3) 子样的极大值(最大顺序统计量)大于15的概率为多少 解:

研究生《应用数理统计基础》庄楚强 四五章部分课后答案

4-45. 自动车床加工中轴,从成品中抽取11根,并测得它们的直径(mm )如下: 10.52,10.41,10.32,10.18,10.64,10.77,10.82,10.67,10.59,10.38,10.49 试用W 检验法检验这批零件的直径是否服从正态分布?(显著性水平05.0=α) (参考数据:) 4-45. 解:数据的顺序统计量为: 10.18,10.32,10.38,10.41,10.49,10.52,10.59,10.64,10.67,10.77,10.82 所以 6131 .0][)()1(5 1 ) (=-= -+=∑k k n k k x x a L , 又 5264.10=x , 得 38197 .0)(11 1 2 =-∑=i i x x 故 984.0) (11 1 2 2 =-= ∑=i i x x L W , 又 当n = 11 时,85.005.0=W 即有 105.0<

清华大学-杨虎-应用数理统计课后习题参考答案

习题一 1 设总体X 的样本容量5=n ,写出在下列4种情况下样本的联合概率分布. 1)),1(~p B X ; 2))(~λP X ; 3)],[~b a U X ; 4))1,(~μN X . 解 设总体的样本为12345,,,,X X X X X , 1)对总体~(1,)X B p , 11223344555 11 1 55(1) (,,,,)()(1)(1)i i n x x i i i i x x P X x X x X x X x X x P X x p p p p -==-========-=-∏∏ 其中:5 1 15i i x x ==∑ 2)对总体~()X P λ 11223344555 1 1 555 1 (,,,,)()! ! i x n i i i i i x i i P X x X x X x X x X x P X x e x e x λ λ λλ-==-========== ∏∏ ∏ 其中:5 1 15i i x x ==∑ 3)对总体~(,)X U a b 55 11511 ,,1,...,5 (,,)()0i i i i a x b i f x x f x b a ==?≤≤=?==-??? ∏∏ L ,其他

4)对总体~(,1) X Nμ () ()() 2 555 5/22 2 15 1 11 1 (,,)()=2exp 2 i x i i i i i f x x f x x μ πμ - -- = == ?? ==-- ? ?? ∑ ∏ L 2 为了研究玻璃产品在集装箱托运过程中的损坏情况,现随机抽取20个集装箱检查其产品损坏的件数,记录结果为:1,1,1,1,2,0,0,1,3,1,0,0,2,4,0,3,1,4,0,2,写出样本频率分布、经验分布函数并画出图形. 解设(=0,1,2,3,4) i i代表各箱检查中抽到的产品损坏件数,由题意可统计出如下的样本频率分布表1.1: 经验分布函数的定义式为:

相关文档
最新文档