应用数理统计参考题

应用数理统计参考题
应用数理统计参考题

应用数理统计(2000年)

一、填空 1

x 1,x 2,…x 10

N(0,1)

y=k 1(x 1+2x 2+3x 3)2+k 2(x 4+x 5+…+x 10)2~x 2(2),则k 1= k 2= 2、设x 1,x 2,…x 2m 来自总体N(4,9)的样本,若y=2

21(4)m

i i x =-∑,且Z=

从t 分布,则c= ,z~t( )

3、设x 1,x 2,…x 2m 来自总体N(μ,σ2)的样本,已知y=(x 2-x 1)2+(x 4-x 3)2

+…+(x 2m -x 2m-1)2,

且Z=cy 为σ2的无偏估计,则c= 4、上题中,Dz=

5、由总体F(x)与G(x)中依次抽得容量为12和11的样本,已计算的游程总个数U=12,试在水平α=0.05下检验假设H 0:F(x)= G(x),其结论为 (U 0.05(12,11)=8)

二、设x 1,x 2,…x 61来自总体N(0,1)的样本,令y=61

2

1

i

i x =∑,试求P{211

15x y ≤} (t 0.975(60)=2)

三、设总体x 的密度函数为 (1+α)x α,0

0, 其它

而(x 1,x 2,…x n )为来自x 的样本,试求α的极大似然估计量。 四、设x~N(μ1,σ2),y~ N(μ2,σ2)

今抽取x 的样本x 1,x 2,…x 8;

y 的样本y 1,y 2,…y 8;

计算得x =54.03,y =57.11,2x s =3.25,2y s =2.75

1.试在水平α=0.01下检验假设H 0:μ1=μ2,H 1:μ1>μ2 2.试求α=0.02时,μ2-μ1的估计区间(t 0.99(14)=2.6245)

五、欲考察因子A,B,C,D 及交互作用A×C ,且知B 也可能与其它因子存在交互作用,试在L 8(27)上完成下列表头设计。并说明理由。

B A D

C B 1 2 3 4 5 6 7

附L 8(27)的交互作用表

1

2

3 4 5 6 7 (1) 3 2

5 4 7

6 (2) 1 6

7 4 5 (3) 7 6

5 4 (4) 1 2

3 (5) 3 2

(6) 1

(7)

六、已知(x 1, y 1), (x 2, y 2),…, (x 9, y 9)为一组实验值,且计算得x =8.67, y =16.2,

9

2

1

i i x =∑=996,

9

21

i i y =∑=3081.96,

91

i i

i x y =∑=1743.6,试求线性回归方程???y a bx =+ 七、x 1,x 2,…x 100来自总体x~π(λ)(泊松分布)的一个样本,试求参数λ的近似(1-α)置信区间,(Ex=λ,Dx=λ)

八、在一元线性回归中,l yy =Q+U ,F= //U s

Q s

~F(s,t),试给出用F 值来判定回归显著性的办法。

应用数理统计(2001年)

一、填空(每空3分,共30分)

1.设x1,x2,……,x10为来自总体N(0,1)的样本,若y =k1(2x1+x2-3x3)+k2(x4+x5+……+x10)2,且y~x2(2).则k1=__,k2=__.

2.设x1,x2,……,x12为来自总体N(0,A)的样本,若y=(x12+x22+x32)÷(x12+x22+……

+x122)且Z=cy~F分布,则c=__,Z~F( )

3.若x1,x2,……,x20为来自总体N(μ,σ2)的样本,若

y=(x2-x1)2+(x4-x3)2+……+(x20-x19)2,且Z=cy为σ2的无偏估计,则c=__,DZ=__

4.若x1,x2,……,x100为来自总体N(10,σ2)的样本,若y=

100

2

1

1

1

(10)

99i

y x

=

=-

∑,

则Ey=__,Dy__

5.若x1,x2,……,x16为来自总体N(μ,0.012)的样本,其样本平均值x---=2.215,则μ的0.20置信区间为(_,_)(取三位小数),(已知Ф(1.645)=0.95,Ф(1.282)=0.90)

二(10分)设总体X 的概率密度函数为

f(x)=(1+α)x2, 0

0 其它

而x1,x2,……,x n为来自X的样本,试求α的矩估计量和极大似然估计量。

三(10分)设x1,x2,……,x61为来自总体N(0,1)的样本。令y=

60

2

1

i

i

x

=

∑,且P (x61/y≤k)

=0.95,试求k。

四(10分)设X~N(μ1,σ2),Y~N(μ2,σ2)令抽取X的样本x1,x2,…,x8,Y的样本y1,y2,…,y8试推导假设H0:μ1=μ2;H1:μ2>μ1的拒绝域,设若x---=54.03,y__=57.11,S12=3.25,S22=2.75,是否接受H0?

五(10分)设y~N(Ae-Bx,σ2),试由样本(x1,y1)(x2,y2),……(x n,y n)估计参数A及B(可利用已有的结论或公式些出相应的结果)。

六(10分)今有正交试验结果列于下表(大者为好)

试用级差分析对结果进行分析判断,若A 、B 、C 的水平数皆为实际条件数据由小到大排列,试选出最优工艺条件并指出进一步试验的方向。 七、(10分)设t~t(n),F~F(n, 1)且p{t ≤t α(n)}=α,p{F ≤F α(n, 1)}=α 试证明:112

1

()(,1)

t n F n αα+-=

八、(10分)设X 的概率密度函数为

,0()0,x f x otherwise ββ?<

1

试求β的极大似然估计量,并由此求一个β的无偏估计量

应用数理统计(2003年)

1. 设X 1, X 2, … , X 100为来自正态总体N(0,σ2

)的样本,若Y=100

21i

i x =∑,求EY ,

EY 2。

2. 设总体X~N(μ,σ2),X 1,X 2,…,Xn 为来自X 的样本,记

X =1

1n

i i x n =∑,

S 2=21

1()1n i i x x n =--∑,求ES 4。 3. 已知随机变量X 的分布律为:P{X=k}=qp k-1,k=1,2,…,(q=1- p ) 试求X 的特征函数?(t),并由此求EX ,DX 。

4. 设总体X 的概率密度为f(x;θ)= 1,0,c x x c x c θθθ-?>?≤?,其中c>0为常数,试用来自X

的样本(X 1, X 2,…, Xn )构造的θ矩估计量。

5. 设总体X~N(μ,52),其样本为(X 1,X 2,…,Xn ),这时μ的置信区间为1-α,的置信区间为

① 当n 固定时,若要提高置信度,置信区间长度会_ ② 当置信度固定时,增大n ,置信区间长度会_

6. 设(X 1,X 2,…,Xn )为来自正态总体N(0,σ2)的样本,若T=1

n

i

i c x

=∑是σ

的无偏估计量,求c 。

7. 设总体X 的均值为μ,方差为σ2>0,今有来自X 的两组样本(X 1,X 2,…,Xn 1),(Y 1,Y 2,…,Yn 2),其样本均值依次为X 和Y ,若T=a X +b Y 为μ的无偏估计量,且方差D(T)达到了最小,试求a 与b 。

8. 若回归直线???y

a bx =+中,已知2

21??~(,())xx

x a y bx N a n l σ=-+,且Q/(n-2)为σ2

的无偏估计,而

2

Q

σ

~ χ (n-2),又知?a

与Q 相互独立,试求a 的置信区间。

9.今有正交试验结果列于下表(试验结果大者为好),试用极差分析法对结果进

行分析,并选出最优工艺条件,又知A,B,C的水平数皆为实际数据由小到大排列,试指出进一步实验的方向。

10.设(X1,X2,…,Xn)为来自总体X的简单样本,且X~R[0,θ],试求θ

的最大似然估计量,并验证是否具有无偏性,若否,请构造一个无偏估计量。

应用数理统计考试提纲(2004年)

1、正态N(μ,σ2),简单随机样本X1、X2……X n,其中μ已知。

(1)求σ2的一至最小方差无偏估计。

(2)运用信息不等式得到σ2方差的下界。

(3)判断得到的σ2的一致最小方差是否达到信息不等式的下界。

(4)说明有效估计和一致最小方差关系。

2、对于一元线性回归证明b~N(b,σ2/l xx)(答案书上有)

3、假设检验。(比较简单,但要记住公式或自己能推导)

4、对L8(27)正交表进行极差分析和方差分析,判断最优的工艺条件。

5、已知某个协差矩阵的特征根,求应该选几个主成分和第一主成分的特征向量。

(第一问很简单,第二问都是小数,4×4矩阵,运算量大,要带计算器,但还不知谁做完的。)

应用数理统计参考试卷一

一、判断正误

1、给定显著性水平α及自由度,若计算得到的|t|值超过临界的t值,我们将

接受零假设。()

2、线性对数模型R2值可以与线性摸型的相比较,但不能与双对数模型或对

数线性模型的相比较。()

3、尽管存在着完全多重共线性,普通最小二乘估计量仍然是最优线性无偏估

计量。()

4、如果存在异方差,通常用的t检验和F检验是无效的。()

二、随即的总体回归函数与随机的样本回归函数有何区别?既然我们不能观测到

总体回归函数,为什么还要研究它?

三、根据美国1962-1977年的数据,得到对汽车的需求函数如下:

Y?=5807+3.24X i r2=0.22

i

se= (1.63)

式中,Y表示零售私人汽车数量(千辆),X表示真实的可支配收入(以1972年为标准,单位为亿美元)。注:未给出b1的标准差se。

(1)对b2建立一个95%的置信区间。

(2)检验假设:该置信区间包括b2=0。如果不包括,你将接受零假设吗?(3)在H0:b2=0下,计算t值,在5%的显著水平α下,使统计显著吗?四、下表给出了三变量模型的回归结果:

(1)样本容量是多少? (2)求RSS ? (3)求R 2?

(4)检验假设:X 2和X 3对Y 无影响,置信水平α=0.05,你用什么假设检验?

为什么?

(5)根据以上信息,你能否确定X 2和X 3各自对Y 的贡献吗? 五、解释下列模型中参数B 2的含义: (1) lnY t =B 1+B 2lnX t +u t (2) lnY t =B 1+B 2X t +u t

(3) Y t =B 1+B 2lnX t +u t

六、考虑下面的模型:Y t =B 0+B 1X t +B 2D 2t + B 3D 3t +u t

其中,Y ——MBA 毕业生收入,X ——工龄,所有毕业生均来自清华大学,大连理工大学,沈阳工业大学

(1)你预期各系数的符号如何? (2)如何解释系数B 2,B 3? (3)若B 2 〉B 3,你得出什么结论?

七、不完全多重共线性的实际后果是什么?

八、若在模型:Y t =B 1+B 2+u t 中存在下列形式的异方差:Var(u t )=δ2X t ,你如何估计

参数B 1,B 2

D 2= 1 清华大学MBA

0 其他

D 3=

1沈阳工业大学MBA

0 其他

应用数理统计参考试卷二

一、判断正误

1、随即误差项和残差相是一回事。()

2、在线性回归模型中,解释变量是原因,被解释变量是结果。()

3、R2=TSS/ESS。()

4、整个多元回归模型在统计上是显著的意味着模型中任何一个单独的变量均是

统计显著的。()

5、双对数模型的R2值可以与对数线性模型的相比较,但不能与线性对数模型的

相比较。()

6、为了避免陷入虚拟变量陷阱,如果一个定性变量有m类,则要引入m个虚拟

变量。()

7、尽管存在着完全多重共线性,普通最小二乘估计仍然是最优线性无偏估计量。

()

8、存在异方差情况,常用的OLS法总是高估了估计量的标准差。()

9、消除自相关的一阶差分变换假定自相关系数ρ必须等于1。()

10、识别的阶条件仅仅是判别模型是否可识别的必要条件而不是充分条件。()

二、简答题

1998年,为应对亚洲金融危机,我国政府提出了实施“积极的财政政策”的主张。积极财政政策的主要内容就是通过发行国债,支持重大的基础设施建设,以此来拉动经济增长。2003年3月5日朱镕基总理在第十届全国人民代表大会第一次会议上所做的政府工作报告中指出:“这几年,面对国际经济环境严峻和国内有效需求不足的困难局面,我们采取的最重要举措,就是果断地把宏观调控的重点,从实行适度从紧的财政政策和货币政策,治理通货膨胀,转为实行扩大内需的方针,实施积极的财政政策和稳健的货币政策,以致通货紧缩趋势,并在实践中实施完善政策措施,把握调控力度,确保取得成效。”请你结合有关经济理论,联系实际背景,谈谈怎样运用经济计量学研究经济问题的方法对实施的积

极的财政政策取得的成效进行实证研究?

三、依据美国1970-1983年的数据,得到下面的结果:

GDP t=-787.4723+8.0863M1t

se=(a)(0.2197)

t=(-10.0001)(b)

r2=0.9912

其中GDP是国民生产总值(单位是亿美元),M1是货币供给(单位是百万美元)a,b未知。

(1)上述模型中的数据属于哪种统计数据模型?

(2)求出a,b。

(3)假定1984年m1为552亿美元,预测该年平均GNP。

五、根据中国1950-1972年进出口贸易总额y t(单位亿元)与国内生产总值X t(

单位亿元)的数据,估计了进出口贸易总额和国内生产总值之间的关系,结果如下:

Dependent Variable:LOG(Y)

Method;Least Squares

Date:06/05/03 Time:11:02

Sample:1950 1972

Included observations:23

Variable Coefficient Std.Error t-Statistic Prob

C 0.682674 0.235425 2.8997515

LOG(X) 0.514047 0.070189 7.323777

R-squared 0.718641 Mean-dependent var 4.596044 Adjusted R-squared 0.705243 S.D. dependent var 0.301263 S.E.of regression 0.1635560 Akaike info criterion 0.700328 Sum squared resid 0.561792 Schwarz criterion 0.601589 Log likelihood 10.05377 F-statistic 53.63771 Durbin-Watson stat 0.518528 Prob(F=statistic)

(1)写出所得到的回归模型的表达式,并解释系数的意义。

(2)分析该结果的系数显著性和拟合优度。

(3)在通常使用的D-W统计量需要有哪些基础假设?

(5)估计自相关系数。

(6)如何对该模型进行改进?

应用数理统计参考试卷三

一、判断对错(20分)

1、在用经济计量模型描述经济现象时应遵循的原则是以理论分析作先导,解释

变量应包括所有解释变量。()

(1)线性回归模型中,解释变量是原因,被解释变量是结果。()

2、回归分析用来处理一个因变量与另一个或多个自变量之间的因果关系。()

3、整个多元回归模型在统计上是显著的意味着模型中任何一个单独的变量均是

统计显著的。()

4、多元线性回归分析中的RSS反映了应变量回归估计值总变差的大小。()

5、最小二乘估计的残差均值为零。()

6、在存在异方差情况下,常用的OLS法总是高估了估计量的标准差。()

7、拟合优度R2越高说明样本回归模型对总体回归模型的代表性越高。()

8、识别的阶条件仅仅是判别模型是否可识别的必要条件而不是充分条件。()

9、总体回归线是当解释变量取给定值时因变量的条件均值的轨迹。()

10、X与Y之间线性相关程度越高,样本相关系数Y越接近1。()

二、试述计量经济学与经济学、数理经济学、经济统计学以及数理统计学的联

系与区别。(20分)

三、简述普通最小二乘原理,并以一元线性回归模型为例进行说明?(20分)

四、叙述高斯—马尔可夫定理。(10分)

五、试述多重共线性下,普通最小二乘估计量的统计性质及实际表现?(10分)

六、应用题(30分)

为了研究我国的居民消费函数,得到了如下回归分析结果:

Dependent Variable.LOG(CC)

Method: Least Squsres

Sample: 1960 1994

Included observation: 35

其中,CC表示居民消费,Y 表示居民可支配收入,LOG表示自然对数函数:单位:元。

(1)根据以上结果,写出回归分析结果报告。

(2)如果运用此结果解释我国的居民消费行为,你如何解释变量的系数?(3)有人认为我国居民消费的边际倾向小于1,你如何对此判断进行假设检验?

(4)由上述回归结果可知,模型中可能存在什么问题?如何检验?

(5)如何就模型中所存在的问题,对模型进行改进?

应用数理统计参考试卷四

一、判断对错(20分)

1、线性回归是指解释变量和被解释变量之间呈现线性关系。()

2、如果回归模型中每一个参数估计值都是统计显著的,那么它们也一定是联合

统计显著的。()

3、双对数模型的斜率和弹性系数相同。()

4、引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。()

5、判定系数R2的大小不受到回归模型中所包含的解释变量个数的影响。()

6、X与Y之间线性相关程度越高,样本相关系数Y越接近1。()

7、多重共线性是一种随机误差现象。()

8、当存在自相关时,OLS估计值是有偏的并且也是无效的。()

9、在存在异方差情况下,造成OLS估计量有较大的误差的原因是从属回归的较

大的R2。()

10、任何两个计量经济模型的R2都是可以比较的。()

二、试述用计量经济模型分析经济问题的基本步骤。(20分)

三、什么是虚拟变量?举例说明如何通过加法模式和乘法模式引进虚拟变量来

建立计量经济模型。(15分)、

四、试述多重共线性的后果及其补救措施。(15分)

五、下面是利用1970-1980年美国数据得到的回归结果。其中Y表示美国咖啡

消费(杯/日.人)。X表示平均零售价格。(美元/磅)

Y t=2.6911 - 0.4795 X1

se 0.1216 ( ) R2=0.6628

t值( ) 42.06

1、求出空白处的数值。

2、对模型中的参数进行显著性检验。

3、解释斜率系数的含义,并给出其95%的预测区间。

六、某种商品市场的均衡模型

Q S=b10P+ b11X2+ b12X3+ u1

Q d=b20P+ b21X1+ u2

Q S= Q d =Q

式中,Q为商品供需平衡量,P为市场价格,X1为可支配收入,X2为单位成本,X3为市场占有份额。要求:

1、指出模型中哪些是内是变量,哪些是外生变量。(5分)

2、对模型进行识别。(10分)

应用数理统计参考试卷五

一、判断对错(10分)

1、在实际中,一元回归没什么用,因为因变量的行为不可能仅用一个解释变量来解释。()

2、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数仅与样本容量大小有关。()

3、模型Y=β0+β1/X+u不是线性回归模型。( )

4、在回归分析中,解释变量和被解释变量都是随机变量。()

5、在联立方程结构模型中,对模型中的每一个随机方程单独使用普通最小二乘法得到的估计参数是无偏且一致的。()

二、简述随机误差项产生的原因。(10分)

三、1、利用我国1998年全国30个省区的人均消费支出与人均可支配收入数据建立计量经济模型,得到的回归结果如下表,回答下列问题:(20分)

(1)这是一个时间数列回归还是横截面序列回归?(2分)

(2)写出回归方程。(2分)

(3)如何解释斜率?(3分)

(4)对参数进行显著性检验。(5分)

(5)如果某人可支配收入是1000元,求出该人的消费支出的点预测值。(3分)(6)求出该人消费支出95%置信水平的区间预测。(5分)

表2 回归结果

四、什么是自相关?杜宾-瓦尔森检验的前提条件和步骤是什么?(20分)

五、什么是异方差?如果误差方差与解释变量的平方成比例,应如何补救?为什

么?(20分)

六、在如下的收入决定模型中,利率R、政府支出G为外生变量,模型为:

C t=α0+α1Y t+α2I t+ u1 消费方程

I t=β0+β1Y t-1+β2I t+ u2 投资方程

T t=γ0+γ1Y t+ u3税收方程

Y t=C t + I t + G t收入方程

1、写出简化式模型(4分)

2、试利用模型识别条件分析判断模型的可识别性?(10分)

3、如何估计模型中的未知参数?(6分)

4、

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析 终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响 年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

《应用数理统计》期末考试-2011

《应用数理统计》期末考试试题 (2011-11-26上午8:30—10:30) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 1、(20分)设总体X 服从正态分布(0,1)N ,12,X X 为来自总体X 的简单样本,设112212; Y X X Y X X =+=-。 (1)求二维随机变量12(,)Y Y 的联合密度()21,y y f ; (2)分别求12,Y Y 的边缘密度函数()()2121,y f y f Y Y ; (3)12,Y Y 是否独立?说明根据。 (4)叙述2χ分布的构造性定义。能否通过取适当的常数c ,使得2212()c Y Y +服从2χ分布?若可以,求出c ,并写出所服从的2χ分布的自由度。 2、(20分)设12,,,n X X X 是来自正态总体() 2~0,X N σ的简单样本,记 22221 21111??();1n n i i i i X X X n n σσ===-=-∑∑,其中11n i i X X n ==∑, (1)证明:21?σ是2 σ的渐近有效估计量; (2)证明:22?σ是2 σ的有效估计量; (3)试分别以21?σ,22?σ为基础构造2 σ的两种1α-置信区间。你认为你得到的哪个估计区间会更好一些?为什么? 3、(20分)(1)简述假设检验的一般步骤; (2)某厂生产一批产品,质量检查规定:若次品率0.05p ≤,则这批产品可以出厂,否则不能出厂。现从这批产品中抽查400件产品,发现有30件是次品,问:在显著性水平0.05α=下,这批产品能否出厂?若取显著性水平0.02α=,会得出什么结论?α是越小越好吗?对你的答案说明理由。 要求:将此问题转化成统计问题,利用所学知识给出合理的、令人信服的推断,推断过程的每一步要给出理由或公式。分位点定义如下: 若随机变量W ,对任意的()1,0∈α,有()α=≤x W P ,称x 为W 的α分位点,记作αx 。

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1三因子多水平实验方案

应用数理统计作业题及参考答案(第二章)(2)

第二章 参数估计(续) P68 2.13 设总体X 服从几何分布:{}()1 1k P X k p p -==-,12k = ,,,01p <<,证明 样本均值1 1 n i i X X n == ∑是()E X 的相合、无偏和有效估计量。 证明: 总体X 服从几何分布, ∴()1= E X p ,()2 1-= p D X p . 1 () ()1 11 11 11==????===??== ? ????? ∑ ∑ n n i i i i E X E X E X n E X n n n p p . ∴样本均值11n i i X X n == ∑ 是()E X 的无偏估计量。 2 () 2222 1 11 1111==--???? ===??= ? ?????∑ ∑n n i i i i p p D X D X D X n n n n p np . ()()()()11 11 ln ln 1ln 1ln 1-??=-=+--??;X f X p p p p X p . () 111ln 111111f X p X X p p p p p ?--= - =+?--;. () () 2 11 2 2 2 ln 11 1f X p X p p p ?-=- + ?-;. ()()()()21112 2 2 22ln 11 1111f X p X X I p E E E p p p p p ???? ?? ?--=-=--+=+???????--?????? ? ?? ? ; () ()() ()12 2 2 2 2 211 11 111111111??-= + -= + ?-=+? ?---?? p E X p p p p p p p p ()()() () 2 2 2 111 1 111-+= + = = ---p p p p p p p p p .

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

应用数理统计大作业1——逐步回归法分析终

应用数理统计大作业1——逐步回归法分析终 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

应用数理统计试题

应用数理统计复习题 1.设总体~(20,3)X N ,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,X Y ,则1~(0,)2 X Y N - (||0.3)(0.424)(0.424)0.328P X Y -<=Φ-Φ-= 其中(01)θθ<<为未知参数,已知取得了样本值1231,2,1x x x ===,求θ的矩估计和最大似然估计. 解:(1)矩估计:2 2 22(1)3(1)23EX θθθθθ=+?-+-=-+ 14 (121)33 X =++= 令EX X =,得5?6 θ=. (2)最大似然估计: 2 2 5 6 ()2(1)22L θθθθθθθ=??-=- 45ln() 10120d d θθθθ=-= 得5?6 θ= 3. 设某厂产品的重量服从正态分布,但它的数学期望μ和方差2 σ均未知,抽查10件,测得重量为i X 斤10,,2,1Λ=i 。算出 10 11 5.410i i X X ===∑ 10 21 () 3.6i i X X =-=∑ 给定检验水平0.05 α=,能否认为该厂产品的平均重量为5.0斤? 附:t 1-0.025(9)=2.2622 t 1-0.025(10)=2.2281 t 1-0.05(9)=1.8331 t 1-0.05(10)=1.8125 解: 检验统计量为0 | |/X T S n m -=

将已知数据代入,得2t = = 1/2 0.975(1)(9) 2.26222t n t a - -==> 所以接受0H 。 4. 在单因素方差分析中,因素A 有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平0.05α=下对因素A 是否显著做检验。 解: 0.95(2,9) 4.26F =,7.5 4.26F =>,认为因素A 是显著的. 5. 现收集了16组合金钢中的碳含量x 及强度y 的数据,求得 0.125,45.7886,0.3024,25.5218xx xy x y L L ====,2432.4566yy L =. (1)建立y 关于x 的一元线性回归方程01 ???y x ββ=+; (2)对回归系数1β做显著性检验(0.05α=). 解:(1)1 25.5218 ?84.39750.3024 xy xx l l β== = 01 ??35.2389y x ββ=-= 所以,?35.238984.3975y x =+ (2)1?2432.456684.397525.5218278.4805e yy xy Q l l β=-=-?= 2 278.4805 ?19.8915214 e Q n σ ===- ? 4.46σ ==

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析 摘要 篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。 正文 一、问题描述 随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。 倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。 因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。 二、数据描述 抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

北航2010应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

最新北航数理统计大作业-多元线性回归

北航数理统计大作业-多元线性回归

应用数理统计多元线性回归分析 (第一次作业) 学院: 姓名: 学号: 2013年12月

交通运输业产值的多元线性回归分析 摘要:本文基于《中国统计年鉴》(2012年版)统计数据,寻找影响交通运输业发展的因素,包括工农业发展水平、能源生产水平、进出口贸易交流以及居民消费水平等,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,最后可以利用有效的最优回归模型对将来进行预测。 关键字:多元线性回归,逐步回归,交通运输产值,工业产值,进出口总额1,引言 交通运输业指国民经济中专门从事运送货物和旅客的社会生产部门,包括铁路、公路、水运、航空等运输部门。它是国民经济的重要组成部分,是保证人们在政治、经济、文化、军事等方面联系交往的手段,也是衔接生产和消费的一个重要环节。交通运输业在现代社会的各个方面起着十分重要的作用,因此研究交通运输业发展水平与各个影响因素间的关系显得十分重要,建立有效的数学相关模型对于预测交通运输业的发展,制定相关政策方案提供依据。根据经验交通运输业的发展受到工农业发展、能源生产、进出口贸易以及居民消费水平等众因素的影响,故建立一个完整精确的数学模型在理论上基本无法实现,并且在实际运用中也没有必要,一种简单有效的方式就是寻找主要影响因素,分析其与指标变量的相关性,建立多元线性回归模型就是一种有效的方式。 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显着影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显着性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显着性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显着水平下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一

北航数理统计期末考试题

材料学院研究生会 学术部 2011 年12 月 2007-2008学年第一学期期末试卷 一、(6 分,A 班不做)设x1,x2,?,x n是来自正态总体N( , 2) 的样本,令 2(x1 x2) T (x3 x4)2 (x5 x6)2 , 试证明T 服从t-分布t(2) 二、( 6 分, B 班不做 ) 统计量F-F(n,m) 分布,证明 1的 (0< <1)的分位点x 是1。 F F1 (n,m) 。 三、(8分)设总体X 的密度函数为 其中1,是位置参数。x1,x2,?,x n是来自总体X 的简单样本, 试求参数的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp ,x p(x; ) 0 , 其它 其中, 已知,0, 是未知参数。x1,x2,?,x n 是来自总体X 的简单样本。

1)试求参数的一致最小方差无偏估计; 2) 是否为的有效估计?证明你的结论。 五、(6分,A 班不做)设x1,x2,?,x n是来自正态总体N( 1, 12) 的 简单样本,y1,y2,?,y n 是来自正态总体N( 2, 22) 的简单样本,且两样本相互独立,其中1, 12, 2, 22是未知参数,1222。为检验假设H0 : 可令z i x i y i, i 1,2,..., n ,1 2 , 1 2, H1 : 1 2, 则上述假设检验问题等价于H0 : 1 0, H1: 1 0,这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,?,z n,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6 分,B 班不做)设x1,x2,?,x n是来自正态总体N( 0, 2) 的简单样本,0 已知,2未知,试求假设检验问题 H0: 202, H1: 202的水平为的UMPT。 七、(6 分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6 分)设方差分析模型为 总离差平方和 试求E(S A ) ,并根据直观分析给出检验假设H0 : 1 2 ... P 0的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D 外,还需考察 A B ,B C 。今选用表L8(27 ) ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

北航应用数理统计大作业多元线性回归

多元线性回归分析 摘要:本文查找2011年《中国统计年鉴》,取我国31个省市自治区直辖市2010年的数据,利用SPSS软件对影响居民消费的因素进行讨论构造线性回归模型。并对模型的回归显著性、拟合度、正态分布等分别进行检验,最终得到最优线性回归模型,寻找影响居民消费的各个因素。 关键字:回归分析;线性;相关系数;正态分布 1. 引言 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为回归分析。 回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程,这一数学表达式通常称为经验公式。一方面,研究者可以利用概率统计知识,对这个经验公式的有效性进行判定;另一方面,研究者可以利用经验公式,根据自变量的取值预测因变量的取值。如果是多个因素作为自变量的时候,还可以通过因素分析,找出哪些自变量对因变量的影响是显著的,哪些是不显著的。 回归分析目前在生物统计、医学统计、经济分析、数据挖掘中得到了广泛的应用。通过对训练数据进行回归分析得出经验公式,利用经验公式就可以在已知自变量的情况下预测因变量的取值。实际问题的控制中往往是根据预测结果来进行的,如在商品流通领域,通常用回归分析商品价和与商品需求之间的关系,以便对商品的价格和需求量进行控制。 本文查找2011年《中国统计年鉴》,取我国31个省市自治区直辖市2010年的数据,利用SPSS软件对影响居民消费的因素进行讨论构造多元线性线性回归模型。以探求影响居民消费水平的各个因素,得到最优线性回归模型。随后,我们对模型的回归显著性、拟合度、正态分布等分别进行检验,以考察线性回归模型的可信度。 本文将分为5章进行论述。在第2章,我们介绍多元线性回归模型的概念。第3章,我们进行模型的建立与数据的收集和整理。我们在第4章对数据进行处理,得出多元线性回归模型,并对其进行检验。在第5章,我们进行总结。2.预备知识 2.1 回归分析 回归分析研究的主要对象是客观事物变量间的统计关系,它是建立在对客观事物进行大量试验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的统计方法。回归分析方法是通过建立统计模型研究变量间相互关系的密切程度、结构状态及进行模型预测的一种有效的工具。

应用数理统计试题

应用数理统计复习题 1.设总体,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,则 2. 设总体具有分布律 1 2 3 其中为未知参数,已知取得了样本值,求的矩估计和最大似然估计. 解:(1)矩估计: 令,得. (2)最大似然估计: 得 3. 设某厂产品的重量服从正态分布,但它的数学期望和方差均未知,抽查10件,测得重量为斤。算出 给定检验水平,能否认为该厂产品的平均重量为5.0斤? 附:t1-0.025(9)=2.2622 t1-0.025(10)=2.2281 t1- 0.05(9)=1.8331 t1-0.05(10)=1.8125 解: 检验统计量为

将已知数据代入,得 所以接受。 4. 在单因素方差分析中,因素有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平下对因素是否显著做检验。 来源平方和自由度均方和F比 因素 4.2 误差 2.5 总和 6.7 解: 来源平方和自由度均方和F比 因素 4.2 2 2.1 7.5 误差 2.5 9 0.28 总和 6.7 11 ,,认为因素是显著的. 5. 现收集了16组合金钢中的碳含量及强度的数据,求得 ,. (1)建立关于的一元线性回归方程; (2)对回归系数做显著性检验(). 解:(1) 所以, (2)

拒绝原假设,故回归效果显著. 6.某正交试验结果如下 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 (1)找出对结果影响最大的因素; (2)找出“算一算”的较优生产条件;(指标越大越好) (3)写出第4号实验的数据结构模型。 解: 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 ⅠⅡR 29.79 25.36 32.0 30.86 35.29 28.65 1.07 9.9 3.35 (1)对结果影响最大的因素是B; (2)“算一算”的较优生产条件为 (3) 4号实验的数据结构模型为 ,

北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判 别分析 应用数理统计第二次大作业 学院名称 学号 学生姓名 摘要 我国幅员辽阔,由于人才、地理位置、自然资源等条件的不同,各地区的财政收入类型各自呈现出不一样的发展趋势,通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文以中国各地财政收入情况为研究对象,从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因

变量,选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源(资产)有偿使用收入11个可能影响中国各地财政收入的因素为自变量,利用统计软件SPSS,对27个地区的财政收入进行了聚类分析,并对另外4个地区的财政收入进行了判别分析,并最终确定了中国各地区根据财政收入类型的分类情况。 关键词:聚类分析,判别分析,SPSS,中国各地财政收入类型 1、引言 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。 本文利用统计软件SPSS,根据各地区的财政收入情况,对北京、天津、河北等27个地区进行聚类分析,并对青海、重庆、四川、贵州4个省市进行判别分析,判断属于聚类分析结果中的哪种财政收入类型。 1.1 聚类分析 聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。本文采用的是系统聚类分析,它又称集群分析,是聚类分析中应用最广的一种方法,其基本思想是:首先将每个聚类对象看作一类,然后根据对象间的相似程度,将相似程度最高的两类进行合并,并计算合并后的类与其他类之间的距离,再选择相近者进行合并,每合并一次减少一类,直至所有的对象都并为一类为止。 系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

相关文档
最新文档