应用数理统计复习题

应用数理统计复习题
应用数理统计复习题

《应用数理统计》复习题

第一章 概率知识

一、一袋中有5个球,编号1、2、3、4、5. 现从中任取3个,以X 表示所取球的号码的最大值,

求X 的概率分布律.

解:X 的可能取值为3、4、5,

1.010

1

}3{35

33==

==C C X P , 3.0103

}4{352311====C C C X P , 6.010

6

}5{35

2411==

=

=C C C X P , 故X 的概率分布律为

6

.03.01.05

43k

p X .

二、设连续型随机变量X 的密度函数为??

?<≤=.,

0,

10,)(其它x Ax x f

(1)求常数A ;(2)求X 的分布函数)(x F . 解:(1)由完备性:?

∞+∞

-=1)(dx x f ,

11

=?Ax , 解得2=A .

(2)t d t f x F x

?∞

-=)()(

当0≤x 时, 0)(}{)(?∞

-==≤=x

dt t f x X P x F ,

当10≤

2)()(x tdt dt t f x F x

x

===??

-,

当1>x 时,1)(=x F .

所以 .1,10,0,1,,0)(2

>≤<≤??

???=x x x x x F

三、设X 的概率密度为 ?????

≤-=其它,

022,cos )(ππx x C x f ,

1、求常数C

;2、均值EX 和方差DX . 解:1、由完备性,,

2

1

=

∴C ; 2、0cos 21

)(22

??∞

∞--===π

πxdx x dx x xf EX ;

???∞

∞---====22202

2

22

2

14cos cos 21)(πππ

πxdx x xdx x dx x f x EX ;

14

)(2

2

2-=

-=∴πEX EX DX .

四、若随机(X ,Y )在以原点为中心的单位圆上服从均匀分布,证明X ,Y 不相互独立. 解:依题意有(X ,Y )的概率密度为221/, 1;(,)0, x y f x y π?+≤=?

?其它.

.

故 11, 11()(,)0, 0, X x x f x f x y dy +∞-∞

?-≤≤-≤≤?=

==?????

?

其它其它;

同理 11()0, Y

y f y -≤≤=??其它

.

于是(,)()()X Y f x y f x f y ≠, X 与Y 不相互独立.

五、设X 的概率密度为?

??≤≤+=.,0,10,)(其它x bx a x f ,且已知EX =127

求DX .

解:由概率密度的完备性有:

1=

??

+=

∞+∞

-1

d )(d )(x bx a x x f =b a 5.0+,

且有12

7

=EX =

?

?

+=

∞+∞

-10

d )(d )(x bx a x x x xf =

3

2b

a +, 联立上述两式解得: 1,5.0==

b a

又=

)(2X E 12

5

d )5.0(1

02=

+?

x x x ,

于是 =DX =-22)()(EX X E 2)12

7(125-14411=.

六、1.设随机变0量)3,2(~2

N X ,)()(C X P C X P >=<,则=C ( A ).

A . 2

B . 3

C . 9

D . 0

2. 设随机变量),(~2

σμN X ,则随σ增大,}|{|σμ<-X P ( C ).

(A) 单调增大; (B) 单调减小; (C) 保持不变; (D) 增减不定

第二章 统计概念

1.设n X X X ,,,21 为来自正态总体),(~2σμN X 的一个简单随机样本,则样本均值∑==n

i i X n X 1

1服从),

(2

n

N σμ分布.

2. 设1021,,,X X X 是来自总体)

3.0,0(2

N 的一个样本,2

10

2221X X X Y +++= , 当C = 9

100

时,CY 服从自由度为 10 的2χ 分布.

3. 设总体),(~2

σμN X ,n X X X ,,,21 是取自总体的样本,则

∑=-n

i i

X

1

22

~)(1

μσ)(2n χ.

第三章 参数估计

一、 设n X X X ,,,21 是取自总体X 的一个样本,总体X 的概率密度函数为

?????<<=-其他,

01

0,)(1x x x f θθ,

其中0>θ为未知参数.试求θ的矩估计量∧

M θ和极大似然估计量∧

L θ. 解:1

d 1

1

+=

?=

-?

θθθθx x

x EX .

用X 代替EX ,令1

+=

θθX ,解得θ的矩估计量

2

1???

? ??-=∧

X X

M

θ. 设n x x x ,,,21 是取自总体X 的样本观察值,似然函数为

()??

???=<<=-=∏其他

,

0,,2,1,10,)(1

1

n i x x

L i n i i

n

θθ

θ

0)(>θL 时,取对数,可得∑=-+=n

i i x n

L 1

ln )1(ln 2ln θθ.

∑=+?=n

i i x n L 1

ln 21

12d ln d θθθ.

0d ln d =θ

L ,可得θ的极大似然估计量∧L θ2

1ln ?????? ??=∑=n i i X n . 二、设总体X 服从泊松分布 ,2,1,0,!

}{),(===-k e k k X P k λ

λλπ

样本n X X X ,,,21 ,证明未知参数λ的矩估计量和极大似然估计量相同. 解:总体X 服从参数为 λ 的泊松分布,则

,,2,1,0,!

}{ ==

=-k e k k X P k

λ

λ λλλ===∑∞

=-0

1!

k k

e k k

EX m .

用样本一阶原点矩1A 代替总体均值1m ,得λ的矩估计量为

X X n A n i i ===∑=1

1

1?λ. 设n x x x ,,,21 为相应于样本n X X X ,,,21 的观察值,则似然函数

λλλ-=∏

=e x L n

i i x

i

1

!

)(, 对数似然函数 λλ

λn x x L n i n

i i

i

∑∑==--=1

1

)!ln(ln )(ln ,

0ln =λ

d L

d ,即 01

=-∑=n x

n

i i

λ

,得λ的极大似然估计值

∑===n i i x x n 1

1?λ,

所求λ 的极大似然估计量X =λ

?. 可见,未知参数λ的矩估计量和极大似然估计量相同,均为X .

三、 设总体X 的分布函数为?????

≤>-=,

1,0,

1,11),(x x x

x F ββ其中未知参数n X X X ,,,,121 >β为来自总体X 的简单随机样本,求β的矩估计量和极大似然估计量.

解:(1)X 的密度函数???≤>=--,1,0,

1,),(1x x x x f βββ

总体均值β

βββ-==?∞+--111

dx x x EX ,

令-

=X EX ,得β的矩估计量为__

__1?X

X

+=β

.

(2)当),,2,1(1n i x i =>时,似然函数为:

,)(),()(1211

--===∏ββββn n n

i i x x x x f L

令0ln )(ln 1

=-=∑=n

i i x n d L d βββ,得β的极大似然估计量为

∑==n

i i

X

n

1

ln ?β

四、1.设321,,X X X 为取自正态总体),(2σμN 的一个简单随机样本,则在总体均值μ的4个无偏估计

,525152?3211X X X ++=μ

,31

3131?3212X X X ++=μ

32132

13161?X X X ++=μ

, 321431

9291?X X X ++=μ 中最有效的是2?μ . 2. 设总体X 的期望μ和方差02

存在,从总体中分别抽取容量为1n 和2n 的两个独立样本,

样本均值分别为1X 和2X ,常数a 和b 使得21X b X a T +=是μ的无偏估计量,且方差DT 达到

最小,则=a 2

11

n n n +.

五、某种零件的重量(单位:千克)服从正态分布),(2σμN ,从中抽得容量为16的样本,其均

值,856.4=x 修正方差04.02

=s .

(1)若,24.0=σ求μ的置信度为95.0的置信区间. (2)若σ未知,求μ的置信度为95.0的置信区间. (已知131.2)15(,96.1975.0975.0==t u ) 解:131.2)15(,96.1,025.02

,05.0,16975.0975.0=====t u n α

α

(1)974.4,738.4975.0975.0=+

=-

u n

x u n

x σ

σ

得μ的置信度为95.0的置信区间为)974.4,738

.4(. (2)963.4)15(,749.4)15(9725.0975.0=+=-

t n

s

x t n s x 得μ的置信度为95.0的置信区间为)963

.4,749.4(.

六、某型号钢丝折断力(单位:牛顿)服从正态分布),(2

σμN ,随机抽取10根,其折断力的方

差7.752

*=s ,求2σ置信度为95.0的置信区间.

02

.19)9(,70.2)9(2

975.02025.0==χχ,

20.48

)10(,3.25)10(2

975.02025.0==χχ). 解: ,02.19)9(,70.2)9(,025.02

,05.0,102

975.02025.0=====χχααn

333.252)9()1(,858.35)9()1(2

975.02

2025.02

=-=-χχs

n s n , 所求置信区间为)333.252,858.35(.

七、已知某种药片溶解所需的时间X 服从正态分布。现从中随机地抽取10片,测得溶解时间(单

位:min )为

5.3 3.6 5.1

6.6 4.9 6.5 5.2 3.7 5.4 5.0.

求总体方差2

σ的90%置信区间(可能用到的数据:307.18)10(295.0=χ,940.3)10(205.0=χ,919.16)9(295.0=χ,325.3)9(205.0=χ).

解:已知总体),(~2σμN X ,样本容量10=n ,由样本观测值计算可得

13.5=x , 956.02=s .

由%901=-α即10.0=α,

919.16)9()1(295.0295.0==-χχn , 325.3)9()1(2

05.0205.0==-χχn ,

∴509.0919.16956.09)1()1(2

2

12≈?=---n s n αχ,588.2325.3956

.09)

1()1(22

2≈?=--n s n αχ 所以药片溶解所需时间的方差2

σ的90%置信区间为

)588.2,509.0(

第四章 假设检验

1、假设检验中,0H 为原假设,则 ( A )为犯第一类错误.

(A) 0H 为真,拒绝0H ; (B) 0H 不真,接受0H ; (C) 0H 为真,接受0H ; (D) 0H 不真,拒绝0H

2、 某种熔丝的熔断时间X 服从正态分布,且在通常情况下642

=σ.现从这批熔丝中随机抽取

10根,测得熔断时间(单位:ms )为:42,65,75,78,71,57,59,54,55,68,问当05

.0=α时,这批熔丝的熔断时间的方差是否仍为64?(可能用到的数据:483.20)10(2975.0=χ,

247.3)10(2025.0=χ,023.19)9(2975.0=χ,700.2)9(2025.0=χ).

解:依题意检验假设2

212020:,64:σσσσ≠==H H . )1(~1

222

2--=

n S n χσ

χ ,

∴拒绝域为 [)?

??

? ??+∞---),1()1(,02212

2n n αα

χχ . 这里05.0=α,10=n ,023.19)9(2975.0=χ,700.2)9(2

025.0=χ,拒绝域为

[()+∞,023.19)700.2,0 .

计算可得4.62=x ,82.1212

=s ,

13.1782.12164

9

6411022=?=-=

s χ[()+∞?,023.19)700.2,0 ,

故接受0H ,即认为这批熔丝的熔断时间的方差仍为64.

3、已知某一试验,其温度X 服从),(2σμN ,现测得5个温度值,计算得1259=x ,

937.11=s ,问可否认为1277=μ?(取显著性水平05.0=α)

(可能用到的数据776.2)4(597.0=t ,132.2)4(59.0=t )

解:检验假设1277:;1277:10≠=μμH H ,采用t 检验法,其拒绝域为)4(/1277

2

αt n s x t ≥-=.

经计算:372.3=t ,而776.2)4(372.3597.0=>t , 故拒绝假设,即不能认为1277=μ.

4、某种导线,要求其电阻的标准差不得超过Ω005.0.现抽取9根样品,测得Ω=007.0s ,设电

阻X 服从),(2σμN ,问在显著性水平05.0=α下,能否认为这批导线的标准差显著地偏大. (可能用到的数据507.15)8(95.02=χ,92.16)9(95.02=χ) 解:检验假设221220005.0:;005.0:>≤σσH H .

采用2χ检验法,其拒绝域为)1()1(122

2

2

-≥-=-n s n αχσχ.

经计算:68.15)1(2

2

2

=-=

σχs n ,而507.15)8(95.02=χ,可见)8(95.022χχ>,故拒绝0H ,

即认为这批导线的标准差显著地偏大.

第五章 回归分析

一、测得某种物质在不同温度下吸附另一种物质的重量如下表所示

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析 终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响 年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

应用数理统计复习题

《应用数理统计》复习题 第一章 概率知识 一、一袋中有5个球,编号1、2、3、4、5. 现从中任取3个,以X 表示所取球的号码的最大值, 求X 的概率分布律. 解:X 的可能取值为3、4、5, 1.010 1 }3{35 33== ==C C X P , 3.0103 }4{352311====C C C X P , 6.010 6 }5{35 2411== = =C C C X P , 故X 的概率分布律为 6 .03.01.05 43k p X . 二、设连续型随机变量X 的密度函数为?? ?<≤=., 0, 10,)(其它x Ax x f (1)求常数A ;(2)求X 的分布函数)(x F . 解:(1)由完备性:? ∞+∞ -=1)(dx x f , 有 11 =?Ax , 解得2=A . (2)t d t f x F x ?∞ -=)()( 当0≤x 时, 0)(}{)(?∞ -==≤=x dt t f x X P x F , 当10≤x 时,1)(=x F . 所以 .1,10,0,1,,0)(2 >≤<≤?? ???=x x x x x F 三、设X 的概率密度为 ????? ≤ ≤-=其它, 022,cos )(ππx x C x f , 1、求常数C ; 2、均值EX 和方差DX . 解:1、由完备性,C xdx C dx x f 2cos )(122 ?? -∞ ∞ -=== π π, 2 1 = ∴C ;

2、0cos 21 )(22 ??∞ ∞--===π πxdx x dx x xf EX ; ???∞ ∞---====22202 2 22 2 14cos cos 21)(πππ πxdx x xdx x dx x f x EX ; 14 )(2 2 2-= -=∴πEX EX DX . 四、若随机(X ,Y )在以原点为中心的单位圆上服从均匀分布,证明X ,Y 不相互独立. 解:依题意有(X ,Y )的概率密度为221/, 1; (,)0, x y f x y π?+≤=??其它. . 故 11, 11()(,)0, 0, X x x f x f x y dy +∞ -∞ ?-≤≤-≤≤?===????? ? 其它其它; 同理 11()0, Y y f y -≤≤=??其它 . 于是(,)()()X Y f x y f x f y ≠, X 与Y 不相互独立. 五、设X 的概率密度为? ? ?≤≤+=.,0,10,)(其它x bx a x f ,且已知EX =127求DX . 解:由概率密度的完备性有: 1= ?? += ∞+∞ -1 d )(d )(x bx a x x f =b a 5.0+, 且有12 7 =EX = ? ? += ∞+∞ -10 d )(d )(x bx a x x x xf = 3 2b a +, 联立上述两式解得: 1,5.0== b a 又= )(2X E 12 5 d )5.0(1 02= +? x x x , 于是 =DX =-22)()(EX X E 2)12 7(125-14411=. 六、1.设随机变量)3,2(~2 N X ,)()(C X P C X P >=<,则=C ( A ). A . 2 B . 3 C . 9 D . 0 2. 设随机变量),(~2 σμN X ,则随σ增大,}|{|σμ<-X P ( C ). (A) 单调增大; (B) 单调减小; (C) 保持不变; (D) 增减不定

《应用数理统计》期末考试-2011

《应用数理统计》期末考试试题 (2011-11-26上午8:30—10:30) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 1、(20分)设总体X 服从正态分布(0,1)N ,12,X X 为来自总体X 的简单样本,设112212; Y X X Y X X =+=-。 (1)求二维随机变量12(,)Y Y 的联合密度()21,y y f ; (2)分别求12,Y Y 的边缘密度函数()()2121,y f y f Y Y ; (3)12,Y Y 是否独立?说明根据。 (4)叙述2χ分布的构造性定义。能否通过取适当的常数c ,使得2212()c Y Y +服从2χ分布?若可以,求出c ,并写出所服从的2χ分布的自由度。 2、(20分)设12,,,n X X X 是来自正态总体() 2~0,X N σ的简单样本,记 22221 21111??();1n n i i i i X X X n n σσ===-=-∑∑,其中11n i i X X n ==∑, (1)证明:21?σ是2 σ的渐近有效估计量; (2)证明:22?σ是2 σ的有效估计量; (3)试分别以21?σ,22?σ为基础构造2 σ的两种1α-置信区间。你认为你得到的哪个估计区间会更好一些?为什么? 3、(20分)(1)简述假设检验的一般步骤; (2)某厂生产一批产品,质量检查规定:若次品率0.05p ≤,则这批产品可以出厂,否则不能出厂。现从这批产品中抽查400件产品,发现有30件是次品,问:在显著性水平0.05α=下,这批产品能否出厂?若取显著性水平0.02α=,会得出什么结论?α是越小越好吗?对你的答案说明理由。 要求:将此问题转化成统计问题,利用所学知识给出合理的、令人信服的推断,推断过程的每一步要给出理由或公式。分位点定义如下: 若随机变量W ,对任意的()1,0∈α,有()α=≤x W P ,称x 为W 的α分位点,记作αx 。

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1三因子多水平实验方案

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

应用数理统计大作业1——逐步回归法分析终

应用数理统计大作业1——逐步回归法分析终 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

应用数理统计试题

应用数理统计复习题 1.设总体~(20,3)X N ,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,X Y ,则1~(0,)2 X Y N - (||0.3)(0.424)(0.424)0.328P X Y -<=Φ-Φ-= 其中(01)θθ<<为未知参数,已知取得了样本值1231,2,1x x x ===,求θ的矩估计和最大似然估计. 解:(1)矩估计:2 2 22(1)3(1)23EX θθθθθ=+?-+-=-+ 14 (121)33 X =++= 令EX X =,得5?6 θ=. (2)最大似然估计: 2 2 5 6 ()2(1)22L θθθθθθθ=??-=- 45ln() 10120d d θθθθ=-= 得5?6 θ= 3. 设某厂产品的重量服从正态分布,但它的数学期望μ和方差2 σ均未知,抽查10件,测得重量为i X 斤10,,2,1Λ=i 。算出 10 11 5.410i i X X ===∑ 10 21 () 3.6i i X X =-=∑ 给定检验水平0.05 α=,能否认为该厂产品的平均重量为5.0斤? 附:t 1-0.025(9)=2.2622 t 1-0.025(10)=2.2281 t 1-0.05(9)=1.8331 t 1-0.05(10)=1.8125 解: 检验统计量为0 | |/X T S n m -=

将已知数据代入,得2t = = 1/2 0.975(1)(9) 2.26222t n t a - -==> 所以接受0H 。 4. 在单因素方差分析中,因素A 有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平0.05α=下对因素A 是否显著做检验。 解: 0.95(2,9) 4.26F =,7.5 4.26F =>,认为因素A 是显著的. 5. 现收集了16组合金钢中的碳含量x 及强度y 的数据,求得 0.125,45.7886,0.3024,25.5218xx xy x y L L ====,2432.4566yy L =. (1)建立y 关于x 的一元线性回归方程01 ???y x ββ=+; (2)对回归系数1β做显著性检验(0.05α=). 解:(1)1 25.5218 ?84.39750.3024 xy xx l l β== = 01 ??35.2389y x ββ=-= 所以,?35.238984.3975y x =+ (2)1?2432.456684.397525.5218278.4805e yy xy Q l l β=-=-?= 2 278.4805 ?19.8915214 e Q n σ ===- ? 4.46σ ==

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析 摘要 篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。 正文 一、问题描述 随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。 倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。 因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。 二、数据描述 抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

北航2010应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

最新北航数理统计大作业-多元线性回归

北航数理统计大作业-多元线性回归

应用数理统计多元线性回归分析 (第一次作业) 学院: 姓名: 学号: 2013年12月

交通运输业产值的多元线性回归分析 摘要:本文基于《中国统计年鉴》(2012年版)统计数据,寻找影响交通运输业发展的因素,包括工农业发展水平、能源生产水平、进出口贸易交流以及居民消费水平等,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,最后可以利用有效的最优回归模型对将来进行预测。 关键字:多元线性回归,逐步回归,交通运输产值,工业产值,进出口总额1,引言 交通运输业指国民经济中专门从事运送货物和旅客的社会生产部门,包括铁路、公路、水运、航空等运输部门。它是国民经济的重要组成部分,是保证人们在政治、经济、文化、军事等方面联系交往的手段,也是衔接生产和消费的一个重要环节。交通运输业在现代社会的各个方面起着十分重要的作用,因此研究交通运输业发展水平与各个影响因素间的关系显得十分重要,建立有效的数学相关模型对于预测交通运输业的发展,制定相关政策方案提供依据。根据经验交通运输业的发展受到工农业发展、能源生产、进出口贸易以及居民消费水平等众因素的影响,故建立一个完整精确的数学模型在理论上基本无法实现,并且在实际运用中也没有必要,一种简单有效的方式就是寻找主要影响因素,分析其与指标变量的相关性,建立多元线性回归模型就是一种有效的方式。 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为

应用数理统计复习题Word版

应用数理统计复习题 一、填空题 1.设总体2 12~(,),,,...,n X N X X X μσ为样本,样本均值及样本方差分别为, 2 211 11,()n n i i i i X X S X X n n ====-∑∑,设112,,...n n X X X X +与独立同分布,则统计量 ~Y = 。 2.设2 1 ~(),~T t n T 则 。 3.设总体X 的均值为μ,12,,...,n X X X 为样本,当a = 时,E 21 ()n i i X a =-∑达到最 小值。 4. 设总体2 12~(,),,,...,n X N X X X μσ为样本,1 ||,()n i i D X E D μ== -=∑则 5.设总体X 的均值和方差分别为a , b , 样本均值及样本方差分别为 2 211 11,()n n i i i i X X S X X n n ====-∑∑,则 E (S 2 )= 。 6.在总体~(5,16)X N 中随机地抽取一个容量为36的样本,则均值 X 落在4与6 之间的概率 = 6. 设总体X 服从参数为λ的泊松分布,1.9,2,2,2.1, 2.5为样本,则λ的矩估计值 为?λ = 。 7. 设总体2 12~(,),,,...,n X N X X X μσ为样本,1 2 21 1 ?()n i i i c X X σ -+==-∑,若2?σ 为2σ的无偏估计,则 c = 。 8. 设总体12~(,1),,,...,n X U X X X θθ+为样本,则θ的矩估计量为 ,极大似然估计量为 。

9. 设总体2 12~(,),,,...,n X N X X X μσ为样本,μ未知,σ2 已知,为使μ的置信度为1 -α的置信区间长度不超过L ,则需抽取的样本的容量n 至少为 。 10. 设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2 的置信度为1-α的 置信区间为 。 11设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑???? ??=8221,10μ 令Y =X Y Y ??? ? ??=? ??? ??202121,则Y 的分布为 (要求写出分布的参数) 12. 设总体X 在区间]1,[+θθ上服从均匀分布,则θ的矩估计 =θ? ;=)?(θD 。 13. 设n X X ,,1 是来自正态总体),(2σμN 的样本,2 ,σμ均未知,05.0=α. 则μ的置信度为α-1的置信区间为 ;若μ为已知常数,则检验假设 ,::2 0212020σσσσ

北航数理统计期末考试题

材料学院研究生会 学术部 2011 年12 月 2007-2008学年第一学期期末试卷 一、(6 分,A 班不做)设x1,x2,?,x n是来自正态总体N( , 2) 的样本,令 2(x1 x2) T (x3 x4)2 (x5 x6)2 , 试证明T 服从t-分布t(2) 二、( 6 分, B 班不做 ) 统计量F-F(n,m) 分布,证明 1的 (0< <1)的分位点x 是1。 F F1 (n,m) 。 三、(8分)设总体X 的密度函数为 其中1,是位置参数。x1,x2,?,x n是来自总体X 的简单样本, 试求参数的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp ,x p(x; ) 0 , 其它 其中, 已知,0, 是未知参数。x1,x2,?,x n 是来自总体X 的简单样本。

1)试求参数的一致最小方差无偏估计; 2) 是否为的有效估计?证明你的结论。 五、(6分,A 班不做)设x1,x2,?,x n是来自正态总体N( 1, 12) 的 简单样本,y1,y2,?,y n 是来自正态总体N( 2, 22) 的简单样本,且两样本相互独立,其中1, 12, 2, 22是未知参数,1222。为检验假设H0 : 可令z i x i y i, i 1,2,..., n ,1 2 , 1 2, H1 : 1 2, 则上述假设检验问题等价于H0 : 1 0, H1: 1 0,这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,?,z n,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6 分,B 班不做)设x1,x2,?,x n是来自正态总体N( 0, 2) 的简单样本,0 已知,2未知,试求假设检验问题 H0: 202, H1: 202的水平为的UMPT。 七、(6 分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6 分)设方差分析模型为 总离差平方和 试求E(S A ) ,并根据直观分析给出检验假设H0 : 1 2 ... P 0的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D 外,还需考察 A B ,B C 。今选用表L8(27 ) ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

北航应用数理统计大作业多元线性回归

多元线性回归分析 摘要:本文查找2011年《中国统计年鉴》,取我国31个省市自治区直辖市2010年的数据,利用SPSS软件对影响居民消费的因素进行讨论构造线性回归模型。并对模型的回归显著性、拟合度、正态分布等分别进行检验,最终得到最优线性回归模型,寻找影响居民消费的各个因素。 关键字:回归分析;线性;相关系数;正态分布 1. 引言 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为回归分析。 回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程,这一数学表达式通常称为经验公式。一方面,研究者可以利用概率统计知识,对这个经验公式的有效性进行判定;另一方面,研究者可以利用经验公式,根据自变量的取值预测因变量的取值。如果是多个因素作为自变量的时候,还可以通过因素分析,找出哪些自变量对因变量的影响是显著的,哪些是不显著的。 回归分析目前在生物统计、医学统计、经济分析、数据挖掘中得到了广泛的应用。通过对训练数据进行回归分析得出经验公式,利用经验公式就可以在已知自变量的情况下预测因变量的取值。实际问题的控制中往往是根据预测结果来进行的,如在商品流通领域,通常用回归分析商品价和与商品需求之间的关系,以便对商品的价格和需求量进行控制。 本文查找2011年《中国统计年鉴》,取我国31个省市自治区直辖市2010年的数据,利用SPSS软件对影响居民消费的因素进行讨论构造多元线性线性回归模型。以探求影响居民消费水平的各个因素,得到最优线性回归模型。随后,我们对模型的回归显著性、拟合度、正态分布等分别进行检验,以考察线性回归模型的可信度。 本文将分为5章进行论述。在第2章,我们介绍多元线性回归模型的概念。第3章,我们进行模型的建立与数据的收集和整理。我们在第4章对数据进行处理,得出多元线性回归模型,并对其进行检验。在第5章,我们进行总结。2.预备知识 2.1 回归分析 回归分析研究的主要对象是客观事物变量间的统计关系,它是建立在对客观事物进行大量试验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的统计方法。回归分析方法是通过建立统计模型研究变量间相互关系的密切程度、结构状态及进行模型预测的一种有效的工具。

应用数理统计试题

应用数理统计复习题 1.设总体,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,则 2. 设总体具有分布律 1 2 3 其中为未知参数,已知取得了样本值,求的矩估计和最大似然估计. 解:(1)矩估计: 令,得. (2)最大似然估计: 得 3. 设某厂产品的重量服从正态分布,但它的数学期望和方差均未知,抽查10件,测得重量为斤。算出 给定检验水平,能否认为该厂产品的平均重量为5.0斤? 附:t1-0.025(9)=2.2622 t1-0.025(10)=2.2281 t1- 0.05(9)=1.8331 t1-0.05(10)=1.8125 解: 检验统计量为

将已知数据代入,得 所以接受。 4. 在单因素方差分析中,因素有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平下对因素是否显著做检验。 来源平方和自由度均方和F比 因素 4.2 误差 2.5 总和 6.7 解: 来源平方和自由度均方和F比 因素 4.2 2 2.1 7.5 误差 2.5 9 0.28 总和 6.7 11 ,,认为因素是显著的. 5. 现收集了16组合金钢中的碳含量及强度的数据,求得 ,. (1)建立关于的一元线性回归方程; (2)对回归系数做显著性检验(). 解:(1) 所以, (2)

拒绝原假设,故回归效果显著. 6.某正交试验结果如下 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 (1)找出对结果影响最大的因素; (2)找出“算一算”的较优生产条件;(指标越大越好) (3)写出第4号实验的数据结构模型。 解: 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 ⅠⅡR 29.79 25.36 32.0 30.86 35.29 28.65 1.07 9.9 3.35 (1)对结果影响最大的因素是B; (2)“算一算”的较优生产条件为 (3) 4号实验的数据结构模型为 ,

北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判 别分析 应用数理统计第二次大作业 学院名称 学号 学生姓名 摘要 我国幅员辽阔,由于人才、地理位置、自然资源等条件的不同,各地区的财政收入类型各自呈现出不一样的发展趋势,通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文以中国各地财政收入情况为研究对象,从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因

变量,选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源(资产)有偿使用收入11个可能影响中国各地财政收入的因素为自变量,利用统计软件SPSS,对27个地区的财政收入进行了聚类分析,并对另外4个地区的财政收入进行了判别分析,并最终确定了中国各地区根据财政收入类型的分类情况。 关键词:聚类分析,判别分析,SPSS,中国各地财政收入类型 1、引言 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。 本文利用统计软件SPSS,根据各地区的财政收入情况,对北京、天津、河北等27个地区进行聚类分析,并对青海、重庆、四川、贵州4个省市进行判别分析,判断属于聚类分析结果中的哪种财政收入类型。 1.1 聚类分析 聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。本文采用的是系统聚类分析,它又称集群分析,是聚类分析中应用最广的一种方法,其基本思想是:首先将每个聚类对象看作一类,然后根据对象间的相似程度,将相似程度最高的两类进行合并,并计算合并后的类与其他类之间的距离,再选择相近者进行合并,每合并一次减少一类,直至所有的对象都并为一类为止。 系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就

数理统计大作业

数理统计学大作业 学院航空航天工程学部专业飞行器设计 班级航宇二班 学号142103130228 姓名张立 指导教师姜永 负责教师 沈阳航空航天大学 2014年12月

目录 (2) 前言 (3) 一、采集样本数据整理及SPSS统计软件的实现 (4) 1.1、数据的收集方法及说明 (4) 1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4) 1.3、画出直方图和折线图 (6) 1.4、经验分布函数和图形 (6) 1.5、各种概率分布 (7) 二、给出总体分布的参数估计 (12) 2.1、矩估计法 (12) 2.2、最大似然估计 (12) 2.3、参数区间估计 (13) 三、参数的假设检验 (16) 3.1. 样本统计数据的t检验 (16) 3.2样本统计数据的2χ检验 (17) 四、非参数假设检验( 2 χ拟合优度检验) (18) 4.1、2χ拟合优度检验 (18) 五、结论 (20) 参考文献 (21)

数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。 由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.

相关文档
最新文档