(完整版)多元统计复习题附答案

(完整版)多元统计复习题附答案
(完整版)多元统计复习题附答案

复习题

原文:

答案:

4.2 试述判别分析的实质。

4.3 简述距离判别法的基本思想和方法。

4.4 简述贝叶斯判别法的基本思想和方法。

4.5 简述费希尔判别法的基本思想和方法。

4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。

4.2 试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互不相交,且它

们的和集为R p,则称R1,R2?R p为R p的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间R p构造一个“划分”,这个“划分”就构成了一个判别规则。

4.3 简述距离判别法的基本思想和方法。

答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。

①两个总体的距离判别问题

设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是μ1和μ2,对于一个新的样品X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则

X∈G1,D2(X,G1)≤ D2(X,G2)

X ∈G 2 ,D 2(X ,G 1)> D 2

(X ,G 2, 具体分析,

2212(,)(,)

D G D G -X X

111122111111

111222*********

()()()()

2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()

2()

22()2()

---''=-++-'

+?

?=--- ??

?''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为

X ∈G 1 ,W(X)≥0 X ∈G 2 ,W(X)<0

②多个总体的判别问题。

设有k 个总体k G G G ,,,21Λ,其均值和协方差矩阵分别是和k ΣΣΣ,,,21Λ,且

ΣΣΣΣ====k Λ21。计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。

具体分析,21

(,)()()D G ααα-'=--X X μΣX μ

1111

22()C α

αααα----'''=-+''=-+X ΣX μΣX μΣμX ΣX I X

取ααμΣI 1-=,αααμΣμ1

2

1-'-=C ,k ,,2,1Λ=α。

可以取线性判别函数为

()W C αα

α'=+X I X , k ,,2,1Λ=α 相应的判别规则为i G ∈X 若 1()max()i k

W C α

αα≤≤'=+X I X

4.4 简述贝叶斯判别法的基本思想和方法。

基本思想:设k 个总体,其各自的分布密度函数)(,),(),(21x x x k f f f Λ,假设k 个总体各自出现的概率分别为k q q q ,,,21Λ,0≥i q ,

11

=∑=k

i i

q

。设将本来属于i G 总体的样品错判到总体j G 时造成的损失为)|(i j C ,

设k 个总体相应的p 维样本空间为 ),,,(21k R R R R Λ=。

在规则R 下,将属于的样品错判为j G 的概率为

x x d f R i j P j

R i )(),|(?= j i k

j i ≠=,,2,1,Λ

则这种判别规则下样品错判后所造成的平均损失为

∑==k

j R i j P i j C R i r 1

)],|()|([)|( k i ,,2,1Λ=

则用规则R 来进行判别所造成的总平均损失为

∑==k

i i R i r q R g 1

),()(

∑∑===k i k

j i R i j P i j C q 1

1

),|()|(

k μμμ,,,21Λk G G G ,,,21Λk j i ,,2,1,Λ=k G G G ,,,21Λi G

贝叶斯判别法则,就是要选择一种划分,使总平均损失)(R g 达到极小。 基本方法:∑∑===

k i k

j i R i j P i j C q R g 1

1),|()|()(

x x d f i j C q k

i k

j R i i j

∑∑?===1

1

)()|(

∑?∑===k j R k

i i i j

d f i j C q 1

1

))()|((x x

1

(|)()()k i

i

j

i q C j i f h ==∑x x ,则 ∑?

==k

j R j j

d h R g 1

)()(x x

若有另一划分),,,(**2*1*

k

R R R R Λ=,∑?

==k

j R j j

d h R g 1

*

*)()(x x

则在两种划分下的总平均损失之差为

∑∑?

==?-=-k i k

j R R j i j

i d h h R g R g 11

*

*)]()([)()(x x x

因为在i R 上)()(x x j i h h ≤对一切j 成立,故上式小于或等于零,是贝叶斯判别的解。 从而得到的划分)

,,,(21k R R R R Λ=为

1{|()min ()}

i i j j k

R h h ≤≤==x x x k i ,,2,1Λ=

4.5 简述费希尔判别法的基本思想和方法。

答:基本思想:从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 1122()p p U u X u X u X '=+++=X u X L 系数),,,(21'=p u u u Λu 可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出()U X 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。

答:① 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。

② 当k=2时,若Σ1=Σ2=Σ则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。

③ 当Σ1≠Σ2时,费希尔判别用Σ1+Σ2作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。 ④ 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X ∈G 1 ,W(X)≥lnd

X ∈G 2 ,W(X)

二者的区别在于阈值点。当21q q =,)1|2()2|1(C C =时,1=d ,0ln =d 。二者完全相同。

4.7 设有两个二元总体G 1和G 2 ,从中分别抽取样本计算得到 X ?(1)=(51), X ?(2)=(3?2),S p =(

5.8 2.12.17.6) 假设Σ1=Σ2,试用距离判别法建立判别函数和判别规则。 样品X =(6,0)’应属于哪个总体?

解:μ?1=X ?(1)=(5

1) ,μ?2=X ?(2)=(3

?2) , μ??=μ?1+μ?2

2

=(4

?0.5) W p =α’(x ?μ

?)=(x ?μ?)′Σ?1

(μ1?μ2)

k R R R ,,,21Λ

(x ?μ?)′=(6,0)?(4,0.5)=(2,0.5)

Σ?1=

13967(7.6?2.1

?2.1 5.8) (μ1?μ2)=(2,3)′ W p =(2,0.5)

13967(7.6?2.1?2.1 5.8)(2

3)=

24.439.67

>0 ∴ X ∈G 1即样品X 属于总体G 1

5.1 判别分析和聚类分析有何区别? 5.2 试述系统聚类的基本思想。

5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造

5.5试述K 均值法与系统聚类法的异同。

5.1 判别分析和聚类分析有何区别?

答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。

5.2 试述系统聚类的基本思想。

答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。

5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造?

答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n 个样本看作p 维空间的n 个点。点之间的距离即可代表样品间的相似度。常用的距离为 (一)闵可夫斯基距离:1/1

()()

p

q q

ij ik jk k d q X X ==-∑

q 取不同值,分为 (1)绝对距离(1q =)

1

(1)p

ij ik jk k d X X ==-∑

(2)欧氏距离(2q =)

21/2

1

(2)()

p

ij ik jk k d X X ==-∑

(3)切比雪夫距离(q =∞)

1()max ij ik jk

k p

d X X ≤≤∞=-

1

()p

ik jk

X X d L -=

(二)马氏距离

(三)兰氏距离

对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 将变量看作p 维空间的向量,一般用

(一)夹角余弦

(二)相关系数

5.5试述K 均值法与系统聚类法的异同。

答:相同:K —均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。

不同:系统聚类对不同的类数产生一系列的聚类结果,而K —均值法只能产生指定类数的聚类结果。

具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K —均值法确定类数的参考。

6.1 试述主成分分析的基本思想。 6.2 主成分分析的作用体现在何处?

6.3 简述主成分分析中累积贡献率的具体含义。

6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

6.1 试述主成分分析的基本思想。

答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。

6.2 主成分分析的作用体现在何处?

答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得

2

1()()()ij i j i j d M -'=--X X ΣX X

cos p

ik jk

ij X X θ=∑

()()p

ik i jk j ij X X X X r --=∑

到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。

6.3 简述主成分分析中累积贡献率的具体含义。

答:主成分分析把p 个原始变量12,,,p X X X L 的总方差()tr Σ分解成了p 个相互独立的变量12,,,p Y Y Y L 的方差之和

1

p

k

k λ

=∑。主成分分析的目的是减少变量的个数,所以一般不会使用所有p 个主成分的,忽略一些带有较小方差的主成

分将不会给总方差带来太大的影响。这里我们称1

p

k k

k k ?λλ==∑ 为第k 个主成分

k Y 的贡献率。第一主成分的贡献率

最大,这表明11Y T '=X 综合原始变量12,,,p X X X L 的能力最强,而23,,,p Y Y Y L 的综合能力依次递减。若只取()

m p <个主成分,则称1

1

p

m

m k

k

k k ψλλ

===∑∑ 为主成分1,,m Y Y L 的累计贡献率,累计贡献率表明1,,m Y Y L 综合12,,,p

X X X L 的能力。通常取m ,使得累计贡献率达到一个较高的百分数(如85%以上)。

6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵Σ出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R 代替∑。对于研究经济问题所涉及的变量单位大都不统一,采用R 代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。

7.1 试述因子分析与主成分分析的联系与区别。 7.2 因子分析主要可应用于哪些方面?

7.3 简述因子模型X =AY +ε中载荷矩阵A 的统计意义。

7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?

7.1 试述因子分析与主成分分析的联系与区别。

答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。

因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。

7.2 因子分析主要可应用于哪些方面?

答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。

7.3 简述因子模型X =AY +ε中载荷矩阵A 的统计意义。 答:对于因子模型

1122i i i ij j im m i X a F a F a F a F ε=++++++L L 1,2,,i p =L 因子载荷阵为1112

121

2221212

(,,,)m m m

p p pm a a a a a a A A A a a a ?????

?==??????

?

?L L L L L L L L

A

i X 与j F 的协方差为:

1Cov(,)Cov(,)m

i j ik k i j k X F a F F ε==+∑

=1

Cov(

,)Cov(,)m

ik

k j i j k a

F F F ε=+∑

=ij a

若对i X 作标准化处理,r X i ,F j =ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量

i

X 对公共因子

j

F 的相对重要性。

变量共同度2

21

1,2,,m

i

ij

j h a

i p ==

=∑L

2221122()()()()()i i i im m i D X a D F a D F a D F D ε=++++L 22

i i h σ=+ 说明变量i X 的方差由两部分组成:第一部分为

共同度2

i h ,它描述了全部公共因子对变量i X 的总方差所作的贡献,反映了公共因子对变量i X 的影响程度。第二部分为特殊因子i ε对变量i X 的方差的贡献,通常称为个性方差。 而公共因子j F 对X 的贡献221

1,2,,p

j

ij

i g a

j m ==

=∑L

表示同一公共因子j F 对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。

7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?

答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。

最大方差旋转法是一种正交旋转的方法,其基本思路为: ①A →A ?→(d 11

d 12?

?d p1

d p2 ?d 1m ???d pm

) 其中令*

**(),

/ij

p m ij ij

i a d a h ?===A A Γ 21

1p j ij i d d p ==∑ *

A 的第j 列元素平方的相对方差可定义为2

21

1()p j ij j i V d d p ==-∑

②12m V V V V =+++L

最大方差旋转法就是选择正交矩阵Γ,使得矩阵*A 所有m 个列元素平方的相对方差之和达到最大。

8.1 什么是对应分析?它与因子分析有何关系?

8.2试述对应分析的基本思想。 8.3 试述对应分析的基本步骤。

8.1 什么是相应分析?它与因子分析有何关系?

答:相应分析也叫对应分析,通常意义下,是指两个定性变量的多种水平进行相应性研究。其特点是它所研究的变量可以是定性的。

相应分析与因子分析的关系是: 在进行相应分析过程中,计算出过渡矩阵后,要分别对变量和样本进行因子分析。因此,因子分析是相应分析的基础。具体而言,Σr (Zu j )=λj (Zu j )式表明Zu j 为相对于特征值λj 的关于因素A 各水平构成的协差阵Σr 的特征向量。从而建立了相应分析中R 型因子分析和Q 型因子分析的关系。

8.2试述相应分析的基本思想。

答:相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A 和B ,其中因素A 包含r 个水平,因素B 包含c 个水平。对这两组因素作随机抽样调查,得到一个r c ?的二维列联表,记为()ij r c k ?=K 。要寻求列联表列因素A 和行因素B 的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。

8.3 试述相应分析的基本步骤。 答:(1)建立列联表 设受制于某个载体总体的两个因素为A 和B ,其中因素A 包含r 个水平,因素B 包含c 个水平。对这两组因素作随机抽样调查,得到一个r c ?的二维列联表,记为

()ij r c

k ?=K 。

(2)将原始的列联资料K =(kij) r ?c 变换成矩阵Z =(zij) r ?c ,使得zij 对因素A 和列因素B 具有对等性。通过变换Z ij =

k ?k i.k .j r

k k 。得c '=ΣZ Z ,r '=ΣZZ 。

(3)对因素B 进行因子分析。

计算出c '=ΣZ Z 的特征向量λ1,λ2?,λm 及其相应的特征向量 t 1,t 2,?t m 计算出因素B 的因子(U 1,U 2?U )=(√λ1t 1,√λ2t 2,?√λm t m ) (4)对因素A 进行因子分析。

计算出r '=ΣZZ 的特征向量λ1,λ2?,λm 及其相应的特征向量v 1,v 2,?v m 计算出因素A 的因子(V 1,V 2?V m )=(√λ1v 1,√λ2v 2,?√λm v m (5)选取因素B 的第一、第二公因子U 1,U 2 选取因素A 的第一、第二公因子V 1,V 2

将B 因素的c 个水平(U 11,U 12),(U 21,U 22)?,(U c1,U c2) A 因素的r 个水平(V 11,V 12)(V 21,V 22)(V r1,V r2) 同时反应到相同坐标轴的因子平面上上

(6)根据因素A 和因素B 各个水平在平面图上的分布,描述两因素及各个水平之间的相关关系。

9.1 什么是典型相关分析?简述其基本思想。 9.2 什么是典型变量?它具有哪些性质?

9.3 试分析一组变量的典型变量与其主成分的联系与区别。

9.1 什么是典型相关分析?简述其基本思想。

答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。 基本思想:

(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即: 若设(1)

(1)(1)(1)12(,,,)p X X X =X

L 、(2)(2)(2)(2)

12(,,,)q X X X =X L 是两组相互关联的随机变量,分别在两组变量中选

取若干有代表性的综合变量Ui 、Vi ,使是原变量的线性组合。

在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大。(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。

9.2 什么是典型变量?它具有哪些性质?

答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。具体来说,

()(1)()(1)()(1)()(1)

11

22

i i i i i P P

U a X a X

a X

'=+++a X L @

()(2)()(2)()(2)

()(2)1122i i i i i q q V b X b X b X '=+++b X L @

在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大,则称(1)(1)'a X 、(1)(2)'b X 是(1)X 、

(2)X 的第一对典型相关变量。

典型变量性质:

典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。 1. ()1,()1

(1,2,,)k k D U D V k r ===L

(,)0,(,)0()i j i j Cov U U Cov V V i j ==≠

2. 0(,1,2,,)(,)0

()0()

i i j i j i r Cov U V i j j r λ≠==??

=≠??>?

L

9.3 试分析一组变量的典型变量与其主成分的联系与区别。

答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。

()(1)()(1)()(1)()(1)

1122i i i i i P P U a X a X a X '=+++a X L @ ()(2)()(2)()(2)()(2)1122i i i i i q q V b X b X b X '=+++b X L @ (1)(1)(1)(1)1

2

(,,,)p

X X X =L X 、(2)(2)(2)(2)1

2

(,,,)q

X X X =L X

4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。

6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。

6.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。

7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。

4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。

⑴根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。

⑵现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。

解:增加group变量,令畅销、平销、滞销分别为group1、2、3;销售价格为X1,口味评分为X2,信任度评分为X3,用spss 解题的步骤如下:

1.在SPSS窗口中选择Analyze→Classify→Discriminate,调出判别分析主界面,将左边的变量列表中的

“group”变量选入分组变量中,将X1、X2、X3变量选入自变量中,并选择Enter independents together

单选按钮,即使用所有自变量进行判别分析。

2.点击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值

和最大值中分别输入1和3。单击Continue按钮,返回主界面。如图4.1

图4.1 判别分析主界面

3. 单击Statistics …按钮,指定输出的描述统计量和判别函数系数。选中Function Coefficients 栏中的Fisher ’s :给出Bayes 判别函数的系数。(注意:这个选项不是要给出Fisher 判别函数的系数。这个复选框的名字之所以为Fisher ’s ,是因为按判别函数值最大的一组进行归类这种思想是由Fisher 提出来的。这里极易混淆,请读者注意辨别。)如图

4.2。单击Continue 按钮,返回主界面。

图4.2 statistics 子对话框

4. 单击Classify …按钮,弹出classification 子对话框,选中Display 选项栏中的Summary table 复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。如图4.3。

图4.3 classification 对话框

5. 返回判别分析主界面,单击OK 按钮,运行判别分析过程。

1) 根据判别分析的结果建立Bayes 判别函数: Bayes 判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes 判别函数系数。由此可建立判别函数如下: Group1: 3761.162297.121689.11843.811X X X Y ++--= Group2: 3086.172361.131707.10536.942X X X Y ++--=

Group3: 3447.62960.41194.2449.173X X X Y ++--=

将各样品的自变量值代入上述三个Bayes 判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。

Classification Function Coefficients

group

1 2 3 x1 -11.689 -10.707 -2.194 x2 12.297 13.361 4.960 x3

16.761

17.086

6.447

表4.1 Bayes 判别函数系数

根据此判别函数对样本进行回判,结果如表4.2。从中可以看出在4种畅销饮料中,有3种被正确地判定,有1种被错误地判定为平销饮料,正确率为75%。在3种平销饮料中,有2种被正确判定,有1种被错误地判定为畅销饮料,正确率为66.7%。3种滞销饮料均正确判定。整体的正确率为80.0%。

Classification Results a

group Predicted Group Membership Total

1

2

3

Original

Count

1 3 1 0

4 2 1 2 0 3 3

0 0 3 3 %

1 75.0 25.0 .0 100.0

2 33.

3 66.7 .0 100.0 3

.0

.0

100.0

100.0

a. 80.0% of original grouped cases correctly classified.

表4.2 错判矩阵

2) 该新饮料的0.31=X ,82=X ,53=X ,将这3个自变量代入上一小题得到的Bayes 判别函数,2Y 的值最大,

该饮料预计平销。也可通过在原样本中增加这一新样本,重复上述的判别过程,并在classification 子对话框中同时要求输出casewise results ,运行判别过程,得到相同的结果。

6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。

解:令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,用SPSS 对这六个行业进行主成分分析的方法如下:

1. 在SPSS 窗口中选择Analyze →Data Reduction →Factor 菜单项,调出因子分析主界面,并将变量15X X -移

入Variables 框中,其他均保持系统默认选项,单击OK 按钮,执行因子分析过程(关于因子分子在SPSS 中实现的详细过程,参见7.7)。得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。 第一个因子就可以解释86.5%

表6.1 特征根和方差贡献率表

表6.2 因子载荷阵

2.将表6.2中因子载荷阵中的数据输入SPSS数据编辑窗口,命名为a1。点击菜单项中的Transform→Compute,

调出Compute variable对话框,在对话框中输入等式:

z1=a1 / SQRT(3.46),计算第一个特征向量。点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。

表6.3

根据表6.3得主成分的表达式:

X

Y1X

.0

X

509

+

+

X+

=

530

.0

413

4

3

.0

.0

537

2

1

3.再次使用Compute命令,调出Compute variable对话框,在对话框中输入等式:

y1x

.0

4

*

x

x

=

+

+

x+

1

509

3

.0

413

*

*

.0

537

*

2

.0

53

根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。

6.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。

解:用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:

表6.7 特征根和方差贡献率表

表6.8 因子载荷阵

根据表6.6得主成分的表达式:

939.0839.0731.064.054.0431.0314.0228.0129.01X X X X X X X X X Y +++-++++= 924.0812.0739.0627.052.0437.0329.0248.0147.02X X X X X X X X X Y -++----+=

分别计算出以上三项后,利用公式2121Y Y Y ∑∑+=

λ

λ

λλ得到综合得分并排序如下表:

最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。

可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。根据表7.3易得:

X

X

X

064

X

.0

1X

+

+

=

+

1

F+

X

+

378

.0

5

.0

.0

432

4

6

2

085

332

.0

137

.0

3

X

X

.0

2X

X

X

+

=

439

+

+

F+

+

X

.0

073

.0

5

.0

6

169

4

014

400

.0

2

.0

3

484

1

表7.3 因子得分系数矩阵

将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,F2大的适合学理。

计算结果为学号是1、16、24的学生适合学文,其余均适合学理。

7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分

解:令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7,燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。

此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个成分贡献了90.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的Number of factors后的矩形框中输入3,即为要提取的公因子的数目。因子分析结果如下:

表7.4 旋转后的因子得分系数矩阵

其简化了指标体系为1F 、2F 、3F ,从旋转后的因子得分系数矩阵得:

9071.08186.07036.06599.05354.04305.03060.02015.01399.01X X X X X X X X X F --++++---= 9082.08221.07291.06100.05195.04344.03700.02525.01289.02X X X X X X X X X F +---+-++= 9239.08651.07494.06332.05338.04241.03409.02278.01342.03X X X X X X X X X F --+--+--=

《应用概率统计》复习题及答案

工程硕士《应用概率统计》复习题 考试要求:开一页;题目类型:简答题和大题;考试时间:100分钟。 1. 已知 0.5,)( 0.4,)( 0.3,)(===B A P B P A P 求)(B A P ?。 解:因为 0.7,0.3-1)(-1(A)===A P P 又因为, ,-- A B A B A A B A AB ?== 所以 0.2,0.5-7.0)( -(A))(A ===B A P P B P 故 0.9.0.2-0.40.7P(AB)-P(B)(A))(A =+=+=?P B P 2.设随机变量)1(,9 5 )1(),,4(~),,2(~≥=≥Y P X P p b Y p b X 求并且。 解: . 8165 31-1-10)(Y -11)(Y ),3 1,4(~,31,94-1-1-10)(X -1)1(,9 5)1(),,2(~422 ====≥=====≥=≥)(故从而解得)所以() (而且P P b Y p p p P X P X P p b X 3.随机变量X 与Y 相互独立,下表中给出了X 与Y 的联合分布的部分数值,请将表中其

4.设随机变量Y 服从参数2 1=λ的指数分布,求关于x 的方程0322 =-++Y Yx x 没有实根的概率。 解:因为当时没有实根时,即0128Y -Y 03)-4(2Y -Y 2 2 <+<=?,故所求的概率为}6Y P{20}128Y -P{Y 2 <<=<+,而Y 的概率密度 ?? ???≤>=0,00 ,21f(y)21-y y e y ,从而36221 -621-1dy 21f(y)dy 6}Y {2e e e P y ===<

应用概率统计综合作业三

应用概率统计综合作业 三 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

《应用概率统计》综合作业三 一、填空题(每小题2分,共20分) 1.在天平上重复称量一重为a 的物品,测量结果为1X ,2X ,…,n X ,各次结果相互独立且服从正态分布)2.0,(2a N ,各次称量结果的算术平均值记为n X ,为使 95.0)1.0(≥<-a X P n ,则n 的值最小应取自然数 16 . 2.设1X ,2X ,…,n X 是来自正态总体)4,(2μN 的容量为10的简单随机样本,2S 为样本方差,已知1.0)(2=>a s P ,则a = 1 . 3.设随机变量Y 服从自由度为n 的t 分布,则随机变量2Y 服从自由度为 (1,n ) 的 F 分布. 4.设总体X 服从正态分布),12(2σN ,抽取容量为25的简单随机样本,测得样本方差为57.52=S ,则样本均值X 小于的概率为 4/25 . 5.从正态分布),(2σμN 中随机抽取容量为16的随机样本,且σμ,未知,则概率 =??? ? ??≤041.222σS P 1 . 6.设总体X 的密度函数为???<<+=,其他, 0,10 , )1(),(x x x f a αα其中1->α,1X , 2X ,…,n X 是取自总体X 的随机样本,则参数α的极大似然估计值为 . 7.设总体X 服从正态分布),(2σμN ,其中μ未知而2σ已知,为使总体均值μ的置信度为α-1的置信区间的长度等于L ,则需抽取的样本容量n 最少为 u=(x-u0)×sqrt(n)/σ .

《应用概率统计》张国权编课后答案详解习题一解答

习 题 一 解 答 1. 设A、B、C表示三个随机事件,试将下列事件用A、B、C及其运算符号表示出来: (1) A发生,B、C不发生; (2) A、B不都发生,C发生; (3) A、B中至少有一个事件发生,但C不发生; (4) 三个事件中至少有两个事件发生; (5) 三个事件中最多有两个事件发生; (6) 三个事件中只有一个事件发生. 解:(1)C B A (2)C AB (3)()C B A ? (4)BC A C AB ABC ?? (5)ABC (6)C B A C B A C B A ?? ――――――――――――――――――――――――――――――――――――――― 2. 袋中有15只白球 5 只黑球,从中有放回地抽取四次,每次一只.设Ai 表示“第i 次取到白球”(i =1,2,3,4 ),B表示“至少有 3 次取到白球”. 试用文字叙述下列事件: (1) 41 ==i i A A , (2) A ,(3) B , (4) 32A A . 解:(1)至少有一次取得白球 (2)没有一次取得白球 (3)最多有2次取得白球 (4)第2次和第3次至少有一次取得白球 ――――――――――――――――――――――――――――――――――――――― 3. 设A、B为随机事件,说明以下式子中A、B之间的关系. (1) A B=A (2)AB=A 解:(1)A B ? (2)A B ? ――――――――――――――――――――――――――――――――――――――― 4. 设A表示粮食产量不超过500公斤,B表示产量为200-400公斤 ,C表示产量低于300公斤,D表示产量为250-500公斤,用区间表示下列事 件: (1) AB , (2) BC ,(3) C B ,(4)C D B )( ,(5)C B A . 解:(1)[]450,200; (2)[]300,200 (3)[]450,0 (4)[]300,200 (5)[]200,0 ――――――――――――――――――――――――――――――――――――――― 5. 在图书馆中任选一本书,设事件A表示“数学书”,B表示“中文版”, C表示“ 1970 年后出版”.问: (1) ABC表示什么事件? (2) 在什么条件下,有ABC=A成立? (3) C ?B表示什么意思? (4) 如果A =B,说明什么问题? 解:(1)选了一本1970年或以前出版的中文版数学书 (2)图书馆的数学书都是1970年后出版的中文书 (3)表示1970年或以前出版的书都是中文版的书 (4)说明所有的非数学书都是中文版的,而且所有的中文版的书都不是数学书 ――――――――――――――――――――――――――――――――――――――― 6. 互斥事件与对立事件有什么区别?试比较下列事件间的关系. (1) X < 20 与X ≥ 20 ; (2) X > 20与X < 18 ;

应用概率统计综合作业三

《应用概率统计》综合作业三 一、填空题(每小题2分,共20分) 1.在天平上重复称量一重为a 的物品,测量结果为1X ,2X ,…,n X ,各次结果相互独立且服从正态分布)2.0,(2 a N ,各次称量结果的算术平均值记为n X ,为使 95.0)1.0(≥<-a X P n ,则n 的值最小应取自然数 16 . 2.设1X ,2X ,…,n X 是来自正态总体)4,(2 μN 的容量为10的简单随机样本,2S 为样本方差,已知1.0)(2 =>a s P ,则a = 1 . 3.设随机变量Y 服从自由度为n 的t 分布,则随机变量2Y 服从自由度为 (1,n ) 的 F 分布. 4.设总体X 服从正态分布),12(2 σN ,抽取容量为25的简单随机样本,测得样本方差为 57.52=S ,则样本均值X 小于12.5的概率为 4/25 . 5.从正态分布),(2 σμN 中随机抽取容量为16的随机样本,且σμ,未知,则概率 =??? ? ??≤041.222σS P 1 . 6.设总体X 的密度函数为? ??<<+=,其他,0,10 , )1(),(x x x f a αα其中1->α,1X ,2X ,…, n X 是取自总体X 的随机样本,则参数α的极大似然估计值为 . 7.设总体X 服从正态分布),(2 σμN ,其中μ未知而2σ已知,为使总体均值μ的置信度为α-1的置信区间的长度等于L ,则需抽取的样本容量n 最少为 u=(x-u0)×sqrt(n)/σ . 8.设某种零件的直径(mm )服从正态分布),(2 σμN ,从这批零件中随机地抽取16个零件,测得样本均值为075.12=X ,样本方差00244.02=S ,则均值μ的置信度为0.95的置信区间为 :(1025.75-21.315,1025.75+21.315)=(1004.435,1047.065). . 9.在假设检验中,若2σ未知,原假设00: μμ=H ,备择假设01: μμ>H 时,检验的拒

应用概率统计期末复习题及答案

第七章课后习题答案 7.2 设总体X ~ N(12,4), X^XzJII’X n 为简单随机样本,求样本均值与总体均值之 差的绝对 值大于1的概率. X 解:由于 X ~ N(12,4),故 X 一 ~ N(0,1) /V n 1 ( 2 0.8686 1) 0.2628 10 7.3 设总体X ?N(0,0.09),从中抽取n 10的简单随机样本,求P X : 1.44 i 1 X i 0 X i 0 X i ~N(0,°.09),故亠-X0r~N(0,1) X 所以 ~ N(0,1),故U n P{ X 1} 1 P{ X 1} 解: 由于X ~ N (0,0.09),所以 10 所以 X i 2 2 是)?(10) 所以 10 10 X : 1.44 P i 1 i 1 X i 2 (倉 1.44 P 0.09 2 16 0.1 7.4 设总体 X ~ N( , 2), X 1,X 2,|||,X n 为简单随机样本 2 ,X 为样本均值,S 为样 本方差,问U n X 2 服从什么分布? 解: (X_)2 2 ( n )2 X __ /V n ,由于 X ~ N( , 2), 2 ~ 2(1)。 1 —n

7.6 设总体X ~ N( , 2), Y?N( , 2)且相互独立,从X,Y中分别抽取 m 10, n215的简单随机样本,它们的样本方差分别为S2,M,求P(S2 4S ; 0)。 解: S2 P(S24S2 0) P(S24S;) P 12 4 由于X ~ N( , 2), Y~ N( , 2)且相互独立S2 所以S12~ F(10 1,15 1),又由于F°oi(9,14) 4.03 S2 即P F 4 0.01

应用概率统计试卷

062应用数学 一、 填空题(每小题2分,共2?6=12分) 1、设服从0—1分布的一维离散型随机 变量X 的分布律是:011X P p p -, 若X 的方差是1 4,则P =________。 2、设一维连续型随机变量X 服从正态分布()2,0.2N ,则随机变量21Y X =+ 的概率密度函数为______________。 3、设二维离散型随机变量X 、Y 的联合分布律为:则a , b 满足条件:___________________。 X Y 11 2 3 1115 6 9

4、设总体X 服从正态分布()2 ,N μσ , 12,,...,n X X X 是它的一个样本,则样本均 值X 的方差是________。 5、假设正态总体的方差未知,对总体均值 μ 作区间估计。现抽取了一个容量 为n 的样本,以X 表示样本均值,S 表示样本均方差,则μ 的置信度为1-α 的置信区间为:_______________________。 6、求随机变量Y 与X 的线性回归方程 Y a b X =+ ,在计算公式 xy xx a y b x L b L ?=-? ?=?? 中,() 2 1 n xx i i L x x == -∑,xy L = 。

二、单项选择题(每小题2分,共2?6=12分) 1、设A ,B 是两个随机事件,则必有( ) ()()()()()()()()A P A B P A P B B P A B P A P A B -=--=- ()()()() ()()()()()C P A B P A P B D P A B P A P A P B -=-=- 2、设A ,B 是两个随机事件, ()()() 524,,556 P A P B P B A === ,( ) () ()()1 1()()()232 12 ()()3 25 A P A B B P AB C P AB D P AB === = 3、设X ,Y 为相互独立的两个随机变量,则下列不正确的结论是( )

应用概率统计第7次作业

1 应用概率统计第7次作业 姓名: 班级: 学号(后3位): 1. 设12,,,n X X X 是来自二项分布),(p m B 总体的一个样本,12,,,n x x x 为其样本观测值,其中m 是正整数且已知,p (10<

概率论复习题

函授概率论与数理统计复习题 一、填空题 1、已知P(A)=P(B)=P(C)=25.0,P(AC)=0,P(AB)=P(BC)=15.0,则A 、B 、C 中至少有一个发生的概率为 0.45 。 2、A 、B 互斥且A=B ,则P(A)= 0 。 3.把9本书任意地放在书架上,其中指定3 本书放在一起的概率为 1 12 4. 已知()0.6P A =,()0.8P B =,则()P AB 的最大值为0.6 ,最小值为0.4。 5、设某试验成功的概率为0.5,现独立地进行该试验3次,则至少有一次成功的 概率为 0.875 6、 已知()0.6P A =,()0.8P B =,则()P AB 的最大值为 0.6 。 ,最小值为 0.4 。 7、设A 、B 为二事件,P(A)=0.8,P(B)=0.7,P(A ∣B )=0.6,则P(A ∪B)= 0.88 。 8、设X 、Y 相互独立,X ~)3,0(U ,Y 的概率密度为 ???? ?>=-其它,00 ,41)(41x e x f x ,则(253)E X Y -+= -14 ,(234)D X Y -+= 147 。 9.设 A 、B 为随机事件, P (A ) = 0.3, P (B ) = 0.4, 若 P (A |B ) =0.5, 则 P (A ?B ) = ____0.5___; 若 A 与 B 相互独立, 则 P (A ?B ) = ___0.58______. 10.已知()0.5,()0.6,()0.2P A P B P A B ===,则()P AB = 0.3 11.设随机变量 X 在区间 [1, 6] 上服从均匀分布, 则 P { 1 < X < 3} = ____2/5_______.

应用概率统计期末复习题及答案

第七章课后习题答案 7.2 设总体12~(12,4),,,,n X N X X X L 为简单随机样本,求样本均值与总体均值之 差的绝对值大于1的概率. 解:由于~(12,4)X N , ~(0,1)X N {1}1{1}1P X P X P μμ?->=--≤=-≤ 112(11(20.86861)0.262822P ??=-≤=-Φ-=-?-=?????? 7.3 设总体~(0,0.09),X N 从中抽取10n =的简单随机样本,求1021 1.44i i P X =?? >???? ∑. 解:由于~(0,0.09),X N 所以~(0,0.09),i X N 故 ~(0,1)0.3 i i X X N σ --= 所以 10 2 21 ( )~(10)0.3 i i X χ=∑ 所以{}1010222 11 1.441.44()160.10.3 0.09i i i i X P X P P χ==????>=>=>=????????∑∑ 7.4 设总体2 ~(,),X N μσ12,,,n X X X L 为简单随机样本, X 为样本均值,2 S 为样 本方差,问2 X U n μσ?? -= ??? 服从什么分布? 解: 2 2 2 X X X U n μσ????-=== ???,由于2 ~(,)X N μσ, ~(0,1)N ,故2 2 ~(1)X U χ??=。

7.6 设总体2 ~(,),X N μσ2 ~(,)Y N μσ且相互独立,从,X Y 中分别抽取1210,15n n ==的简单随机样本,它们的样本方差分别为22 12,S S ,求2212(40)P S S ->。 解: 22 22211 2 1 2 22(40)(4)4S P S S P S S P S ?? ->=>=> ??? 由于2 ~(,),X N μσ2 ~(,)Y N μσ且相互独立 所以2 122 ~(101,151)S F S --,又由于0.01(9,14) 4.03F = 即()40.01P F >=

应用概率统计综合作业四

《应用概率统计》综合作业四 一、填空题(每小题2分,共28分) 1.一元线性回归方程,bx a y +=?中x 是自变量,y 是因变量. 2.回归系数b ?==xy xx xy l l l 则,;= xx l . 3.方程x b a y ??~+=,y 称为估计值,y ~称为一元线性回归方程. 4.相关系数是表示随机变量Y 与自变量X 之间相关程度的一个数字特征. 5.相关系数r = ;与回归系数b ?的关系. 6.回归平方和U = 或______________,反映了回归值 ),...,2,1(~n i y i = _的分散程度_____________. 7.剩余平方和Q =或 ;反映了观测值),...,2,1(~n i y i =的 偏离经验回归直线的程度. 8.设0 ??~x b a y +=,0y 的1-α置信区间为()(~00x y δ-,)(~00x y δ+)则 0(x δ)= _____ ,其中s = . 9.根据因素A 的k 个不同水平,...,21A A k A ,的k 组观测数据来检验因素A 对总体的影响是否显著,检验假设K H μμμ=== 210:,如果αF F >时,则在水平α下__拒绝假设Ho____________,认为___因素A 对总体有显著影响___________________;如果αF F <时,则在水平α下___接受Ho____________,认为_____因素A 对总体的影响不显著________________. 10.如果因素A 的k 个不同水平对总体的影响不大,F =E A S S ;反之

. 11.正交表是一系列规格化的表格,每一个表都有一个记号,如)2(78L ,其中L 表示__正交表______,8是正交表的____行_________,表示____有8横行______________;7是正交表的______列______,表示___有3纵列__________________;2是___数字种类_____________,表示此表可以安排__2种数字_________________. 12.正交表中,每列中数字出现的次数____相等________;如)2(39L 表每列中数字___2_____均出现_____3 _______. 13.正交表中,任取2列数字的搭配是__次齐全而且均衡______,如)2(78L 表里每两列中__________________第七横行_____________________各出现2次. 14. )3,2,1(3 1 == ∑=i x K j ij A i =__________ __________________________. 二、选择题(每小题2分,共12分) 1.离差平方和xx l =( C ). A 、∑∑==-n i i n i x n x 1212)(1 B 、∑∑==-n i i n i y n y 121 2 )(1 C 、 ∑=--n i i i bx a y 1 2 )( D 、∑=--n i i i y y x x 1 ))(( 2.考查变量X 与变量Y 相关关系,试验得观测数据(i x ,i y ),i=1,2,…,n 则 ∑∑∑===- n i n i n i i i i i y x n y x 1 1 1 ))((1 (D ). A 、称为X 的离差平方和 B 、称为Y 的离差平方和 C 、称为X 和Y 的离差乘积和 D 、称为X 和Y 的离差平方和 3.当050r ?<|r|≤010r ?时,则变量Y 为X 的线性相关关系( B ). A 、不显著 B 、显著 C 、特别显著 D 、特别不显著

应用概率统计综合作业三

应用概率统计综合作业三

《应用概率统计》综合作业三 一、填空题(每小题2分,共20分) 1.在天平上重复称量一重为a 的物品,测量结果为1 X ,2 X ,…,n X ,各次结果相互独立且服从正 态分布)2.0,(2 a N ,各次称量结果的算术平均值记为n X ,为使95.0)1.0(≥<-a X P n ,则n 的值最小应取自然数 16 . 2.设1X ,2X ,…,n X 是来自正态总体)4,(2 μN 的容 量为10的简单随机样本,2 S 为样本方差,已知 1 .0)(2=>a s P ,则a = 1 . 3.设随机变量Y 服从自由度为n 的t 分布,则随机 变量2 Y 服从自由度为 (1,n ) 的 F 分布. 4.设总体X 服从正态分布),12(2 σN ,抽取容量为25 的简单随机样本,测得样本方差为57 .52 =S ,则样 本均值X 小于12.5的概率为 4/25 . 5.从正态分布),(2 σμN 中随机抽取容量为16的随机样本,且σ μ,未知,则概率 = ??? ? ??≤041.222σS P 1 . 6.设总体X 的密度函数为 ?? ?<<+=,其他, 0, 10 , )1(),(x x x f a αα其中 1->α,1X ,2X ,…,n X 是取自总体X 的随机样本,

则参数α的极大似然估计值为 . 7.设总体X 服从正态分布),(2 σμN ,其中μ未知而2 σ 已知,为使总体均值μ的置信度为α-1的置信区间的长度等于L ,则需抽取的样本容量n 最少为 u=(x-u0)×sqrt(n)/σ . 8.设某种零件的直径(mm )服从正态分布),(2 σμN ,从这批零件中随机地抽取16个零件,测得样本均值为075.12=X ,样本方差00244 .02 =S ,则均值μ的置 信度为0.95的置信区间为 :(1025.75-21.315,1025.75+21.315)= (1004.435,1047.065). . 9.在假设检验中,若2 σ未知,原假设0 : μμ=H , 备择假设 1: μμ>H 时,检验的拒绝域为 . 10.一大企业雇用的员工人数非常多,为了探讨员工的工龄X (年)对员工的月薪Y (百元)的影响,随机抽访了25名员工,并由记录结果得: ∑==25 1100 i i X ,∑==251 2000i i Y ,∑==25 1 2 510 i i X ,∑==25 1 9650i i i Y X ,则Y 对X 的 线性回归方程为 y = 11.47+2.62x . 二、选择题(每小题2分,共20分)

2015春《应用概率统计》试卷A

浙江农林大学 2014 - 2015 学年第 二 学期考试卷(A 卷) 课程名称 概率论与数理统计(A )课程类别:必修 考试方式:闭卷 注意事项:1、本试卷满分100分.2、考试时间 120分钟. 学院: 专业班级: 姓名: 学号: 装 订 线 内 不 要 答 题

一、选择题(每小题3分,共24分) 1.随机事件A 或B 发生时,C 一定发生,则C B A ,,的关系是( ) . A. C B A ?? B.C B A ?? C.C AB ? D.C AB ? 2.()()4, 1, 0.5XY D X D Y ρ===,则(329999)D X Y -+=( ). A .28 B .34 C .25.6 D .16 3.对于任意两个随机变量X 和Y ,若()()()D X Y D X D Y -=+,则有( ). A .()()()D XY D X D Y = B .()()()E XY E X E Y = C .X 和Y 独立 D .X 和Y 不独立 4. 设随机变量X 的概率密度为()2 21 x x p x -+-= ,则()D X =( ). A B . 2 C . 1 2 D .2 5. 设)(),(21x f x f 都是密度函数,为使)()(21x bf x af +也是密度函数,则常数b a ,满足( ). A. 1=+b a B. 0,0,1≥≥=+b a b a C. 0,0>>b a D. b a ,为任意实数 6.在假设检验中,当样本容量确定时,若减小了犯第二类错误的概率,则犯第一类错误的概率会( ). A. 不变. B. 不确定. C. 变小. D. 变大. 7. 设321,,X X X 4X 来自总体),(2 σμN 的样本,则μ的最有效估计量是 ( ) A . )(31 321X X X ++ B . )(4 1 4321X X X X +++ C . )(2143X X + D .)(5 1 4321X X X X +++

学应用概率统计大学数学2试卷(A卷)附答案

2011-2012学年第 2 学期 考试科目: 大学数学Ⅱ 一、填空题(本大题共6小题,每小题3分,共18分) 1. 设A 、B 为两个随机事件,已知()0.3,()0.4,()0.5P A P B P A B ===U ,则()P A B =U ______________. 2. 设随机变量X 服从参数为3的泊松分布,则(1)P X ≥= ______________. 3. 设二维离散型随机变量),(Y X 的联合分布律为: ),(Y X 的联合分布函数为),(y x F ,则(1,3)F =______________. 4. 设随机变量X 表示100次独立重复射击命中目标的次数,每次命中目标的概率为0.2, 则2X 的数学期望是______________. 5. 设X 、Y 相互独立,且都服从标准正态分布,则~Z =______________. (要求写出分布及 其参数). 6. 设由来自总体~(,0.81)X N μ,容量为9的样本得到样本均值5=X ,则未知参数μ的置信度为95%的置信区间为___________________.( 0.025 1.96u =) 二、单项选择题(本大题共6小题,每小题3分,共18分) 1. 某人花钱买了C B A 、、三种不同的奖券各一张.已知各种奖券中奖是相互独立的, 中奖的概率分别为,0 2.0)(,01.0)(,0 3.0)(===C p B P A p 如果只要有一种奖券中奖此人就一定赚钱, 则此人赚钱的概率约为( ). A. 0.05 B. 0.06 C. 0.07 D. 0.08 2. 设A 、B 为两个随机事件,且B A ?,()0>B P ,则下列选项必然正确的是( ). A. ()()B A P A P < B. ()()B A P A P > C. ()()B A P A P ≤ D. ()()B A P A P ≥ 3. 下列各函数中可以作为某个随机变量X 的分布函数的是( ). A. 21 ,0()11,0x F x x x ?≤? =+??>? B. 0,0() 1.1, 011,1 x F x x x ? 1

应用统计 概率 试卷解答1

《概率论》试卷解答 一. 填空题 1. 设某系统有4个独立工作的元件k A ,它们的可靠性为k p ,.4,3,2,1=k 系统中元件的连接方式如图,则系统的可靠性为)1()(4321214p p p p p p p --++. 解:由系统中元件的连接方式知,系统可靠的概率为 ]})[({3214A A A A P p =])([])[()(32143214A A A A P A A A P A P -+= )()()()()(32143214A P A A P A P A P A A P p -+= )()()](1[32144A P A A P A P p -+=3212144))(1(p p p p p p p -+-+= 2. 设A ,B 是随机事件,且知概率41)(= A B P ,8 5)(=A B P ,41 )(=AB P ,则=)(A P =)(B P )(B A A P 解:(1)41)(41 )() () ()()()()()()(=- =-=-== A P A P A P A B P A P A P AB A P A P B A P A B P ,解得3 1)(=A P . (2)853 1141 )()(1) ()()(1)() ()()(=- - =--=--==B P A P AB P B P A P AB B P A P B A P A B P ,解得32 )(=B P . AB A B A B A -=-= AB B A AB B A B B A -=-= 2 2,p A 11,p A 4 4,p A 3 3,p A

(3)) ()()() () ()()()() ()]([)(B A P B P A P B A P B A P B P A P B A A A P B A P B A A P B A A P -+= -+= = )()()()() ()(A B P A P B P A P A B P A P -+= 734 131)321(31)851)(311()()()](1[)()](1)][(1[= ?--+--=--+--=A B P A P B P A P A B P A P 3. 一只木箱中有a 只红球、b 只白球,每次有放回地从中任意抽取一球,记录球的颜色。第 5次取到的球恰是第3 解:由于是每次有放回地从中任意抽取一球,故每次取到白球的概率都是.b a b + 在这样的前4次抽取中取到的白球数)., 4(~b a b b X + 于是 .) (6)()()2(532222 4b a b a b a b b a a b a b C b a b X P +=+?++=+?= 4. 设随机变量 X ,Y ,Z 相互独立,且满足),3(~p b X , ) (~λπY ,Z 服从指数分布,分 布密度为? ????>=-其它,0 0,601 )(60z e z f z ,278)0(==X P , 33)1(-==e Y P ,则p =λ =+-)64(Y X E )6030(≤

工程数学 应用概率统计习题九答案

习题9答案 9.1 假定某厂生产一种钢索,其断裂强度5(10)X Pa 服从正态分布2(,40),N μ从中抽取容量为9的样本,测得断裂强度值为 793, 782, 795, 802, 797, 775, 768, 798, 809 据此样本值能否认为这批钢索的平均断裂强度为580010Pa ??(0.05α=) 解:00:800H μμ== 10:H μμ≠ 选取检验统计量~(0,1)Z N =, 对于0.05α=,得0H 的拒绝域2 1.96W z z α? ?=>=???? 计算得7918000.675 1.96403 z -==< 所以接受0H ,拒绝1H .即可以认为平均断裂强度为580010Pa ?. 9.3 某地区从1975年新生的女孩中随机抽取20个,测量体重,算得这20个女孩的平均体重为3160g ,样本标准差为300g ,而根据1975年以前的统计资料知,新生女孩的平均体重为3140g ,问1975年的新生女孩与以前的新生女孩比较,平均体重有无显著性的差异?假定新生女孩体重服从正态分布,给出0.05α=. 解:00:3140H μμ== 10:H μμ≠ 选取检验统计量~(1)T t n =-, 对于0.05α=,得0H 的拒绝域2 (19) 2.0930W T t α? ?=>=???? 计算得 0.298 2.0930T ===<

故接受0H ,拒绝1H .即体重无明显差异. 9.5 现要求一种元件的使用寿命不得低于1000h ,今从一批这种元件中随机的抽取25件,测定寿命,算得寿命的平均值为950h ,已知该种元件的寿命2~(,),X N μσ已知100σ=,试在检验水平0.05α=的条件下,确定这批元件是否合格? 解:00:1000H μμ≥= 10:H μμ< 选取检验统计量~(0,1)Z N =, 对于0.05α=,得0H 的拒绝域{}1.645W Z z α=<-=- 计算得 9501000 2.5 1.6451005 Z -==-<- 所以拒绝0H ,接受1H . 即认为这批元件不合格. 9.8 某厂生产的铜丝,要求其拉断力的方差不超过216()kg ,今从某日生产的铜丝中随机的抽取9根,测得其拉断力为(单位:kg ) 289 , 286 , 285 , 284 , 286 , 285 , 286 , 298 , 292 设拉断力总体服从正态分布,问该日生产的铜丝的拉断力的方差是否合乎标准?(0.05α=). 解: 2200:16H σσ≤= 2210:H σσ> 选取检验统计量2 2220(1)~(1)n S n χχσ-=- 对于0.05α=,得0H 的拒绝域{} 22(8)15.507W αχχ=>= 计算得 2 220(1)820.3610.1815.50716 n S χσ-?==≈< 所以接受0H , 拒绝1H ,即认为是合乎标准的。

电大应用概率统计试题资料

国家开放大学学习指南试题及参考答案 国家开放大学学习指南形考作业1 一、多选题(每题5分,共计10分) 1、请将你认为不适合描述为国家开放大学特色的选项选择出来。(B) 选择一项: A. 国家开放大学是一所在教与学的方式上有别与普通高校的新型大学 B. 国家开放大学是一所与普通高校学习方式完全相同的大学 C. 国家开放大学可以为学习者提供多终端数字化的学习资源 D. 国家开放大学是基于信息技术的特殊的大学 2、请将下列不适用于国家开放大学学习的方式选择出来。 选择一项或多项:(B) A. 利用pad、手机等设备随时随地学习 B. 只有在面对面教学的课堂上才能完成学习任务 C. 在网络上阅读和学习学习资源 D. 在课程平台上进行与老师与同学们的交流讨论 二、判断题(每题2分,共计10分) 3、制定时间计划,评估计划的执行情况,并根据需要实时地调整计划,是管理学习时间的有效策略。(对) 4、远程学习的方法和技能比传统的课堂学习简单,学习方法并不重要。(错) 5、在国家开放大学的学习中,有课程知识内容请教老师,可以通过发email、QQ群、课程论坛等方式来与老师联络。(对) 6、在网络环境下,同学之间、师生之间无法协作完成课程讨论。(错) 7、纸质教材、音像教材、课堂讲授的学习策略都是一样的。(错) 国家开放大学学习指南形考作业2

一、单选题(每题2分,共计10分) 1、开放大学学制特色是注册后(A)年内取得的学分均有效。选择一项: A. 8 B. 3 C. 10 D. 5 2、请问以下不是专业学位授予的必备条件?(A) 选择一项: A. 被评为优秀毕业生 B. 毕业论文成绩达到学位授予相关要求 C. 课程成绩达到学位授予的相关要求 D. 通过学位英语考试 3、是专业学习后期需要完成的环节(B) 选择一项: A. 入学教育 B. 专业综合实践 C. 入学测试 D. 了解教学计划 4、转专业后,学籍有效期仍从(D)开始计算。 选择一项: A. 转专业后学习开始的时间 B. 转专业批准的时间 C. 提出转专业申请的时间 D. 入学注册时 5、不是目前国家开放大学设有的学习层次。(A) 选择一项: A.小学、初中

《应用概率统计》复习题及答案

工程硕士《应用概率统计》复习题 考试要求:开一页;题目类型:简答题和大题;考试时间:100分钟。 1. 已知 0.5,)( 0.4,)( 0.3,)(===B A P B P A P 求)(B A P ?。 解:因为 0.7,0.3-1)(-1(A)===A P P 又因为, ,-- A B A B A A B A AB ?== 所以 0.2,0.5-7.0)( -(A))(A ===B A P P B P 故 0.9.0.2-0.40.7P(AB)-P(B)(A))(A =+=+=?P B P 2.设随机变量)1(,9 5 )1(),,4(~),,2(~≥=≥Y P X P p b Y p b X 求并且。 解: . 8165 31-1-10)(Y -11)(Y ),3 1,4(~,31,94-1-1-10)(X -1)1(,9 5)1(),,2(~422====≥=====≥=≥)(故从而解得)所以()(而且P P b Y p p p P X P X P p b X 3.随机变量X 与Y 相互独立,下表中给出了X 与Y 的联合分布的部分数值,请将表中其

4.设随机变量Y 服从参数2 1=λ的指数分布,求关于x 的方程0322 =-++Y Yx x 没有实根的概率。 解:因为当时没有实根时,即0128Y -Y 03)-4(2Y -Y 2 2 <+<=?,故所求的概率为}6Y P{20}128Y -P{Y 2 <<=<+,而Y 的概率密度 ?? ???≤>=0,00 ,21f(y)21-y y e y ,从而36221 -621-1dy 21f(y)dy 6}Y {2e e e P y ===<

应用概率统计试题范文

042应用数学 一、填空题 (每小题3分,共21分) 1.已知()0.4,()0.3,()0.6,P A P B P A B ===则() .P AB = 2.设(),,X B n p 且()12 , ()8 ,E X D X ==则 , .n p == 3.已知随机变量X 在[0,5]内服从均匀分布,则 ()()()14 ,2 , .P X P X E X ≤≤==== 4.设袋中有5个黑球、3个白球,现从中随机地摸出4个,则其中恰有3个白球的概率为 . 5.设12 19,X X X 是来自正态总体()2 ,N μσ 的一个样本,则() 2 19 21 1 i i Y X μσ==-∑ 6.有交互作用的正交试验中,设A 与B 皆为三水平因子,且有交互作用,则A B ?的自由度为 . 7.在MINITAB 菜单下操作,选择Stat Basic Statistics 2Sample T >>-可用来讨论 的问题,输出结果尾概率为0.0071P =,给定 0.01α=,可做出 的判断. 二、单项选择题(每小题3分,共15分) 1.设,A B 为两随机事件, ()6 0.6,()0.7,(|), 7P A P B P A B ===则结论正确的是( ) (A ),A B 独立 (B ),A B 互斥 (C )B A ? (D )()()()P A B P A P B +=+ 2. 设()1F x 与()2F x 分别为随机变量1X 与2X 的分布函数.为使()()()12F x aF x bF x =-是某一随机变量的分布函数,在下列给定的各组数值中应取( ) (A ) 32,;55a b ==-(B )22,;33a b ==(C )13,;22a b =-=-(D )13,. 22a b ==- 3.设128,, X X X 和1210,, Y Y Y 分别来自两个正态总体()1,9N -与()2,8N 的样本,且相互独立, 21S 与22S 分别是两个样本的方差,则服从()7,9F 的统计量为( ) (A )212235S S (B )212289S S (C )212298S S (D )212253S S 4. 设Y 关于X 的线性回归方程为01,Y X ββ∧ ∧ ∧ =+则0β∧ 、1β∧ 的值分别为( ) (10,780,88,3,24xx yy xy L L L x y =====) (A )8.8,-2.4 (B )-2.4,8.8 (C )-1.2,4.4(D )4.4,1.2 5.若 ()10T t 分布,则2T 服从( )分布. (A )( )10,1 F (B )()9 t (C )(1,10)F (D )(100)t 四、计算题(共56分) 1.据以往资料表明,某一3口之家,患某种传染病的概率有以下规律: P{孩子得病}=0.6 ,P{母亲得病 | 孩子得病}=0.5 , P{父亲得病 | 母亲及孩子得病}=0.4 ,求母亲及孩子得病但父亲未得病 的概率.(8分) 2.一学生接连参加同一课程的两次考试.第一次及格的概率为0.6,若第一次及格则第二次及格的概率也为0.6;若第一次不及格则第二次及格的概率为0. 3. (1)若至少有一次及格则能取得某种资格,求他取得该资格的概率?

相关文档
最新文档