数据分析(梅长林)习题

数据分析(梅长林)习题
数据分析(梅长林)习题

第五章习题

1.习题

解:假定两总体服从正态分布,且协方差矩阵21∑=∑,误判损失相同又先验概

即:0.4285711=P 0.5714292=P 又计算可得:

(1)(2)25.31622.025,2.416 1.187x x ????==--????????

并且:-2.38145ln =S 计算广义平方距离函数:

2()1

()()()()ln 2ln j T j j j j j d p -=--+-x x x

S x x S 并计算后验概率:

2

2

2

??0.5()0.5()1

?(|)e e j k d d j

k P G --==∑x x x 1,2j =

回代判别结果如下:

由此可见误判的回代估计:

0.07141/14*

==r P

若按照交叉确认法,定义广义平方距离如下:

2()1()

()()()()()()()ln 2ln j j j T j j x x x x j d p -=--+-x x x S x x S

逐个剔除, 交叉判别,后验概率按下式计算:

2

2

2

??0.5()0.5()1

?(|)e e j k d d j

k P G --==∑x x x 1,2j =

通过SAS 计算得到表所示结果。发现同样也是属于G1的4号被误判为G2,因此误判率的交

叉确认估计为*

?1/140.0714c p

==

*121p p p ΦΦ??

=+- ??

?

其中(1)

(2)1(1)(2)?()()T λ

-=--x x S x x =,

2

1(1|2)ln

(2|1)c p d c p =,又因为(1|2)(2|1)c c c ==,所以288.0ln 1

2==P P d ,

最后可得后验概率p 为:

习题

解:(1)在21∑≠∑并且先验概率相同的的假设前提下,建立矩离判别的线性判别函数。利用SAS 的proc discrim 过程首先计算得到总体的协方差矩阵,如表:

各个总体的马氏平方距离见表:

8

765

432118

765

43211909.0465.13054.1581.400.263-702.03.0698.269-176.33030916.1578.9046.0670.5818.1389.0179.2006.71995.121x x x x x x x x W x x x x x x x x W ++++-++=++++--++-=

得到训练样本回判法判别结果如表:

(2)假设两总体服从正态分布,先验概率按比例分配且误判损失相同,在两总体协方差矩阵相同,即21∑=∑的条件下进行Bayes 判别分析,通过SAS discrim 过程得到结果:

在21∑≠∑,并且先验概率按比例分配的假设前提下利用SAS 的proc discrim 过程进行Bays 判别分析,这时以个总体的训练样本单独估计各总体的协方差矩阵,可到的训练样本的回判和交叉确认结果: 回判结果:

交叉确认判别结果:

(3)在不同的假设前提,采用不同判别方法得到待判样本的判别结果:

3在协方差不同矩阵相同的前提下,Bayes对西藏、上海、广东的判别结果:

3.习题

解:(1)假设两总体服从正态分布且在两总体协方差矩阵相同,即21∑=∑,先验概率按相同的条件下进行Bayes 判别分析,通过SAS discrim 过程得到结果:

首先得到线性判别函数:

7

65

432117

65

43211259.0337.85065.01.395227.00.152-29.878-95.000312.0102.108589.0952.1789.0152.0351.308475.98x x x x x x x W x x x x x x x W --++-+=--+---+-=

回代误判结果:

交叉确认判别结果:由计算发现总共有四个样本被判错,分别是9、28、29、35号样品。累计误判率为%

(1)假设两总体服从正态分布且在两总体协方差矩阵相同,即21∑=∑,先验概率按比例分配且误判损失相同的条件下进行Bayes 判别分析,通过SAS discrim 过程得到结果: 首先得到线性判别函数:

回代误判结果

相关主题
相关文档
最新文档