多元分析:主成分分析与因子分析
主成分分析与因子分析

汇报人:张 强 组员:林培鸿 曾志成 邦锦阳 郝 超 蔡凌峰 杨 辉 张 强
一、主成分分析
一、主成分分析基本思想
通过原来变量的少数几个线性组合来解释原来变量绝大 多数信息的一种多元统计方法。
该方法主要基于众多变量之间有一定的相关性,则必然 存在着起支配作用的共同因素这一想法,通过对原始变量相 关矩阵或协方差矩阵内部结构关系进行研究,利用原始变量 的线性组合形成几个综合指标,即主成分。
有时为了使公共因子的实际意义更容易解释,往往需要放 弃公共因子之间不相关的约束而进行斜交旋转。最常用的 斜交旋转方法为Promax方法。
参数设置
结果分析
由模式矩阵可知,变量X2,X3,X4在第一公共因子上的载荷 均较大,尤其X3的载荷最大,因此第一公共因子主要反映 水泥企业的规模;变量X6,X7在第二公共因子上的载荷较大, 则第二公共因子主要反映水泥企业的营业能力。总之,两 个公共因子均较未旋转前更容易解释。
主成分分析与因子分析的区别
二者的本质不同主要体现在以下几个方面:
(1) 因子分析把诸多变量看成是对每一个变量都有作用的一 些公共因子和一些仅对某一个变量有作用的特殊因子的线 性组合。因此,其目的就是要从数据中探查能对变量起解 释作用的公共因子和特殊因子,以及公共因子和特殊因子 的组合系数。主成分分析则简单一些,它只是从空间生成 的角度寻找能解释诸多变量绝大部分变异的几组彼此不相 关的新变量(主成分),它是一种可逆的数据变换。
相关性检验结果
由表可知,除了变量X7,原始各变量之间存在较强的相关性。 KMO统计量的值为0.785,在0.01的显著性水平下,球形检 验拒绝相关阵为单位阵的原假设,说明适合做因子分析, 并且因子分析的效果较好。
因子分析与主成分分析的基本概念

因子分析与主成分分析的基本概念因子分析和主成分分析是常用的多元统计分析方法,用于研究变量之间的关系和数据的结构。
本文将介绍因子分析和主成分分析的基本概念和应用场景。
一、因子分析因子分析是一种多元统计分析方法,用于揭示观测变量背后的潜在因子结构。
通过降维,将一组原始变量拆分为若干个潜在因子,以解释观测变量之间的关系和共享的信息。
1. 基本原理在因子分析中,我们将观测变量表示为潜在因子和误差项的线性组合。
其中,潜在因子是无法直接观测到的,而误差项则代表了无法被潜在因子解释的特殊因素。
该方法基于以下假设:观测变量间的相关性可以通过潜在因子来解释。
2. 应用场景因子分析广泛应用于一些具有观测变量过多、相关性较高的数据集分析中,如社会科学研究、心理学测试、市场调查等。
通过因子分析,我们可以更好地理解变量之间的关系,挖掘变量背后的潜在结构。
二、主成分分析主成分分析是一种降维技术,它通过寻找观测变量间的最大方差方向,将原始变量投影到新的坐标系上。
新坐标系的特征向量称为主成分,通过保留最重要的主成分,我们可以将高维数据转化为低维表示。
1. 基本原理在主成分分析中,我们通过数学方法寻找原始数据的特征向量和特征值。
特征向量表示了数据在新空间中的方向,而特征值则表示了数据在该方向上的方差。
我们选择特征值最大的几个特征向量作为主成分,将原始数据投影到这些主成分上。
2. 应用场景主成分分析广泛应用于数据可视化、维度约减和特征选择等领域。
通过主成分分析,我们可以减少数据的维度,消除冗余信息,提取出最具代表性的特征,从而更方便地进行数据分析和建模。
结语因子分析和主成分分析是常用的多元统计分析方法,它们可以帮助我们揭示数据背后的潜在结构和关系。
通过降维和特征提取,我们可以更好地理解和解释数据,为后续的研究和应用提供支持。
注意事项:由于文章给定的题目是“因子分析与主成分分析的基本概念”,因此本文采用说明文的格式,分别介绍了因子分析和主成分分析的基本原理和应用场景。
因子分析与主成分分析

n
ki
xi )(xkj xj )
n
2 2 ( x x ) ( x x ) ki i kj j k 1
(二)计算特征值与特征向量:
① 解特征方程 I R 0 ,常用雅可比法 (Jacobi)求出特征值,并使其按大小顺序排 , 0 列 ; 1 2 p ② 分别求出对应于特征值 i的特征向量
3、确定抽取因子的数目 • 两个标准: – 特征值(Eigenvalalue)准则,特征值大于1有 多少个因子。 – 碎石图(Scree test)准则,取曲线开始转折前 的因子个数。 • 补充原则: – 有些情况下,分析人员事先确定因子的个数 (number of factors)。这种做法适合检验因 子的理论或重复某些工作。总之,采取最容易 解释且最简单的因子结构为好。
(i 1,2, , p )
k
, , , 一般取累计贡献率达85—95%的特征值 1 2 m 所对应的第一、第二、…、第m(m≤p)个主成分。
④ 计算主成分载荷
l p ( z , x ) e ( i , j 1 , 2 , , p ) ij i j i ij
⑤ 各主成分的得分:
因子抽取(Extraction)的方法 • • • 主成分分析法(Principal Components):一般 选这个方法就行。 普通最小二乘法, 广义最小二乘法(generalized least squares) , 最大似然法(Maximum likelihood), 主轴因子法(Principle Axis Factoring), α 因子提取法(Alpha), 映像分析法(image)
4、因子旋转(Rotation)方法 与选择 • • 因子旋转一般在因子分析的第二步进行 旋转方法: – 不旋转(None) – 方差最大法(Varimax) – 等量最大法(Equamax) – 四次方最大法(Quartimax) – 斜交旋转法(Direct Oblimin) • 选择标准: – 一般选Varimax(正交旋转法),为更容易解 释,选斜交旋转法
第10章 主成份分析和因子分析

有比较高的相关系数,可以使用主成分分 析方法。
特征值和贡献率
前2个主成分的贡献率为81.42%。
成分矩阵和特征向量
成分矩阵各列除以相应的特征值可以 得出特征向量。 除以根号3.735
特征向量
除以根号1.133
第1主成分 第2主成分 -0.4170 -0.3488 0.3313 0.4986
方程满足下列条件:
2 ai2 ai22 aip 1 (1) 1
(2)Fi与Fj不相关。 (3) F1与Fp到 方差依次递减。
主成分分析的数学模型
有p个x,相应可以计算出p个主成分。但一 般只使用少数几个主成分就可以提取大部分 信息。 主成分分析的基本任务是计算系数矩阵 a11 …… app。
一个例子
例如,在企业形象或品牌形象的研究中, 消费者可以通过一个有24个指标构成的评 价体系,评价百货商场的24个方面的优劣。 但消费者主要关心的是三个方面,即商 店的环境、商店的服务和商品的价格。因 子分析方法可以通过24个变量,找出反映 商店环境、商店服务水平和商品价格的三 个潜在的因子,对商店进行综合评价。
数学 物理
化学 语文 历史 英语
-0.3491 0.4619 0.4269 0.4325
0.4818 0.2877 0.4090 0.3996
主成分得分
com1,com2为用公式计算出的主成分得分。
因子分析
因子分析
因子分析(factor analysis)是一种数据简化 的技术。它通过研究众多变量之间的内部 依赖关系,探求观测数据中的基本结构, 并用少数几个假想变量来表示其基本的数 据结构。这几个假想变量能够反映原来众 多变量的主要信息。原始的变量是可观测 的显在变量,而假想变量是不可观测的潜 在变量,称为因子。
主成分分析、因子分析

主成分分析在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。
多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来不便。
如果分别对每个指标进行分析,分析往往是孤立的,而不是综合的。
盲目减少指标会损失很多信息,容易产生错误的结论。
因此需要找到一个合理的方法,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的。
由于各变量间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息。
主成分分析与因子分析就属于这类降维的方法。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。
因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。
如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
2. 问题描述下表1是某些学生的语文、数学、物理、化学成绩统计:首先,假设这些科目成绩不相关,也就是说某一科目考多少分与其他科目没有关系。
主成分分析与因子分析的联系与区别

一、问题的提出在科学研究或日常生活中,常常需要判断某一事物在同类事物中的好坏、优劣程度及其发展规律等问题。
而影响事物的特征及其发展规律的因素(指标)是多方面的,因此,在对该事物进行研究时,为了能更全面、准确地反映出它的特征及其发展规律,就不应仅从单个指标或单方面去评价它,而应考虑到与其有关的多方面的因素,即研究中需要引入更多的与该事物有关系的变量,来对其进行综合分析和评价。
多变量大样本资料无疑能给研究人员或决策者提供很多有价值的信息,但在分析处理多变量问题时,由于众变量之间往往存在一定的相关性,使得观测数据所反映的信息存在重叠现象。
因此为了尽量避免信息重叠和减轻工作量,人们就往往希望能找出少数几个互不相关的综合变量来尽可能地反映原来数据所含有的绝大部分信息。
而主成分分析和因子分析正是为解因子分相关。
1.2.),3. 主成分的各系数,是唯一确定的、正交的。
不可以对系数矩阵进行任何的旋转,且系数大小并不代表原变量与主成分的相关程度;而因子模型的系数矩阵是不唯一的、可以进行旋转的,且该矩阵表明了原变量和公共因子的相关程度。
4. 主成分分析,可以通过可观测的原变量X直接求得主成分Y,并具有可逆性;因子分析中的载荷矩阵是不可逆的,只能通过可观测的原变量去估计不可观测的公共因子,即公共因子得分的估计值等于因子得分系数矩阵与原观测变量标准化后的矩阵相乘的结果。
还有,主成分分析不可以像因子分析那样进行因子旋转处理。
5.综合排名。
主成分分析一般依据第一主成分的得分排名,若第一主成分不能完全代替原始变量,则需要继续选择第二个主成分、第三个等等,此时综合得分=∑(各主成分得分×各主成分所对应的方差贡献率),主成分得分是将原始变量的标准化值,代入主成分表达式中计算得到;而因子分析的综合得分=∑(各因子得分×各因子所对应的方差贡献率)÷∑各因子的方差贡献率,因子得分是将原始变量的标准化值,代入因子得分函数中计算得到。
主成分分析与因子分析的联系与区别
主成分分析与因子分析的联系与区别相比之下,因子分析(Factor Analysis)更关注隐性的变量或者未观测到的结构。
因子分析假设观测到的变量由一组潜在的因子决定,这些因子通过线性组合来解释观测到的变量的协方差矩阵。
这些因子是未观测到的,但可以通过观测到的变量的线性组合来间接估计。
因子分析的目标是通过提取因子,找到能够解释原始数据方差的最少因子数量,以及变量与因子之间的关系。
相同点:1.数据降维:主成分分析和因子分析都是用于降低数据维度的方法。
它们能够将高维数据转化为低维的表示形式,从而更好地展示数据的结构。
2.可视化:主成分分析和因子分析都可以用于数据可视化。
通过降维,我们可以将数据在二维或三维平面上进行展示,以更好地理解变量之间的关系。
不同点:1.目标:主成分分析旨在最大化数据方差的解释,而因子分析旨在找到能够解释观测到的变量协方差矩阵的最少因子数量。
2.假设:主成分分析假设观测到的变量是线性相关的,而因子分析假设这些变量受到潜在因子的影响。
3.变量解释:在主成分分析中,主成分是原始变量的线性组合,它们解释了数据方差的不同比例。
而在因子分析中,因子是潜在的变量,通过观测到的变量的线性组合来间接估计。
4.其中一种程度上冗余度:主成分分析中的主成分是不相关的,而在因子分析中,因子之间可能存在一定的相关性。
5.数据特点:主成分分析适用于变量之间存在线性相关性的数据;而因子分析适用于存在潜在因子的数据,且变量之间的关系更加复杂。
需要注意的是,主成分分析和因子分析是统计方法,它们的结果需要进一步解释和解释。
研究者需要考虑数据的背景知识和分析的目标,以确定何时使用主成分分析还是因子分析。
主成分分析、因子分析
这些方法可用于揭示数据中的潜在结构或模式, 这些结构或模式可能不容易通过直接观察原始变 量来发现。
辅助决策制定
通过识别最重要的变量和潜在因子,主成分分析 和因子分析可以为决策制定提供有价值的见解。
主成分分析与因子分析概述
主成分分析(PCA)
一种线性降维技术,通过正交变换将原始特征 空间中的线性相关变量转换为新的正交特征空 间中的线性无关变量,称为主成分。
主成分分析优缺点
01
缺点
02
主成分解释性较差,不易于理解每个主成分 的具体含义。
03
对异常值和缺失值敏感,可能导致结果的不 稳定。
04
在某些情况下,主成分可能无法完全反映原 始数据的所有信息。
02 因子分析
CHAPTER
因子分析原理
公共因子与特殊因
子
因子分析试图用少数几个公共因 子和特殊因子描述原始变量的关 系。公共因子对所有变量都有影 响,而特殊因子只对个别变量起 作用。
05 结论与展望
CHAPTER
研究结论
主成分分析能够有效降低数 据维度,提取主要特征,简
化数据结构。
因子分析能够揭示变量之间 的内在关系,发现潜在因子
,解释数据变异。
主成分分析与因子分析在数 据处理、特征提取、模式识 别等领域具有广泛应用价值 。
研究不足与展望
在高维数据处理方面,主成分分析与因子分析 的计算效率有待提高,可以研究更加高效的算
案例二:因子分析在市场细分中的应用
01 02 03
背景介绍
市场细分是企业根据消费者需求、购买行为等方面的差异 ,将整体市场划分为若干个具有相似特征的子市场的过程 。因子分析是一种从多个变量中提取公共因子的统计方法 ,可以帮助我们更好地理解和描述市场细分的结构。
数据分析知识:数据分析中的因子分析和主成分分析
数据分析知识:数据分析中的因子分析和主成分分析数据分析是一门应用数学的新兴学科,在大数据、人工智能和互联网技术的推动下,日益受到企业和科学家的青睐。
数据分析的基本任务是研究数据间的关系,找出隐藏在数据背后的规律和模式,为决策提供支持和指导。
因子分析和主成分分析是常用的数据分析方法,在广泛的领域中得到了应用和发展。
因子分析和主成分分析是两种线性变换技术,即将多维数据降维,从而减少数据冗余和噪声,提取数据的本质信息,简化数据的处理和分析。
它们的具体实现方式不同,但是目标相同:寻找数据背后的共性因素,构建潜在变量模型,提高数据的可解释性和预测性。
一、因子分析因子分析是一种结构方程模型,旨在研究一组观测变量之间的关系,找出其中的基本因素,以便于描述和解释数据中的变化。
它可以用于数据降维、变量筛选、因果推断、模式识别、分类聚类、信用评估、意见调查等方面。
因子分析的基本思路是将若干观测变量表示成少数几个共同的因素,从而减少变量的数量和复杂度。
这些因素具有一定的统计意义和实际意义,反映了数据中的基本结构和变化。
因子分析的前提是变量之间存在相关性和模式,但是不了解具体的本质方式和机制。
因子分析的方法流程如下:1、确定因子个数:可以通过特征值、平行分析、KMO检验等方法,来选择合适的因子个数。
2、提取因子:可以使用主成分分析和极大似然估计等方法,将原始变量投影到因子空间中。
3、旋转因子:可以使用正交旋转和斜交旋转等方法,来调整因子间的关系,使因子间的相关性更清晰和明确。
4、解释因子:可以使用重载矩阵、公共度、因子载荷、因子得分等方法,来识别每个因子的内涵和实际意义,并解释数据中的变化。
基于以上步骤,因子分析可以将原始数据转化为因子得分并展示数据的本质结构和变化,从而更好地理解数据的特点和规律。
同时,因子分析可以消除冗余信息和噪声,提高数据的清晰度和稳定性,有利于数据清洗、预测和模型构建。
二、主成分分析主成分分析是一种多元统计技术,在数据分析领域中具有重要的应用和价值。
主成分分析与因子分析
在实际工作中,为了全面的分析问题,往往会收集很多变量,这些变量之间通常都会存在大量重复信息,如果直接用来分析,不但计算繁琐,模型复杂,而且还有一个更严重的问题就是共线性问题,前面提到过共线性问题会导致模型误差增大,失去意义。
当面对变量过多时,通常的处理方法是降维,即设法将原来众多具有一定相关性的变量,重新组合成一组新的互相无关的综合变量,这些综合变量要尽可能多的反映原有变量的信息。
降维的方法有很多,其中最常用的就是主成分分析和因子分析一、主成分分析(Principal Component Analysis,PCA)1.基本思路设有n个原始变量,如果将它们都用散点图表示,会发现一些变量是存在某种线性关系的,这就是共线性,我们可以利用这个特点,创建一个变量Yi,使它成为某些原始变量的线性组合结果Yi =β+β1x1+...βnxn,这样处理之后,n个原始变量就转化为i个新变量,这i个新变量不同程度的反映了原始变量的信息,并且互不相关,这就解决了共线性问题。
那么接下来的问题是,n个变量的线性组合有很多种,我们取哪种结果作为新变量呢?经典的方法就是根据方差来判断,方差越大,变异越大,而我们的目的并不是消除变异,而是用尽可能少的新变量表示大部分原始变量,因此变异信息也必须尽量完整的反映。
我们将新变量按照方差大小排序,最大者也就是包含变异最多的为第一主成分,以此类推,通常只取前面几个最大的主成分,这样虽然损失部分信息,但是抓住了主要变异,如果全都取的话是没有意义的,因为原则上有多少个原始变量,就可以提取多少个主成分,但是这样做违背了降维的目的,多数情况下,取钱2-3个主成分就可以代表90%以上的变异信息,其余的可以忽略不计。
2.计算过程前面讲了PCA的基本思路,现在用具体数学算法来加以实现<1>数据标准化由于每个变量都有自己的数量级和量纲,首先要对变量进行标准化处理以消除这方面的差异<2>计算协方差矩阵或相关系数矩阵对于一维数据,也就是一个变量的数据,我们可以用均值、方差、标准差来描述,而协方差用于衡量两个变量的总体误差,如果多于两个变量,那就要用协方差矩阵来表示。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《金融数量方法》 第十一章 - 1 - 第十一章 多元分析:主成分分析与因子分析
引言 主成分分析和因子分析在多元分析框架内是数据结构分析技术,与第六章的多元回归、第七章的多变量协整一起是多变量分析中广泛使用的技术。它们不同于多元回归。回归的目标是识别外生变量与内生变量的关系,而在主成分分析和因子分析情形下,仅确定内生变量间的结构关系。它们也不像协整,变量间不需要平稳性。 在金融、社会科学或其它领域,通常需要识别多变量结构的特征,其有两个特征是被子广泛关心的: 1. 多变量结构中的波动性。 2. 变量间的相关或共线性。 在结构的整体变化中,通常是一些变量起产生主要的影响,而其它变量仅有次要的或不显著的影响。困难的是要了解哪些变量能被确定在这个结构中和它在结构中应怎样度量。例如,如果两个变量是完全相关的,则不需要第二个变量,它不会带来进一步的信息。这类似多元回归的共线问题。 在一般情况下,包含哪个变量,剔除哪个变量并不是很清楚的,我们需要有能够程序化的有效方法来识别带有最可用信息的变量或变量组合。 主成分分析(PCA)是分析多变量结构波动时有用的技术。因子分析(FA)在分析多变量结构变量的相关时很有用。两者都依赖于方差/协方差矩阵,因为这个矩阵在一定范围内包含了变量间有用的全部信息。因此在一定范围内,两者是重复的或相互补充的。在这章,我们将方差/协方差矩阵记为C。 尽管PCA和FA都利用方差/协方差矩阵,但它们不同于第四章和第九章中的均值—方差分析。均值—方差分析度量了一组变量的总体变异性,而没有特别指明一部分变量对总变异性的贡献。PCA识别和排序了部分变量在总变异性中的贡献,每个部分变量称为“主成分”。它识别了部分变量间组成的协方差的强度,每个主成分对总的变异性的贡献,并根据部分变量组的方差进行排序。 使用PCA,数据内的总体变异性由特征值之和(它等于C矩阵主对角线上元素之和,
引言 债券市场中的一个应用 主成分分析 因子分析 两个假设的资产的例子 套利定价理论 FTSE100,债券指数 练习 S&P500,US$利益应用的例子 参考文献和进一步阅读文献 标准变量的一个例子 主成分的解释 《金融数量方法》 第十一章
- 2 - 也称为迹)度量,成分(变量的线性组合)的选择是依次序减少特征值,直到满足总变异性的一个足够大的比例。这种方法降低了系统的维数且识别了最重要的成分(方向)。 清楚理解第六章附录中引入的矩阵代数是有益的,它将表明组合的总方差是如何计算的。 回忆第二章,组合的方差是投资组合中每对资产的协方差加权和,其中方差也被认为是资产自身的协方差。 假设有一个有A、B两个资产的投资组合,资产A收益的方差是0.00015,资产B收益的方差是0.00025,A和B的协方差是0.00005 ,则协方差矩阵C是:
C=⎥
⎦
⎤⎢⎣
⎡
00025.000005.000005.000015.0
如果我们假设一个等权的投资组合,则投资组合的方差由一个1×n的权行向量乘以C矩阵和n×1的权列向量乘C得到:
[]000125.05.05.000025.000005.000005.000015.05.0,5.0=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢
⎣
⎡
(11.1) 这样这个投资组合的总方差是0.000125。
主成分分析 PCA的应用有两个目标。第一个目标是从多个变量减少到几个变量以降低空间维数。这可以由识别原始变量组中的变量有相互关系的性质去完成。组作为一个整体是与其它组或变量线性无关的,线性无关的变量组就是主成分。 第二个目标是在第一个目标基础上解释数据。因为PCA识别了变量的线性相关性,依据它们对原始数据总方差的贡献排了序,所以解释数据是可能的。这样,第一主成分是变量线性组合,它有最大方差。第二主成分是一些变量的线性组合,它有第二大方差。依次下去,我们将看到,总方差很大的比例上有能够用很少的几个主成分做出解释的可能。 在金融实践中有许多情形需要识别主要变量或线性无关的变量组合,它们对风险有主要的贡献。在使用两个资产投资组合的简单例子中,将仅有两个成分。然而,在n较大时,n个变量的投资组合,有直到n的主要贡献成分。这些成分中的一些可以与其它高度相关,这使得对风险的贡献,在一定的程度上是由部分变量或变量组合做的独立贡献。PCA能使我们识别哪些是独立线性组合和它们对总方差的贡献。这样我们就能很好地理解是什么影响投资组合风险,因此更便于管理风险。 通常PCA是一个方法的目标而不是问题本身的目的。例如,识别的主成分可以作为回归方程的输入,使得相关变量不在原始的独立变量中,但在主成分中。本章的后面我们将看到在利率的变化过程中如何识别主成分,这将使我们能够更好地度量债券组合中内在的利率风险。 首先使用上面方程(11.1)中的假设数据,PCA将通过简单的两个资产的例子的帮助得《金融数量方法》 第十一章 - 3 - 到解释。然后使用实际资产收益的数据,利用4个资产的例子增强我们的理解。最后我们将解释这个技术如何用于确定一个债券的风险。
两个资产的例子 PCA的应用使我们能够从方差/协方差矩阵中提取出一些资产组合的方差和协方差,它们可能解释了资产的共同变化,这里每个组合是独立于其它的组合的。因为方差/协方差矩阵是对称的,因而保证了它在已知过程下对角化的可能性。在对角化的过程中我们能识别出变量的线性组合、它的方差和协方差,这个组合又是独立于其它的组合的。这个过程包含三个步骤,分别是: 1. 求矩阵的特征向量和相应的特征值。 2. 构造三个矩阵Q、D、Q
-1。
3. 从特征向量中识别线性组合,依据特征值从大到小排列这些组合。
第一步:求特征向量和特征值 第一步是求方差/协方差矩阵C的特征向量和相应的特征值。我们必须求特征向量,因为特征向量给出了变量组合的线性独立性、主成分和对总方差的贡献。我们也必须求特征值,因为特征值给出了每个主成分在总风险中比例的说明。
在数学上,特征向量是向量ix, 每个向量都有一个与它相联系的标量λi,称为特征值,
它使得方差/协方差矩阵C乘以向量ix满足向量与标量积,即XXCλ=。C矩阵的对称性,保证了有n个这样的向量(如果C是一个非退化矩阵,即C有逆),这些特征向量是直交的(相互正交)。 下面给出一个例子。左边的2×2矩阵是方差/协方差矩阵,如果这个矩阵可以乘以一个向量使得乘积简单地为特征向量的标量积,即:
⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣
⎡=m1m100025.000005.0
00005.000015.0λ
(11.2) 这里
⎥⎦⎤⎢⎣
⎡
m1
(11.3) 是一个特征向量,λ是相应的特征值。展开后,我们得: 0.00015+0.00005m=λ 0.00005+0.00025m=λm (11.4) 《金融数量方法》 第十一章 - 4 - 第一个方程两边乘以m可以消去λ,得到: 0.00015m+0.00005m2=0.00005+0.00025m 0.00005m2-0.00010m-0.00005=0 5m2-10m-5=0 m2-2m-1=0
m=212822442±=±=+±+ 这样特征向量是: ⎥⎦⎤⎢⎣
⎡
−⎥⎦⎤⎢⎣
⎡
+211211
和 (11.5)
现在我们必须标准化特征向量,使得向量的长度为1,这只需对特征向量的每个分量除以这些分量平方和的平方根。标准化的向量仍是特征向量。
()()()
()⎥⎦⎤⎢⎣
⎡
⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢
⎢
⎣
⎡
⎥⎦⎤⎢⎣
⎡
⎥⎥⎥⎥
⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
−=−+−+=+++++383.0924.0221211
22121
1
,924.0383.02212121
22121
1
在方差/协方差矩阵阶数是变化着的时候,将存在同阶数一样多的特征向量。这样在2×2矩阵中有2个特征向量,在n×n矩阵中有n个特征向量。 我们可以证明上面的向量是特征向量,因为特征向量满足矩阵C乘以它简单地为向量与标量乘积这一条件。例如:
⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣
⎡
924.0383.0
000271.0000250.0000104.0924.0383.000025.000005.0
00005.000015.0
这里我们用向量乘了矩阵C得到一个新的向量,这个向量也满足0.000271与原向量的乘积。这样我们看到右边的向量是特征向量,标量0.000271是一个特征值。 同样的过程应用到右边的向量,表明它也是一个特征向量。
⎥⎦⎤⎢⎣⎡−=⎥⎦⎤⎢⎣⎡−=⎥⎦⎤⎢⎣⎡−⎥⎦⎤⎢⎣
⎡
383.0924.0000129.0000050.0000119.0383.0924.000025.000005.000005.000015.0
我们看到了这个向量对应的特征值是0.000129。 第二步 构造矩阵 Q,D和Q-1 接下来的一步是构造三个矩阵Q、D、Q-1。矩阵Q从特征向量作为矩阵的列构造出。按特征值的次序排列它们。对于上面的例子,Q矩阵为:
Q=⎥⎦⎤⎢⎣⎡−383.0924.0924.0383.0 (11.6) 矩阵D是一个对角矩阵(除主对角线外的每个元素均为零)。对角元素是特征值,同样按特征向量的次序写出,这样上面例子的D矩阵为: