多元统计分析第一章_矩阵补充
厦门大学应用多元统计分析第章多元正态分布的参数估计

F(x) f (t)dt ,则称 f (x) 为 X 的分布密度函数,简称为
密度函数。一个函数 f (x) 能作为某个随机变量 X 的分布密度
函数的重要条件是:
(1) f (x) 0 ,对一切实数 x ;
(2) f (x)dx 1。
定义 2.2 设 X ( X1, X 2 ,
的多元分布函数定义为
别记为 μ 和 i ,即 μ (1, 2 , , p ) ,容易推得均值(向
量)具有以下性质:
(1) E(AX ) AE(X ) (2) E(AXB) AE(X )B (3) E(AX BY ) AE(X ) BE(Y ) 其中, X 、 Y 为随机向量, A 、 B 为大小适合运算的常数
表 2.1 数据
变量
X1
X2
Xp
序号
1
X 11
X 12
X1p
2
X 21
X 22
X 2p
n
X n1
X n2
X np
在这里横看表 2.1,记为
X ( ) ( X 1, X 2, ,X p ), 1 , 2 , n, 表示第 个样品的观测值。竖看表 2.1,第 j 列的元素
X j ( X1 j , X 2 j , , X nj ) , j 1 , 2 , p,
其中
ij
Cov( Xi , X j ) ij D( Xi ) D( X j ) ii jj
阵为
Cov( X ,Y )E( X E( X ))(Y E(Y ))
Cov( X1,Y1)
Cov(
X
2
,
Y1
)
Cov( X1,Y2 ) Cov( X 2,Y2 )
Cov( X p ,Y1) Cov( X p ,Y2 )
多元统计分析课件

逆矩阵
若A是P阶非退化阵,则存在唯 一的矩阵B,使得AB=I,B称为A的 逆矩阵,记为B=A-1。
逆矩阵的求法
A11A21… Ap1 A-1=(1/|A|)A*=(1/|A|)A12A22 …Ap2
…… A1pA2p …App
A*为A的伴随矩阵,它是A的各个元素的代数 余子式所构成的矩阵。
例题
多元统计分析基础知识
附录:矩阵代数
第一节 矩阵及基本运算
1、矩阵的定义
将n☓p个实数 aij (i=1,2,…,n ; j=1,2, …,p) 排成n行p列的数表,记为A,称为n☓p阶 矩阵。 a11 a12 … a1p A= a21 a22 … a2p
an1 an2 … anp
记为A=(aij)n☓p 或A=(aij)或An×p
一些特殊矩阵
(1)列向量 (2)行向量 (3)方阵 (4)对角阵 (5)单位矩阵 (6)转置矩阵 (7)对称矩阵 (8)下三角矩阵(上三角矩阵)
2、矩阵的运算
(1)加法 (2)数乘 (3)乘法
3、矩阵的运算规律
(1) A+B = (2) α (A+B) = (3) α(AB) = (4) A+(-1)A = (5) (AB)´ = (6) (A´)´ = (7) (A+B)´ = (8) A(BC) = (9) A(B+C) = (10) AI =
x
f
x p
若
X
x11
x1 p
xn1 xnp
则
f
f ( X X
)
x11
f
多元统计分析——多元正态分布

一、多元正态分布的定义
1、一元正态分布的定义 若变量 X 的概率密度为:
x 2
2 2
1 f x e 2
, 0 ,
则称 X 服从一元正态分布,记为 X ~ N , 2 。 我们可以将上式改写为:
f x 2
1 2
1 exp x ' 2 2
量 X 的相关阵为
R rij p p
其中
rij
Var X i Var X j
covX i , X j
ij ii Байду номын сангаасj
i, j 1,2,, p
另证明:标准化数据的协方差阵正好是原始指标的相 关阵
第2节
多元正态分布
一、多元正态分布的定义 二、均值向量和协方差阵的估计 三、维希特(Wishart)分布 四、统计距离
三、多元变量的独立性
定义 3 两个随机向量 x 和 y 相互独立的充要条件为:
PX x, Y y PX x PY y
对任意的 x, y
若 F x, y 为 x, y 的联合分布函数; G x 和 H y 分别为 x 和 y 的分布函数, 则 x 与 y 独立当且仅当 F x, y G x H y 若 X ,Y ' 有密度函数 f x, y , g x 和 h y 分别表示 X 和 Y 的分布密度, X 和 Y 用 则 独立当且仅当
X 1 X 2 X p q
q
μ 1 μ 2 μ p q
q
11 21
12 21 p q
应用多元统计课件 (1)

3
本课程的特点与教学方式
教学方式 : 授课与实际例题相结合. 本课程的特点是将常用的多元分析方法的 介绍与在计算机上实现这些方法的软件紧 密地结合起来,不仅介绍每种多元分析方 法 的实际背景、统计思想、统计模型、数 学原理和解题的思路,并结合实例介绍应 用编程软件(Matlab)解决问题的步骤和计算 结果的分析。
的考试成绩,可对学生进行分类,如按文、理 科成绩分类,按总成绩分类等。若准备给优秀 学生发奖,那么一等奖、二等奖的比例应该是 多少?应用多元统计分析的方法可以给出公平 合理地确定。
19
教育学--
主成分分析在学生学习成绩排序中的应用
我在担任学生班主任期间,经常会遇到学 校下达的评选三好生,评选学习奖等任务.另 还有评选各种奖学金的工作;推荐研究生的 工作都要求班主任提出意见.
0.1025X 4 0.2852X12
Z1是12个变量的线性组合,且系数都是正数,
数值有大有小。显然数值大的变量对综合指标
(主成分)的贡献大;数值小的变量对综合指
标(主成分)的贡献小。
24
教育学--
主成分分析在学生学习成绩排序中的应用
12个原始变量(课程)提供的信息各为多少?用什
么量来表达?最经典的方法是用变量的方差Var(Xi)为
23
教育学--
主成分分析在学生学习成绩排序中的应用
最简单最直观地综合变量就是12门课的成绩总和
。但这个最简单的综合变量并不是最科学地代表12门
课综合成绩的指标,而用主成分分析得出的第一主成分
(原始变量的线性组合)Z1是最科学地代表12门课综合 成绩的指标。比如
Z1 0.3233X1 0.4525X 2 0.3502X 3
《多元统计分析》课件

采用L1正则化,通过惩罚项来选择最重要 的自变量,实现特征选择和模型简化。
比较
应用场景
岭回归适用于所有自变量都对因变量有影 响的情况,而套索回归更适用于特征选择 和模型压缩。
适用于数据集较大、自变量之间存在多重 共线性的情况,如生物信息学数据分析、 市场细分等。
主成分回归与偏最小二乘回归
主成分回归
适用于自变量之间存在多重 共线性的情况,同时要求高 预测精度,如金融市场预测 、化学计量学等。
06 多元数据的典型相关分析
典型相关分析的基本思想
01
典型相关分析是一种研究多个 随机变量之间相关性的多元统 计分析方法。
02
它通过寻找一对或多个线性组 合,使得这些线性组合之间的 相关性达到最大或最小,从而 揭示多个变量之间的关系。
原理
基于最小二乘法原理,通过最小化预 测值与实际值之间的平方误差来估计 回归系数。
应用场景
适用于因变量与自变量之间存在线性 关系的情况,如预测房价、股票价格 等。
注意事项
需对自变量进行筛选和多重共线性诊 断,以避免模型的不稳定性和误差。
岭回归与套索回归
岭回归
套索回归
是一种用于解决多重共线性的回归方法, 通过引入一个小的正则化项来稳定系数估 计。
层次聚类
01
步骤
02
1. 将每个数据点视为一个独立的集群。
2. 计算任意两个集群之间的距离或相似度。
03
层次聚类
01 3. 将最相近的两个集群合并为一个新的集群。 02 4. 重复步骤2和3,直到满足终止条件(如达到预
设的集群数量或最大距离阈值)。
03 应用:适用于探索性数据分析,帮助研究者了解 数据的分布和结构。
多元统计分析实验报告计算协方差矩阵相关矩阵SAS

多元统计分析实验报告计算协方差矩阵相关矩阵SAS实验目的:通过对多元统计分析中的协方差矩阵和相关矩阵的计算,探究变量之间的相关性,并使用SAS进行实际操作。
实验步骤:1.数据准备:选择一个数据集,例如学生的成绩数据,包括数学成绩、语文成绩和英语成绩。
2.数据整理:将数据转化为矩阵形式,每一行代表一个学生,每一列代表一个变量(即成绩),记为X。
3. 计算协方差矩阵:根据公式计算协方差矩阵C,其中元素Cij表示变量Xi和Xj之间的协方差。
计算公式为Cij = cov(Xi, Xj) = E((Xi - u_i)(Xj - u_j)),其中E为期望值,u_i和u_j分别是变量Xi和Xj的均值。
4. 计算相关矩阵:根据协方差矩阵计算相关矩阵R,其中元素Rij表示变量Xi和Xj之间的相关性。
计算公式为Rij = cov(Xi, Xj) / (sigma_i * sigma_j),其中sigma_i和sigma_j分别是变量Xi和Xj的标准差。
5.使用SAS进行实际操作:使用SAS软件导入数据集,并使用PROCCORR和PROCPRINT命令进行协方差矩阵和相关矩阵的计算和输出。
实验结果:通过计算协方差矩阵和相关矩阵,可以得到变量之间的相关性信息。
协方差矩阵的对角线上的元素表示每个变量的方差,非对角线上的元素表示不同变量之间的协方差。
相关矩阵的对角线上的元素都是1,表示每个变量与自身的相关性为1,非对角线上的元素表示不同变量之间的相关性。
使用SAS进行实际操作后,我们可以得到一个包含协方差矩阵和相关矩阵的输出表格。
该表格可以帮助我们更直观地理解变量之间的相关性情况,从而为后续的统计分析提供参考。
实验总结:通过本次多元统计分析实验,我们了解了协方差矩阵和相关矩阵的计算方法,并使用SAS软件进行实际操作。
这些矩阵可以帮助我们评估变量之间的相关性,为后续的统计分析提供重要的基础信息。
在实际应用中,我们可以根据协方差矩阵和相关矩阵的结果,选择合适的统计方法和模型,并做出恰当的推断和决策。
《多元统计分析》目录

《多元统计分析》目录前言第一章基本知识﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍5 §1·1总体,个体与样本﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍5 §1·2样本数字特征与统计量﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍6 §1·3一些统计量的分布﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍9 第二章统计推断﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍15 §2·1参数估计﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍15 §2·2假设检验﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍19 第三章方差分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍32 §3·1一个因素的方差分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍32 §3·2二个因素的方差分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍37 §3·3用方差分析进行地层对比﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍44 第四章回归分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍49 §4·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍49 §4·2回归方程的确定﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍49 §4·3相关系数及其显着性检验﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍52 §4·4回归直线的精度﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍55 §4·5多元回归分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍56 §4·6应用实例﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍60 第五章逐步回归分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍65 §5·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍65 §5·2“引入”和“剔除”变量的标准﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍66 §5·3矩阵变换法﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍67 §5·4回归系数,复相关系数和剩余标准差的计算﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍69 §5·5逐步回归计算方法﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍70§5·6实例﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍74 第六章趋势面分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍80 §6·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍80 §6·2图解汉趋势面分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍81 §6·3计算法趋势面分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍83 第七章判别分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍90 §7·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍90 §7·2判别变量的选择﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍91 §7·3判别函数﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍92 §7·4判别方法﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍96 §7·5多类判别分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍104 第八章逐步判别分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍110 §8·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍110 §8·2变量的判别能力与“引入”变量的统计量﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍110 §8·3矩阵变换与“剔除”变量的统计量﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍113 §8·4计算步聚与实例﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍115 第九章聚类分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 125 §9·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍125 §9·2数据的规格化(标准化)﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍125 §9·3相似性统计量﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍126 §9·4聚类分析方法﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍131 §9·5实例﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍134 §9·6最优分割法﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍134 第十章因子分析﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍142 §10·1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍142 §10·2因子的几何意义﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍143 §10·3因子模型﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍145§10·4初始因子载荷矩阵的求法﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍147 §10·5方差极大旋围﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍152 §10·6计算步聚﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍156 §10·7实例﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍157 附录﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍162 附录1标准正态分布函数量﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍162 附录2正态分布临界值u a表﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍164 附录3t分布临界值t a表﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍165 附录4(a)F分布临界值Fa表(a=0·1)﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍附录4(b)F分布临界值Fa表 (a=0·05) ﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍附表4(c)F分布临界值Fa表(a=0·01)﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍附表5 x2分布临界值xa2表﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍第一章基本知识§1·1总体、个体与样本总体(母体)、个体一(样本点)和样本(子样)是统计分析中常用的名词。
第1章多元统计分析第四版

4
§1.1.1
随机向量
假定所讨论的是多个变量的总体,所研究的数 据是同时观测 p 个指标(即变量),又进行了 n 次 观测得到的,把这 p 个指标表示为 X 1 , X 2 , , X p 常 用向量
X ( X 1 , X 2 , , X p )'
表示对同一个体观测的 p 个变量。若观测了 n 个个体,则可得到如下表1-1的数据,称每一个个 体的 p 个变量为一个样品,而全体 n 个样品形成一 个样本。
rij也称为分量 X i 与 X j之间的(线性)相关系数。
2018/8/9
中国人民大学六西格玛质量管理研究中心
目录 上页 下页 返回 结束
17
§1.1.4
随机向量的数字特征
在数据处理时,为了克服由于指标的量纲不同对统计分 析结果带来的影响,往往在使用某种统计分析方法之前,常 需将每个指标“标准化”,即做如下变换
(1.3)
对一切( X , Y )成立。若 F ( x , y ) 为( X , Y )的联合分布函 G ( x ) 和 H ( y )分别为 X 和 Y 的分布函数,则 X 与 Y 独立 数, 当且仅当 (1.4) F ( x, y ) G ( x) H ( y ) 若 ( X , Y ) 有密度 f ( x , y ),用 g ( x ) 和 h ( y ) 分别表示 X 和 Y 的分布密度,则 X 和 Y 独立当且仅当 (1.5) f ( x, y ) g ( x)h( y ) 注意:在上述定义中, X 和 Y 的维数一般是不同的。
样本资料阵在形式上与在minitab软件中的工作表是完全一致的工作表的第i行表示第i个样品工量的观测值变量名称常列在表头202094中国人民大学六西格玛质量管理研究中心22中国人民大学六西格玛质量管理研究中心202094中国人民大学六西格玛质量管理研究中心23中国人民大学六西格玛质量管理研究中心样本协方差阵也称为样本方差阵的计算202094中国人民大学六西格玛质量管理研究中心24中国人民大学六西格玛质量管理研究中心样本协方差阵也称为样本方差阵的计算由于样本协方差阵是对称的会话区窗口结果中只显示了协方差阵的下三角部分所以整个样本协方差阵全部写出则应是
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 矩阵知识补充矩阵是多元统计分析的基本工具。
考虑读者已学过线性代数,本章补充一些必不可少的矩阵知识,作为多元统计分析的基础。
未学过线性代数的读者,可以先自学一本线性代数书,再阅读本章 。
本书中向量和矩阵全用黑体字表示。
以k a ,...a 1为对角线上元素的矩阵记为diag(k a ,...a 1),即diag(k a ,...a 1)=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡k 1a 0...0a矩阵的谱分解定理(矩阵的谱分解) 设实对称矩阵A 的特征值和相应的单位特征向量是k k e e ,...,,...11λλ,其中k e e ,...1两两正交;则'...'111k k k e e e e A λλ+=。
证明 因为A 实对称,存在正交阵T ,使得'T T A Λ=,其中[]k e e e T ...21=是以k e e ,...1为元素的分块矩阵;[]k diag λλλ...21=Λ是对角阵,对角线上元素为k λλ,...1。
于是[]⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡='...''0...0............0...00...0 (212)121k k k e e e e e e A λλλ。
根据分块矩阵乘法原理,'...'111k k k e e e e A λλ+=。
定义 ()式称为A 的谱分解。
当特征值无重根时,单位特征向量在不计正负号条件下是唯一的,即同一个矩阵只有同一形式的谱分解。
当特征值有重根时,由于单位特征向量不唯一,同一个矩阵可以有不同形式的谱分解。
例⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=020212022A 。
的特征值和相应的单位特征向量是⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---3/23/23/1,3/13/23/2,3/23/13/2,2,4,1所以[][][]3/2,3/2,3/13/23/23/1)2(3/1,3/2,3/23/13/23/243/2,3/1,3/23/23/13/21⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-+-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-+--⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=A例(谱分解形式不唯一)若⎥⎦⎤⎢⎣⎡=4004AA 的特征值为1,1;相应的特征向量是⎥⎦⎤⎢⎣⎡=ααsin cos 1e ,⎥⎦⎤⎢⎣⎡-=ααcos sin 2e 其中α是任意常数。
A 的谱分解就可以是'4'42211e e e e A +=容易证明,当k λλ,...1全不为零时,'...'111111k k k e e e e A ---+=λλ。
矩阵开平方与比较定义(半正定矩阵)设A 为实对称矩阵,对任何实向量x 有0'≥Ax x ,则称A 为半正定矩阵。
容易看出,正定矩阵也是半正定矩阵,且有定理 正定矩阵的特征值必为正实数。
半正定矩阵的特征值必为非负实数。
定义(半正定矩阵的算术平方根):设A 是半正定矩阵,它的谱分解是'...'111k k k e e e e A λλ+=,则'...'211121121k k k e e e e A λλ+=称为A 的算术平方根,简称为A 的平方根。
显然,当特征根无重根时,半正定矩阵谱分解形式上唯一,从而矩阵的平方根是唯一的。
当特征根有重根时,学者可以自证:半正定矩阵谱分解形式上不一定唯一,但这时矩阵的平方根是唯一的。
例如⎥⎦⎤⎢⎣⎡=4004A '4'42211e e e e +=其中⎥⎦⎤⎢⎣⎡=ααsin cos 1e ,⎥⎦⎤⎢⎣⎡-=ααcos sin 2e 这时⎥⎦⎤⎢⎣⎡=+=2002'2'222112/1e e e e A 与α无关。
例⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=102221342413A的特征值和相应的单位特征向量是⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡313232,184181181,02/12/1,18,9,9, 所以[][][]3/1,3/2,3/23/13/23/21818/4,18/1,18/118/418/118/130,2/1,2/102/12/1321-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-+-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-+⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=A⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡+-+--+-+--+=32832223222322232453244322232443245 定理21A是半正定矩阵且A A A=2121 。
证明 由可见21A 是半正定阵;两边平方,左边是2121A A ,由特征向量的正交性,右边是=++----)'...')('...'(2/1112/112/1112/11k k kk k ke e e e e e e e λλλλA e e e e k k k =+--)'...'(11111λλ,从而命题得证。
一般矩阵是不能比较大小的,但是对于半正定矩阵,在一定条件下,可以比较定义 设B A ,都是半正定矩阵,且B A -半正定,则称B A ≥。
由半正定定义容易证明,当B A ≥时,A 对角线上元素全大于B 对角线上相应元素,例如⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡411242218333是正定阵,所以⎥⎦⎤⎢⎣⎡≥⎥⎦⎤⎢⎣⎡42218333 这时13≥,48≥。
.矩阵的迹定义 设A 是方阵,其对角线上元素之和∑iia,称为A 的迹,记为)(A tr 。
定理 (1)设A,B 是同阶方阵,c,d 是常数,则 tr(cA+dB)=c*tr(A)+d*tr(B),(2)设A 是n m ⨯阵,B 是m n ⨯阵,则 tr(AB)=tr(BA) 如果A 是对称的n n ⨯矩阵,其特征值为i λ(I=1,2,3,⋅⋅⋅⋅⋅⋅⋅⋅,n ),则 (3) tr(A)=∑=ni i1λ,(4)∑=∈=ni k ikN k A tr 1][λ(5) ∑=--∈=ni i N k A tr 111][λ (若A 非奇异)证明 (1),(2)可直接由迹的定义验证。
(3)因为存在正交阵T ,使Λ==),...,('21n diag AT T λλλ,所以[][]trA ATT tr AT T tr tr ni i===Λ=∑=''1λ(4)因为T A T AT T AT T AT T kk')')...(')('(==Λ,所以[][])('')(1k k ni k k k iA tr TT A tr T A T tr tr ===Λ=∑=λ。
(5)因为T A T AT T 111')'(---==Λ,所以[][])('')(111111--=---===Λ=∑A tr TT A tr T A T tr tr ni iλ。
矩阵微商矩阵微商内容较多,根据需要,仅介绍如下定理。
定理 设μλ,是常数,a 是n 维常数向量,A 是n 阶常数矩阵,i β是自变量,记自变量向量⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n ββββ...21,)(βf 是n 元函数;记梯度⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡∂∂∂∂∂∂=∂∂f f f f n βββββ...)(21;则)(21f f μλβ+∂∂1f βλ∂∂=2f βμ∂∂+;ββββββ)'(';'A A A a a +=∂∂=∂∂证明)(21f f μλβ+∂∂=⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+∂∂+∂∂+∂∂=)(...)()(21212211f f f f f f n μλβμλβμλβ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡∂∂∂∂∂∂11211...f f f n βββλ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡∂∂∂∂∂∂+22221...f f f n βββμ1f βλ∂∂=2f βμ∂∂+ 。
其余各式同样得证。
分块矩阵的逆定理 设A 和D 都是对称的,且A 和B A B D G 1'--=的逆都存在,则⎥⎦⎤⎢⎣⎡--+=⎥⎦⎤⎢⎣⎡------111111'''G F G FG F FG A D B B A () 其中B A F 1-=。
证明 经化简,I G F G FG F FG A D B B A =⎥⎦⎤⎢⎣⎡--+⎥⎦⎤⎢⎣⎡------111111'''。
有关矩阵不等式下列矩阵不等式和极值定理可导出多元统计的极值定理。
定理(二次型极值)设B 是p 阶正定矩阵,其特征值p λλλ≥≥≥...21,对应的彼此正交单位向量是p e e e ,...,21,则对一切p 维是向量x10''maxλ=≠xx Bxx x , p x xx Bxx λ=≠''min且11111''λ=e e Be e ,p pp p p e e Be e λ=''。
证明 因为B 实对称,存在正交阵T ,使得'T T B Λ=,其中[]p e e e T (21)=是以p e e ,...1为元素的分块矩阵;[]p diag λλλ (21)=Λ是对角阵,对角线上元素为p λλ,...1。
令x T y '=,则∑∑∑∑====≤=Λ==pi ipi ipi ipi ii yy yy yy yy y y Ty B Ty x x Bx x 121211212''')()'(''λλ当1e x =时,由矩阵谱分解11111111''''λλ=⎪⎪⎭⎫ ⎝⎛=∑=e e e e e e Be e p i i i i 定理的其余部分类似可证,留为作业。
练习题设矩阵⎥⎦⎤⎢⎣⎡=4221A 求A 的谱分解和算术平方根。
设⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=301022123A用SAS 软件求A 的谱分解,把特征值从大到小排序,指出最大,第2大特征值对应的单位特征向量,并求2/1-A 。
设⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=301022123A求xx Axx x ''max 0≠。
设321323121232221753108632)(x x x x x x x x x x x x x f -+-+-+-+=用矩阵微商公式求f x∂∂。
证明)()(BA tr AB tr =。