线性空间中范数的选取及其基本定理的应用举隅

合集下载

《高等数学》第三章 范数理论及其应用

《高等数学》第三章  范数理论及其应用

例3、设 A
aij
C mn , x
mn
1,,n T
,证明
1
n n
2 2
A
m2

i 1
j 1
aij

是矩阵范数,且与 x 相容 2
证明:(1)~(2)成立,
设 Bmn ,划分 A a1,, an , B b1,, bn ,则有

x
也是 C n
中的一个向量范数。
证:1)设 A a1, a2 ,, an ,由假设知a1, a2 ,, an
线性无关。
x1
当 x0
Ax

a1 , , an


x2


a1 x1


an xn

0
xn
又因为 y 是 C m 中的一个向量范数,有 Ax 0
x y B x y Bx By x y
A
2
2
2
A
A
2010-12-6
10
例3:设 y 是 C m中的一个向量范数,给定矩阵 A C mn ,它的n个列向量线性无关。对于 C m
中的一个向量 x x1, x2 ,, xn T ,规定
x
Ax
Abl 1

A
m1
b1

1
A m1
bl 1
A m1
b1

1
bl
1
A B m1 m1
n
因此, A m1
aij
是矩阵范数,且与 x 相容 1
i, j1
2010-12-6

范数应用案例

范数应用案例

范数应用案例范数是线性代数中的重要概念,广泛应用于机器学习、信号处理、优化等众多领域。

本文将从不同领域选取范数的应用案例进行介绍,并分析范数在这些案例中的作用和意义。

一、机器学习领域1.1 L1范数在稀疏表示中的应用在机器学习中,L1范数常被用于稀疏表示,例如LASSO回归和特征选择。

L1范数正则化可以使得模型系数变得稀疏,进而实现特征选择和降维。

以图像识别为例,L1范数可以用于稀疏编码,从而实现图像的稀疏表示和压缩。

在实际的图像处理中,L1范数能够减少噪声和冗余信息,提高图像的清晰度和识别准确率。

1.2 L2范数在支持向量机中的应用支持向量机(SVM)是一种经典的机器学习模型,常用于分类问题。

在SVM中,L2范数正则化可以帮助模型避免过拟合,提高模型的泛化能力。

通过对模型参数进行L2范数惩罚,可以有效控制模型的复杂度,使得模型更加稳定和可靠。

在实际的分类任务中,L2范数在SVM模型中得到了广泛的应用。

二、信号处理领域2.1 L1范数在压缩感知中的应用在信号处理领域,压缩感知是一种重要的信号采样和重构技术。

L1范数最小化问题在压缩感知中扮演着至关重要的角色,它可以通过最小化信号的稀疏表示,实现从极少的采样数据中准确地重构原始信号。

在图像处理、音频处理等领域,L1范数被广泛应用于压缩感知算法,实现高效的信号采样和重构。

2.2 L2范数在滤波器设计中的应用在数字信号处理中,滤波器设计是一项重要的任务。

L2范数正则化在滤波器设计中被广泛应用,通过对滤波器参数进行L2范数惩罚,可以实现滤波器的平滑和抑制非必要的频率成分。

在音频处理、通信系统等领域,L2范数正则化可以帮助设计出稳定和高性能的滤波器,提高信号的质量和清晰度。

三、优化领域3.1 L1范数在稀疏优化中的应用在优化问题中,稀疏优化是一种常见的技术,它可以帮助寻找到具有稀疏性质的最优解。

L1范数被广泛应用于稀疏优化问题中,例如稀疏表示、压缩感知、特征选择等。

湖北省考研数学一复习资料高等代数重要概念解析

湖北省考研数学一复习资料高等代数重要概念解析

湖北省考研数学一复习资料高等代数重要概念解析高等代数是数学学科中的重要分支之一,也是湖北省考研数学一科目中的重要内容。

在备考过程中,理解和掌握高等代数的重要概念是至关重要的。

本文将针对湖北省考研数学一复习资料中的高等代数部分,对其重要概念进行解析。

一、线性空间线性空间是高等代数中的基本概念之一,它是指一个非空集合V,其中定义了加法和标量乘法两种运算,并遵循一定的公理。

在湖北省考研数学一复习资料中,我们需要了解线性空间的基本性质和相关定理。

1. 线性空间的定义和性质线性空间V的定义包括以下几个方面:加法的封闭性、加法的结合律、加法的交换律、加法的单位元、加法的逆元、标量乘法的结合律、标量乘法的分配律和标量乘法的单位元等。

对于湖北省考研数学一复习资料中的高等代数部分,我们需要详细理解这些定义和性质,并能够运用到具体的问题解析中。

2. 子空间和商空间子空间是线性空间中具有线性结构的部分空间,它包括了线性空间的加法和标量乘法运算。

通常情况下,子空间的定义和性质与线性空间相似,但需要额外考虑所构成的子集是否满足推论和定理。

而商空间是由线性空间V的子空间W构成的,它是线性空间的一种重要扩展。

二、线性变换线性变换是高等代数中的重要概念之一,它是指一个线性空间到另一个线性空间的映射,同时保持加法和标量乘法运算。

在湖北省考研数学一复习资料中,我们需要掌握线性变换的基本性质和相关定理。

1. 线性变换的定义和性质线性变换的定义包括:保持加法运算、保持标量乘法运算。

同时,线性变换还具有保持零向量、保持线性组合、保持线性相关性、保持线性无关性等性质。

在复习的过程中,我们需要对线性变换的定义和性质进行深入理解,并能够灵活运用到具体的问题解析中。

2. 线性变换的表示和矩阵线性变换可以通过矩阵表示,这也是湖北省考研数学一复习资料中的重要内容。

我们需要学习线性变换的矩阵表示方法,并能够通过矩阵运算求得线性变换的特征值和特征向量等重要概念。

数值分析04赋范线性空间

数值分析04赋范线性空间
例如:可以证明 Rn 中三种范数 x 1、 x 2 、 x 相互等价
2)性质
除了一般的赋范线性空间的性质外,有限维赋
范线性空间还有一些特殊的性质。 (1) 有限维赋范线性空间的各种范数等价。 (2) 有限维赋范线性空间必是完备、可分的空间。 (3) 赋范线性空间 E 是有限维的 E 中的任意有界闭集 是列紧的(即有界闭集中的任意点列都有收敛的子列) 。 (4) 任意 n 维赋范线性空间都与 Rn 代数同构 (有相同的 代数运算性质) 。
同样的,不完备的赋范线性空间可以完备化。
例:在 R 中,按范数 x 2
n

i 1
b
n
xi ,(R n , x 2 )是 Banach 空间;
2
x(t ) ,(C[ a ,b ] , x )是 Banach 空间; 在 C[ a ,b ] 中,按范数 x tmax [ a ,b ]
在L
2 [ a ,b ]
注:由于( E , )在 (x, y ) x y 定义下也是 ( E , ) , 所以在(E ,
)中可类似定义——邻域、开集、闭集、极
限点、收敛点列、柯西点列等,并可讨论相关的性质。
4)巴拿赫空间(Banach) 如果赋范线性空间 (E , )按范数导出的距离空间
( E , ) 是完备的,则称 E 是 Banach 空间。
则称实数 x 为 x 的范数,称 E 为赋范线性空间,记作
(E , )或 E 。
(2) 赋范线性空间与距离空间的关系
若在(E , )中,按范数定义距离,即
x, y E , (x, y ) x y ,
由范数导出 的距离
验证得知 满足距离的三个条件,因此,(E , )在范数意 义下(以后均指这种情况)是距离空间 ( E , ) 。

考研线性代数终极总结

考研线性代数终极总结

考研线性代数终极总结线性代数是研究向量空间及其线性变换的数学分支。

它是数学基础科学和高级工程科学的重要学科,在理论和应用上都有着广泛的应用。

准备考研的同学们需要牢固掌握线性代数的基本概念和重要定理,下面是线性代数的终极总结。

一、向量空间1.向量空间的基本定义和性质2.子空间及其判定3.维数、基、坐标和表示定理4.线性方程组的解空间二、线性变换1.线性变换的定义和性质2.矩阵的线性变换3.线性变换的矩阵表示和基变换4.线性变换的像空间与核空间5.线性变换的特征值和特征向量6.对角化和相似变换三、线性方程组1.线性方程组的表示和解的存在唯一性2.线性方程组解的结构和基础解系3.矩阵的秩与线性方程组解的个数4.线性方程组的常见解法四、矩阵1.矩阵的运算和性质2.矩阵的特征值和特征向量3.矩阵的标准形式4.矩阵的相似性质和相抵性质五、二次型1.二次型的定义和性质2.二次型的标准形式3.正定、负定和不定二次型4.合同变换与矩阵的合同性质六、特征值问题1.特征值问题的引入和相关概念2.特征值问题的求解方法3.特征值问题的应用七、奇异值分解1.奇异值分解的定义和性质2.奇异值分解的计算和应用八、线性变换的标准形式1.线性变换的标准形式的引入和相关性质2.线性变换的标准形式的计算和应用九、行列式1.行列式的定义和性质2.行列式的性质及计算方法3.克莱姆法则及其推广以上是线性代数的终极总结,考研学习线性代数需要掌握这些重要概念和定理,通过大量的练习和习题,加深对知识点的理解和记忆。

在考试中,要善于分析题目,熟练运用线性代数的知识,灵活解决问题。

希望同学们能够在考研线性代数的复习中取得好的成绩!。

线性空间中的基本定义及性质

线性空间中的基本定义及性质

线性空间中的基本定义及性质线性空间是现今数学中的一个基础概念。

它在向量、矩阵、微积分、拓扑等多个数学分支中都有广泛的应用。

本文将简单介绍线性空间的基本定义及其性质。

一、线性空间的基本定义线性空间是一种包含数个元素的空间,其内部具有向量加法运算和数乘运算。

具体来说,设V为一个非空集合,其中的元素称为向量。

若V上有两种运算,一种为向量加法运算,用+表示,另一种为数乘运算,用·表示,则称(V, +, ·)为一个线性空间,满足以下条件:1.加法交换律:对任意u,v∈V,有u+v=v+u;2.加法结合律:对任意u,v,w∈V,有(u+v)+w=u+(v+w);3.存在零向量:存在一个元素0∈V,使得对任意u∈V,有u+0=u;4.对任意向量u∈V,存在相反元素:对任意u∈V,存在一个元素-v∈V,使得u+(-v)=0;5.数乘结合律:对任意α,α∈R,u∈V,有(αα)u=α(αu);6.分配律:对任意α∈R,u,v∈V,有α(u+v)=αu+αv,(α+α)u=αu+αu;7.标量乘法:对任意u∈V,有1u=u。

在以上定义中,R表示实数集合上的乘法运算。

二、线性空间的性质线性空间的定义虽然简单,但它带来了许多重要的性质。

以下是几个典型的例子:1. 零向量唯一性:线性空间中仅存在一个零向量,任何向量加上该零向量等于其本身。

2. 相反元素唯一性:线性空间中任一向量的相反元素是唯一的。

3. 线性组合性质:设{u1,u2,...,un}为V中的向量。

{a1,a2,...,an}为任意实数,则线性组合a1u1+a2u2+...+anun∈V。

其中,每个ai乘以ui叫做向量ui 的系数。

4. 子空间的定义:设V为一个线性空间,如果它的子集W满足:(1)对于任意向量u,v∈W,u+v∈W;(2)对于任意α∈R,u∈W,有αu∈W;则称W是V的一个子空间。

5. 线性无关性:设V为一个线性空间,{u1,u2,...,un}为其中的向量。

范数应用案例

范数应用案例

范数应用案例
1. 在机器学习中,范数常常用来衡量数据的特征向量的大小。

例如,在支持向量机算法中,可以使用范数来正则化模型的权重参数,以防止过拟合。

2. 在图像处理中,常常使用L1范数或者L2范数来衡量图像的稀疏性。

例如,可以使用L1范数来约束稀疏表示问题,以便生成更加稀疏的图像。

3. 在信号处理中,L1范数可以用来计算信号的稀疏系数,从而进行信号降噪。

通过最小化L1范数,可以将信号的噪声部分去除,保留信号的主要特征。

4. 在推荐系统中,可以使用L2范数来衡量用户对不同商品的偏好程度。

通过最小化L2范数,可以获得更好地符合用户偏好的推荐结果。

5. 在网络流量分析中,可以使用L1范数来衡量网络连接的异常程度。

通过比较不同网络连接的L1范数,可以识别出潜在的网络攻击或者异常行为。

6. 在图像识别中,可以使用L2范数来衡量两幅图像之间的相似度。

通过计算两幅图像的L2范数,可以获得它们之间的距离。

7. 在文本数据的处理中,可以使用L1范数或者L2范数来衡量文本的稀疏性。

通过最小化范数,可以获得更加稀疏的文本
表示,从而提高文本分类或者聚类的性能。

8. 在最优化问题中,可以使用范数作为约束条件。

例如,可以使用L1范数作为约束条件,以获得较为稀疏的解。

线性空间的原理

线性空间的原理

线性空间的原理线性空间是数学中非常重要的概念,它是一种允许进行向量加法和标量乘法的集合。

线性空间广泛应用于数学、物理、工程等领域,是研究向量和线性运算的理论基础。

本文将围绕线性空间的定义、性质和应用展开详细的阐述。

线性空间的定义:线性空间,也称为向量空间,是一种满足特定条件的集合。

对于一个非空集合V,若其中定义了两种运算:向量的加法和标量的乘法,且满足以下八条性质,那么V就是一个线性空间。

1.加法封闭性:对于V中的任意两个向量u和v,它们的和u+v也属于V。

2.加法交换律:对于V中的任意两个向量u和v,满足u+v=v+u。

3.加法结合律:对于V中的任意三个向量u、v和w,满足(u+v)+w = u+(v+w)。

4.零向量存在性:存在一个元素0∈V,使得对于V中的任意向量u,满足u+0=u。

5.加法逆元存在性:对于V中的任意向量u,存在一个元素-u∈V,使得u+(-u)=0。

6.标量乘法封闭性:对于V中的任意标量α和任意向量u,它们的乘积αu属于V。

7.分配律1:对于V中的任意标量α和β以及任意向量u,满足(α+β)u=αu+βu。

8.分配律2:对于V中的任意标量α和β以及任意向量u,满足α(u+v)=αu+αv。

线性空间的性质:线性空间具有一系列重要的性质,这些性质是对其定义中所列条件的进一步推演和说明。

1.线性空间的零向量唯一:对于一个线性空间V,其零向量是唯一的,即不存在不同的零向量。

2.零向量的加法逆元唯一:对于一个线性空间V以及其中的一个向量u,其加法逆元-u是唯一的,即不存在不同的加法逆元。

3.标量乘法的单位元:对于一个线性空间V,乘以标量1的结果是原向量本身,即1u=u。

4.标量乘法的分配律:对于一个线性空间V以及其中的两个标量α和β,乘法分配律表示为(α+β)u=αu+βu和α(u+v)=αu+αv。

5.标量乘法的结合律:对于一个线性空间V以及其中的两个标量α和β,乘法结合律表示为(αβ)u=α(βu)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性空间中范数的选取及其基本定理的应用举隅摘要:本文首先从线性赋范空间中范数的定义出发对范数的选取及构建条件做出讨论,举了一个特征量不能成为范数的例子。

继而基于范数的性质和推论,研究了范数应用的两个实例,即具有普遍意义的方程组迭代法敛速收敛问题,和分类数学模型中的准范数——马氏距离。

关键词:范数;向量;算子引言随着人们认识世界的不断升华,数量的概念从一维的数、二维的平面向量、三维的空间向量已经发展到n维乃至无穷维线性空间中的向量,后者虽然是抽象,但在其理论指导下的实际应用却十分广泛,例如由向量刻画的线性方程组的解在规划问题、有限元设计问题中的价值就是十分基本的。

为了对线性空间及其向量实施拓扑结构与代数结构的研究,赋予它一个“距离”概念(或是准“距离”概念十分重要),这就是范数(及拟范数、准范数)的由来,由此导出的线性赋范空间或线性准赋范空间为近现代科学的发展提供了坚实的基础。

范数是满足一定条件的可以用于度量向量和向量间关系的特征量,对于不同的问题,对于研究向量的不同方面,可以再满足条件的基础上选择或构造范数。

其中有些范数是基本的,有些则可充分发掘问题内涵加以构造,结合范数的相关性质定理得到需要的结论,甚至为新理论的产生做出推动。

比较范数这样的线性空间中有着丰富内涵和特点的数量关系和我们对基本的低维空间的认识,我们会看到在诸多科学问题中,前者更阐明了问题的核心,指向了问题的本质。

在一些普遍问题或特有的建模问题中,提供了更好的解决方案。

1范数定义和范数选取条件的讨论范数(标记为‖·‖)是线性赋范空间中基本与重要的概念,对于向量范数,基于以下的定义,人们一般认为它是欧氏空间中距离概念的推广:(1)正定性:对任意向量x,‖x‖≥0,当且仅当x=0时‖x‖=0;(2)正齐性:对任意向量x,α∈R,有‖αx‖=|α|‖x‖;(3)三角不等式:对任意向量x,y,‖x+y‖≤‖x‖+‖y‖。

而对于线性赋范空间上的映射——算子(标记为T),可以构造如下的算子范数:(对于向量范数‖·‖*,如此定义的算子范数‖·‖*称为由向量范数导出的算子范数)。

由此推出,算子范数的以下几点性质是基本的:(1)正定性:当T≠θ时,‖T‖>0,当T=θ时,‖T‖=0;(定义θ(x)=0)(2)正齐性:设c为实数,则‖cT‖=|c|‖T‖;(3)三角不等式:‖T1+T2‖≤‖T1‖+‖T2‖;(4)‖Tx‖≤‖T‖‖x‖;(5)‖T1T2‖≤‖T1‖‖T2‖。

出于上述要求,可以在满足定义条件的基础上,按照需要构造范数,结合范数的连续性和等价性定理,得到一些美妙的结论。

尤其在向量序列收敛的情况下,适当选取的范数比传统的欧氏距离理论具有更大的适定性,也有更好的应用价值。

要使向量或算子的某个特征能成为范数,必须经过以上定义中几点的检验,例如对于任意的向量x=(x1,x2,…,xn) ,最基本的向量范数‖x‖∞=max(|x1|,|x2|,…|xn|) ,‖x‖1=|x1|+|x2|+…|xn|,‖x‖2=(x12+x22+…+xn2)1/ 2 就是满足向量范数定义三条件的。

但并非任意构造范数都是满足定义的,下面就算子的一个特征量不能成为范数给出例子:例设Tx=Ax,其中x是任意n维向量,A是n阶矩阵,设λi是矩阵A的特征值,定义ρ(T)=max|λi|是算子T的谱半径,证明ρ(T) 不能成为T的范数。

证明:显然,对任意n维向量x, Ax是n维向量,Tx=Ax是n维赋范线性空间的算子,举反例说明ρ(T)不能成为T的范数,设则ρ(T1)=ρ(T2)=0,而ρ(T1+T2)=1,不满足三角不等式ρ(T1+T2)≤ρ(T1)+ρ(T2) ,由此例可以看出ρ(T)不能成为T的范数。

2范数的几个基本重要性质及其推论定理1(范数连续性):范数‖x‖是x的连续函数,即当xn→x时‖xn‖→‖x‖。

推论:当且仅当xn→0时,‖x‖→0,进而对于任何有界算子,‖Tx‖→0(T≠)。

定理2(范数等价性):向量(或算子)的一切范数都是等价的,即对任意两种范数‖·‖α,‖·‖β,存在和K(表示向量或算子)无关的常数m,M,使得对一切非零向量(或算子)K,恒有0<m‖K‖α≤‖K‖β≤M‖K‖β<∞。

推论:对任何的算子范数‖T‖α, ‖T‖β,有。

定理3(压缩映像原理):设由迭代格式x(k+1)=Tx(k)+g,设算子T的某种范数‖T‖<1 ,则此迭代格式收敛。

进而对于由此格式求解的任何方程或方程组,有惟一解α,并有误差估计式‖x(k)-α‖≤‖T‖k‖x(0)- α‖。

3范数基本定理应用举隅3.1线性方程组迭代解法收敛速度的检验对于较复杂线性方程组的求解,尤其当它的系数矩阵是大型稀疏矩阵时,各类基本迭代法的应用是极其广泛的。

它的思想是“步步为营”,对于任意给定的n 维初始向量x(0)(基于压缩映像原理,初始向量选择的好坏并不重要),构造迭代格式x(k+1)=Gx(k)+g(G∈Cn×n,称为迭代矩阵),使序列{x(k)} 收敛,即对于预定的精度ε,有|x(k+1)-x(k)|<ε,根据压缩映像原理,易证此时x(k)→x (解向量)。

对于方程组Ax=b,我们可以看到算子作用的迭代矩阵应有怎样的构成,我们将A进行A=M-N的分裂,则有Mx+Nx+b,从而由迭代格式两边取极限,得到x=Gx+g可知G=M-1N,从而压缩映像原理揭示出,迭代格式的收敛和对A进行不同的分裂有关。

在确认了各种迭代法的敛散性后,人们想比较的是对于那些收敛的迭代法,谁的收敛速度快、效率高。

这里让我们考察一下在迭代法收敛速度的比较中范数所起的作用,并进一步研究范数的相关性质定理会带给我们怎样的更好的审敛手段。

3.1.1矩阵范数与迭代格式的审敛法左乘矩阵作为线性赋范空间向量间的一种映射,其范数具有算子范数的一般特征,另外矩阵有几个基本的特殊范数‖·‖∞(行和范数)、‖·‖1(列和范数)、‖·‖2(谱范数)。

‖A‖2是ATA的最大特征值的平方根。

设迭代格式x(k+1)Gx(k)+g收敛,定义绝对误差向量ε(k)=x(k)-x,则递推得到ε(k)=Gε(k-1)=…=Gkε(0),所以。

对于向量,‖x‖∞=max(|x1|,|x2|,…|xn|),‖x‖1=|x1|+|x2|+…|xn|,‖x‖2=(x12+x22+…x32)1/2 , 比较定义可知,为了比较收敛性,考察误差向量ε(k),取‖·‖2是最合理的。

由得。

我们的结论是:(1)迭代法收敛即‖ε(k)‖2≤‖ε(0)‖2的充分条件是‖G‖2<1;(2)当‖Gk‖2≤η 时,必有‖ε(k)‖2≤η‖ε(0)‖2。

关于得到精度使绝对误差的模不大于原来的η倍时所需的迭代步,我们有估计式如下: ,分母即我们由范数等价性导出的式子的自然对数值。

3.1.2矩阵谱半径和收敛速度的更好的度量定义:设A为任一n阶复方阵,λi是矩阵A的特征值,把实数ρ(A)=max|λi| 称为矩阵A的谱半径。

(——上文已证,谱半径不可能是一个矩阵的范数。

)引理1对于任何由向量范数导出的矩阵范数‖·‖,有ρ(A)≤‖A‖。

引理2给定任一正数ε,必定存在一种向量范数‖·‖*,使得由此而导出的矩阵范数‖·‖* ,满足条件:‖B‖*≤ρ(B)+ ε。

将G用其若当标准型替换,可得到结论: ,结合范数等价性定理的推论,得到推论:对于任意矩阵范数‖·‖,。

这个推论是重要的,在前文提及的迭代步的预估中,结论受到k 本身的影响,不具有一致性,而在这里,我们却可以用ρ(G) 把,用-lnρ(G) 把替换掉,从而定义:设迭代格式x(k+1)=Gx(k)+g收敛,则称R(G)=-lnρ(G)为迭代格式的收敛率。

在此基础上,得到新的迭代步的估计式k≈-lnη/R(G) 。

应该指出,上述的用ρ(G)代换是有条件的,此时迭代步k 较大,精度要求较高,但我们仍然可以肯定地说,ρ(G) 越小,收敛率将越大,收敛也将越快。

3.2多参数对象分类与马哈拉诺比斯(Mahalanobis)距离法在上述用迭代法求解线性方程组收敛速度的讨论中,我们充分运用了向量范数、矩阵范数的重要定理,看到了适当选取范数不仅可以较好地讨论问题,也可以为进一步更好地讨论问题,引入新的工具提供理论基础。

在线性赋范空间中,范数及其选取、范数性质的重要性可见一斑。

下面我们还将引入一个更加生动的例子,从而理解范数并不是死板的而是可以在满足定义三条件的基础上科学地构造的,这个例子中我们将比较传统的欧式距离与马哈拉诺比斯(Mahalanobis)距离,看到在应用层面上,适当选取范数的有效性、适定性。

3.2.1问题的给出:考古学家试图根据骨骼架的身高和腿长的差异,对两种远古人群的种族进行分类(分别称作A族和B族),已测得如图所示的9副A族与6副B族的有关数据,具体要求是:(1)根据如上资料,制定一种方法,正确地区分两个种族;(2)另有三副类别未知的骨骼标本,已知其身高和腿长,用所得的方法加以识别。

3.2.2欧式距离法对问题的分析:以腿长为横轴、身高为纵轴建立平面直角坐标系,则每一副骨骼样本对应了平面直角坐标系中的一个点。

设μ(1)=(μ1(1),μ2(1),),μ(2)=(μ1(2),μ2(2),)分别是两个种族对应样本总体分布的几何重心,当能正确地划分出两个种族的差异时,μ(1),μ(2)显然是平面直角坐标系中两个不同的点。

我们可以引入这样的思考,对于任意给定的一个样本x=(x1,x2),只需要检验它到底离哪个分布的几何重心的距离更近,即分别计算它与μ(1),μ(2)的欧式距离:,把x归入‖x-μ(k)‖2,k=1,2小的一类。

在实际计算中,μ(1),μ(2)用样本估计值代替,即分别计算两类已知样本身高与腿长的平均值,对于μ(k),k=1,2中的分量,取已知样本身高和腿长的平均值。

当特征量的个数不只两个,乃至可以推广到n个时,这里每个样本点就成为n 维空间上的一个向量,向量范数‖x‖2=(x12+x22+…+xn2)1/2就提供了这样一种指标,度量每个随机向量对样本平均水平的迫近情况,从而将样本归为欧式距离‖x-μ(k)‖2较小的种群。

但这样的划分是有问题的,它首先忽略了样本中的每项特征参数作为随机变量的分布情况,因为在不同的分布中概率随欧氏距离的变化情况是不一样的,其次它也没有考虑各项参数间分布水平的差异,在不同参数方向上定义了相同的尺度。

从而这种欧氏距离的分类显得粗糙,有时甚至存在这样的可能,因为某些种群本身是向善的,另一些种群则是向恶的,粗糙的分类可能带来很不好的结果,例如在判断患者的肿瘤是良性还是恶性的问题上。

相关文档
最新文档