投影寻踪

合集下载

投影寻踪方法及应用

投影寻踪方法及应用

投影寻踪方法及应用
投影寻踪方法是一种图像处理技术,主要用于跟踪或寻找图像中的某个目标或区域。

它通过对目标的投影进行分析和处理,从而实现目标的寻找和跟踪。

常见的投影寻踪方法包括:
1. 基于阈值的方法:将图像转换为二值图像,然后使用阈值来提取目标的投影,通过对投影进行分析和处理来实现目标的寻踪。

2. 基于模板匹配的方法:使用预先定义的模板与图像进行比较,通过对比图像中的局部区域与模板的相似度来实现目标的寻踪。

3. 基于特征点的方法:通过检测图像中的特征点,并使用特征点间的相对位置和运动信息来实现目标的寻踪。

4. 基于边缘检测的方法:通过检测图像中的边缘,并利用边缘的形状和分布信息来实现目标的寻踪。

投影寻踪方法在许多领域都有应用,例如:
1. 视频监控:用于实时跟踪目标物体,如行人、车辆等。

2. 机器人导航:用于机器人的自主导航和避障。

3. 动作识别:用于分析和识别人体动作,如姿态跟踪、手势识别等。

4. 医学图像处理:用于跟踪和分析医学图像中的病变和器官。

5. 航空航天:用于航空器或卫星的轨迹预测和跟踪。

总的来说,投影寻踪方法是一种重要的图像处理技术,可以在许多领域中应用,实现目标的寻找和跟踪。

投影寻踪文档

投影寻踪文档

投影寻踪简介投影寻踪,是一种通过使用光影投射来追踪目标位置的技术。

该技术广泛应用于场景重建、虚拟现实和增强现实等领域,其原理是通过使用光源投射光影,然后通过适当的算法和传感器来捕捉和分析光影的变化,从而确定目标的位置和姿态。

原理投影寻踪的原理可以分为以下几个步骤:1.光源投射:先确定一个或多个适当的光源,并投射光线到场景中,使得光线能够形成明显的投影。

常见的光源包括激光、LED灯和投影仪等。

2.光影捕捉:使用适当的光感传感器或相机来捕捉场景中的光影变化。

传感器可以是各种各样的设备,如摄像机、光电二极管等。

3.光影分析:对捕捉到的光影进行分析,提取目标的信息。

这个过程通常涉及图像处理和计算机视觉相关的技术,如边缘检测、物体识别和姿态估计等。

4.目标定位:根据光影分析的结果确定目标的位置和姿态。

通过计算来自多个光源的光线投射点的坐标,并结合已知的场景信息,可以准确地确定目标在场景中的位置和朝向。

应用领域投影寻踪技术在许多领域都有广泛的应用。

场景重建投影寻踪可以用于场景重建,例如建筑物或其他物体的三维建模。

通过将多个光源投射到场景中,然后捕捉和分析光影信息,可以准确地重建场景的三维模型。

虚拟现实投影寻踪在虚拟现实中的应用也非常广泛。

通过投射光线并跟踪目标的位置和姿态,可以实现用户在虚拟场景中的自由移动和与虚拟物体的交互。

增强现实在增强现实中,投影寻踪可以用于将虚拟物体与现实世界进行融合。

通过投射光线并追踪目标的位置和姿态,可以准确地将虚拟物体投影到现实场景中,实现虚拟与现实的交互。

娱乐和体育投影寻踪技术在娱乐和体育领域也有广泛的应用。

例如,通过在体育场馆中使用多个投影仪,可以实现对运动员的实时定位和跟踪,从而提供更好的观赛体验。

未来发展投影寻踪技术在不断发展和演进。

随着计算机技术和传感器技术的进步,我们可以期望看到更加精确和高效的投影寻踪系统。

未来可能出现更小、更智能的传感器设备,以及更高分辨率和更大亮度的投影设备。

投影寻踪法在企业评价体系中的应用综述

投影寻踪法在企业评价体系中的应用综述
表2研究发现投影寻踪法与嫡值法的结果与实际结果较相似但是在利用熵值法进行权重确定时熵值法有一定的缺点熵值法赋权要求指标数据必须全部大于零否则不能直接计算比重也不能取对数但是为了保证数据的完整性和评价的可信度等于零的数值又不能直接删去因此需要对该项指标数据进行变换u636表2企业绩效评价中权重的处理方法及原理方法权重确定基本原理结果通过同一指标观测值之间的差异程度确定权重较准确部分学者在进行企业绩效评价研究时采取的是一种发展比较成熟的方法一模糊综合评价法该方法在企业绩效评价中应用颇多但是其最主要的缺点就是权重的赋予具有很大的人为因素容易偏离评价目标
在 许 多领域 获得 成功 应用 。
初 提 出并 进行 试验 。将 高维 数据 投影 到低 维空 间 , 发
现 数据 的聚 类结构 和 解决 化 石 分 类 问题I 3 j 。1 9 7 4年
1 投影寻踪法的背景 、 基 本 原 理 及 发 展 现 状
1 . 1 投 影 寻 踪 法 的 产 生 背 景
第l 3卷 第 l 1 期 2 0 1 3年 1 1 月

和 产
投影寻踪法在企业评价体系中的应用综述
苏 屹 ,姜 雪松 ,张成 功
( 哈尔滨工程大学 1 .经 济 管 理 学 院 ; 2 .企 业 创 新 研 究 所 , 啥 尔滨 1 5 0 0 0 1 )
摘要 : 投 影 寻踪 法作 为 一 类新 兴 的 分 析 高 维 度 数 据 的 统 计 方 法 , 已经普 遍 应 用 于 各 个 领 域 , 本 文介 绍 了投 影 寻 踪 模 型 的
伴 随着社 会 的进步 和科 学研 究 的不断 深入 发展 ,
人们 对 高维数 据 的统 计 分 析 逐 渐增 多 , 也 愈 发普 遍 、

投影寻踪模型

投影寻踪模型

2 投影寻踪评价模型投影寻踪方法最早出现于20世纪60年代末,Krusca 首先使用投影寻踪方法,把高维数据投影到低维空间,通过计算,极大化一个反映数据聚集程度的指标,从而找到反映数据结构特征的最优投影方向。

它是用来分析和处理高维观测数据,尤其是对于非线性、非正态高维数据的一种新型统计方法。

目前已广泛地应用于分类、模式识别、遥感分类、图像处理等领域。

具体应用过程如下: 设投影寻踪问题的多指标样本集为{}n j m i j i x ,,1;,,1),( ==,其中, m 是样本的个数,n 为指标个数。

建立投影寻踪模型的步骤如下:(1)数据预处理:样本评价指标集的归一化处理,消除各指标值的量纲和统一各指标值的变化范围。

对于越大越优的指标:))()(/())(),((),(min max min j x j x j x j i x j i x --=*(1);对于越小越优的指标:))()(/()),()((),(min max max j x j x j i x j x j i x --=*(2);其中,)(max j x )(min j x 为第j 个指标的最大值、最小值。

(2)构造投影指标函数:设A(j)为投影方向向量,样本i 在该方向上的投影值为:∑=*=nj j i X j A i Z 1),()()( (3)即构造一个投影指标函数Q(A)作为确定投影方向优化的依据,当指标达到极大值时,就认为是找到了最优投影方向。

在优化投影值时,要求Z(i)的分布特征应满足:投影点局部尽可能密集,在整体上尽可能散开。

因此,投影指标函数为:Q(A)=S z *D z ,式中:S z — 类间散开度,可用Z(i)的标准差代替;D z — 类内密集度,可表示为Z(i)的局部密度。

其中:2121)}1/(])([{--=∑=m Z i Z S m i z ; )()(11ij m i m j ij z r R I r R D -*-=∑∑== Z —序列{Z (i )|i =1~m }的均值;R 是由数据特征确定的局部宽度参数,其值一般可取0.1*S z ,当点间距值ij r 小于或等于R 时,按类内计算,否则按不同的类记;ij r =| Z(i)一Z(j)|;符号函数I (R -ij r )为单位阶跃函数,当R ≥ ij r 时函数值取1,否则取0。

投影寻踪模型

投影寻踪模型

投影寻踪方法及应用内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法。

最后结合上市公司的股价进行实证分析,并给出结论和建议。

关键词:投影寻踪投影寻踪聚类模型遗传算法一、简介(一)产生背景随着科技的发展,高维数据的统计分析越来越普遍,也越来越重要。

多元分析方法是解决高维数据这类问题的有力工具。

但传统的多元分析方法是建立在总体服从正态分布这个假定基础之上的。

不过实际问题中有许多数据不满足正态假定,需要用稳健的或非参数的方法来解决。

但是,当数据的维数很高时,即使用后两种方法也面临以下困难:第一个困难是随着维数增加,计算量迅速增大。

第二个困难是对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”。

对于核估计,近邻估计之类的非参数法很难使用。

第三个困难是对低维稳健性好的统计方法,用到高维时则稳健性变差。

另一方面,传统的数据分析方法的一个共同点是采用“对数据结构或分布特征作某种假定——按照一定准则寻找最优模拟——对建立的模型进行证实”这样一条证实性数据分析思维方法〔简称CDA法)。

这种方法的一个弱点是当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,很难收到好的效果。

其原因是证实性数据分析思维方法过于形式化、数学化,受束缚大。

它难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。

针对上述困难,近20年来,国际统计界提出采用“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析新方法,而PP就是实现这种新思维的一种行之有效的方法。

(二)发展简史PP最早由Kruskal于70年初建议和试验。

他把高维数据投影到低维空间,通过数值计算得到最优投影,发现数据的聚类结构和解决化石分类问题。

1974年Frledman和Tukey加以改正,提出了一种把整体上的散布程度和局部凝聚程度结合起来的新指标进行聚类分析,正式提出了PP概念,并于1976年编制了计算机图像系统PRIM——9。

Projection pursuit regression(PPR)

Projection pursuit regression(PPR)

第一节 投影寻踪回归我们先介绍一下Peter Hall 提出的投影寻踪回归(Projection Pursuit Regression)的思想,它一点也不神秘。

我们手中的资料是k n k k k x Y x ,},{1=是p 元,Y k 是一元。

非参数回归模型是n k x G Y k k k ≤≤+=1 ,)(ε(10.1.0)我们的任务是估计p 元函数G ,当然}|{)(x x Y E x G k k ==。

G 是将p 元变量映像成一元变量,那么何不先将p 元变量投影成一元变量,即取k x u θ'=,再将这个一元实数u 送进一元函数G 作映像呢?由于要选择投影方向),,(1p θθθ =,使估计误差平方和最小,就是要寻踪了。

所以取名为投影寻踪回归。

具体操作如何选方向θ,如何定函数G ,如何证明收敛性,下面将逐步讲述。

需要指出的是,投影寻踪回归与单指针半参数回归模型的思想基本上一样,基本算法也差不多,差别大的方面是收敛结果及证明。

若论出现时间,投影寻踪回归较早,在1989年,单指针模型较晚,在1993年。

一、投影寻踪回归算法假设解释变量集合}1,{n k x k ≤≤是来自密度函数为f 的p 元随机样本,对每一个p 元样本x k ,有一元观察Y k 与之对应,并且)()|(x G x x Y E k k ==(10.1.1)这里G 是回归函数,也是目标函数。

令Ω为所有p 维单位向量的集合,θ,θ1,θ2,…是Ω中的元素。

如果H 是一个p 元函数,比如f 或G ,则H 沿方向θ的方向导数记作u x H u x H x H n /)}()({lim )(0)(-+=→θθ(10.1.2)假如这个极限存在的话。

高阶导数则记作)()()(2121)(θθθθH H =⋅,等等。

x ∈R p 的第i 个分量记作x (i ),点积)()(i i yx y x ∑=⋅,模长21)(x x x ⋅=。

投影寻踪

投影寻踪
zi =
∑a
j =1
m
j
x ij
,i=1,2…,n
3.目标函数 目标函数:聚类分析就是对样本群进行合理的分类,可以 目标函数 根据分类指标来构造目标函数,故将目标函数Q(a)定义为类 间距离s(a)与类内密度d(a)的乘积,即Q(a)=s(a)·d(a)。类间 距离用样本序列的投影特征值标准差计算, S(a)愈大,散布愈开。 设投影特征值间的距离
投影寻踪技术是国际统计界于70年代中期发展 起来的、用来处理和分析高维观测数据,尤其是非正 态、非线性高维数据的一种新兴统计方法。它利用 计算机直接对高维数据进行投影降维分析,进行数据 , 客观投影诊断,自动找出能反映高维空间规律的数据 结构,达到研究分析高维数据的目的。
一、产生背景
传统的多元分析方法是建立在总体服从某种分布比 如正态分布这个假定基础之上的,采用 “假定—模 拟—检验”这样一种证实数据分析法(Confirmatory Data Analysis,简称CDA)。 但实际问题中有许多数据并不满足正态分布,需要用 稳健的或非参数的方法去解决。不过,当数据维数很 高时,存在计算量大、维数祸根、稳健性变差等问题。
5.综合评价分析 综合评价分析:根据最优投影方向,便可计算反映各评价指 综合评价分析 标综合信息的投影特征值 zi ,以 zi 的差异水平对样本群进 行综合分析。
密度窗宽参数R的确定 密度窗宽参数 的确定
不同的R值对应不同的最佳投影方向,也就是从不 同角度观测数据样本的特性,对于某一样本群体, 只有选择合理的密度窗宽参数才能得到合理的分类 结果,因此,参数R的取值在模型中非常关键。目 前大多是通过试算或经验来确定,一般认为R的合 理取值为
xij =
x −x x
0 ij 0 max

水土流失分区的赋权投影寻踪方法

水土流失分区的赋权投影寻踪方法
科研管理
水利规划与设计
2 0 1 3 年第 1 l 期
水土流失分 区的赋权投影寻踪方法
张庆 文 金 菊 良
( 1 . 甘肃省陇南市水利 电力勘 测设计院 甘肃 武都 7 4 6 0 0 0 ; 2 .合肥工 业大学 安徽 合肥 2 3 0 0 0 9 )
【 摘 要 】 以兰 州新 区为 背 景 ,分 析 了新 区水 资源 的特 征 、 结构 以及 水 资 源 的可 持续 利 用 状况 ,论证 了兰 州新 区 的水 资源 的利 用 结 构 ,进行 了新 区的 需水 量 预测 和 可供 水 量预 测 ,从 兰州 新 区水 资源 供 需平 衡分 析 结果 入手 ,针 对 本 区特 点从 几个 方 面提 出了加 强兰 州新 区水 资源 可持 续利 用 的对 策和 建 议 。 【 关键词】 兰州 新 区 水 资 源 可 持续 利 用 水 资 源供 需 平衡 分 析 对 策 【 D O I编码 】 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 2 — 2 4 6 9 . 2 0 1 3 . 1 1 . 0 1 3
分 区过 程 兼 有 许 多 定 量 指 标 和 定 性指 标 , 且 各 指
流 失强度越 大的标准化处理公式 可取 为:
, ,= X i i / m a x,

( 1)

标 的量 纲和 对水土流失分 区的效用不尽相 同, 特 别是各 指标的权重 目前 尚较难确 定 。 上 述这些分 区 方法 在 实 际 应 用 中存 在 不 足 , 集 中体 现 在 定性 指标 如 何 定 量 化 , 各 指标 权 重 如 何合 理 确 定 问 题, 各单元综合评价指标值 的差异较 小等 。 为此 , 本文在上述研 究成果基 础上 , 综合挖 掘主观判断
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
m
Q( s ) = s (a ) ⋅ d (a )
• 类间距离用样本序列的投影特征值方差计算
s ( a ) = [ ∑ ( zi − z a )
i =1 n 2
n]
1
2
s ,(a) 愈大,散布愈开。
n n i =1 k =1
• 类内密度 d (a) = ∑∑ ( R − rik ) f ( R − rik ) 其中 rij = zi − zk (i, k =1,2,⋯, n)
投影寻踪聚类模型
• 设第i个样本第j个指标为 xij (i = 1,2,⋯ , n; j = 1,2,⋯ , m) ,n为样 本个数,m为指标个数,建立投影寻踪聚类模型的步骤如 下: ' • 样本指标数据归一化: x ij = x ij x j max • 线性投影:在单位超球面中随机抽取若干个初始投影方 向 a ( a 1 , a 2 , ⋯ , a m ) ,利用样本i在一维线性空间的投影特 征值的表达式 z i = ∑ a j x ij' 计算其投影指标的大小,根据指标 j =1 选大的原则,最后确定最大指标对应的解为最优投影方向。 • 寻找目标函数:综合投影指标值时,要求投影值 zi 的散布 特征应为:局部投影点尽可能密集,最好凝聚成若干个点 团,而在整体上投影点团之间尽可能散开。故可将目标函 数Q(a) 定义为类间距离s (a) 与类内密度d (a ) 的乘积,即
一、投影寻踪的产生背景
• 传统的多元分析方法是建立在总体服从正 态分布满足正态假定,需要用稳健的或非 参数的方法来解决。但是,当数据的维数 很高时,即使用后两种方法也面临以下困 难: 1、维数增加,计算量迅速增大 2、维数祸根 (在给定逼近精度的条件下, 估计一个多元函数所需的样本点数随着变 量个数的增加以指数形式增长。) 3、对低维稳健性好的统计方法,用到高维 时则稳健性变差
−∞

g ( x)
Q 信息散度指标定义为: ( f ) = d ( f g ) + d ( g f ) d 当 f = g 时, ( f g ) = 0;若f偏离g越远,那么 d ( f g ) 值就越大, 因此 d ( f g ) 刻划了到g的偏离程度。 用离散化的概率分布p和q分别代替连续的密度函数f和g,这时 p Q( p, q) = D( p q) + D(q p) ,其中 D ( p q ) = ∑ q ⋅ log( ) 指标变为 q 如果投影指标的值越大,那么意味着它越偏离正态分布。
PP方法的主要特点: • PP方法能够在很大程度上减少维数祸根的 影响; • PP方法可以排除与数据结构和特征无关, 或关系很小的变量的干扰; • PP方法为使用一维统计方法解决高维问题 PP 开辟了途径; • PP方法可以用来解决某些非线性问题; • 一些传统的多元分析方法就是PP方法的特 例,如主成分分析; • PP方法的不足之处是计算量大,同时对于 高度非线性问题的效果不好。
样本形式为 ∑1 ( 2 j + 1)[ E P Q j ( 2 Φ ( a T Z ) − 1)] 2 i= 3、偏度指标和峰度指标 偏度是用来衡量分布非对称性的统计指标,峰度是用来 衡量分布平坦性的统计指标,它们都对离群点非常敏感。 因此可以用作投影指标来寻找离群点。设原随机变量为X, 投影方向为a,偏度指标和峰度指标分别为: I1 (a) = Q1 (aT X ) = k32 和 I 2 ( a ) = Q 2 ( a T X ) = k 42 两者混合产生的指标 2 T 2 2 I 4 (a) = Q4 (aT X ) = k32 ⋅ k 4 I3(a) = Q3(a X) = k3 + k4 /12 和
1 f ( R − rik ) = 0 R ≥ rik R < rik
R为估计局部散点密度的窗宽参数,
r max < R ≤ 2m
类内密度愈大,分类愈显著。 4.优化投影方向:当 Q(a)取得最大值时所对应的投影 方向就是所要寻找的最优投影方向。
= 寻找最优投影方向的问题转化为 max Q(a) m s(a) ⋅ d (a)
• 机械PP:模仿手工PP,用数值计算方法在计 算机上自动找出高维数据的低维投影,即让计 算机按数值法求极大解的最优化问题的方法, 自动地找出使指标达到最大的投影。它要求对 一个P维随机向量X,寻找一个K(K<P)维投 影矩阵A,使定义在某个K维分布函数集合 Fk 上的实值函数Q(投影指标), 满足
• 传统的数据分析方法大多采用“对建立的 模型进行证实”这样一条证实性数据分析 思维方法。 弱点: 当数据的结构或特征与假定不相符时,模 型的拟合和预报的精度均差,尤其对高维 非正态、非线性数据分析,很难收到好的 效果。 因此,高维数据尤其是非正态高维数据分 析的需要,加上80年代计算机技术的高度 发展是PP产生的主要背景。
PP的分类
• PP包括手工PP和机械PP两方面内容。 • 手工PP:主要是利用计算机图像显示系统 在终端屏幕上显示出高维数据在二维平面 上的投影,并通过调节图像输入装置连续 地改变投影平面,使屏幕上的图像也相应 地变化,显示出高维数据在不同平面上投 影的散点图像。使用者通过观察图像来判 断投影是否能反映原数据的某种结构或特 征,并通过不断地调整投影平面来寻找这 种有意义的投影平面。 • 1974年斯坦福大学教授J.H.Friedman等人 编制的,PRIM-9是最早的图象显示系统。
Q( Ax1 , Ax2 ,⋯, Axk ) = Q( Ax) = Max
如果原数据确有某种结构或特征,指标又选得 恰当,那么在所找到的某些方向上,一定含有 数据的结构或特征。
主成分分析与投影寻踪

• 以主成分分析为例说明投影寻踪 • 取描述一维数据散布程度的标准差作为投影指标 P维数据 x 1 , x 2 , ⋯
四、投影指标
• PP的出发点是度量投影分布所含信息的多少,而高 维数据集合的线性投影是几乎正态的,并且正态分 布通常为无信息分布的代表。从而寻求与正态分布 差异最大的线性投影分布,即含信息最多的投影分 布,成为PP方法的常用方式之一。 • 投影指标: 1、方差指标 Q ( a T X ) = Var ( a T X ) 设( x1 , x2 ,⋯ , xn ) 是总体X的独立同分布的样本,方差 1 Q ( a X ) = ∑ ( a x − E ( a X )) 指标的样本形式为 n
a =1, a < b1
λ2
• 是机械投影寻踪的特例 • 一般的并不要求后面的投影方向与前面找 到的投影方向垂直。而且,对于主成分分 析其样本协方差阵及特征根和特征向量对 离群点是非常敏感的,正是由于样本协方 差阵的不稳定,造成了传统主成分分析的 不稳健。 • 缺点:用主成分来描述或逼近原始数据, 反映的是数据的全局特征或宏观特征,可 能会漏掉主要的局部特征或细节特征,因 此主成分分析是不稳健的。
, xn
a =1
找出一个方向b,投影的散布达到最大
σ (b1' x1 ,⋯, b1' xn ) = max σ (a ' x1 ,⋯, a ' xn )
• b1 就是 x1 , x2 ,⋯ , xn 的样本协差阵S的最大特征根 λ1 的特征向 量( λ 1 , λ 2 , ⋯ , λ p ,从大到小) • x1 , x2 ,⋯, xn 的第一主成份
• 降维流程图
线性、非线性 高维 数据集 结 构 结构 度量 线性 投影
基于机构的PP降维流程
五、投影寻踪聚类模型(PPC)
• 由于PP是一种数据分析的新思维方式,可 以将这种新思想与传统的回归分析、聚类 分析、判别分析、时序分析和主分量分析 等相结合,会产生很多新的分析方法。例 如投影寻踪聚类(Projection Pursuit Classification,简称PPC),它是以每一类 内具有相对大的密集度,而各类之间具有 相对大的散开度为目标来寻找最优一维投 影方向,并根据相应的综合投影特征值对 样本进行综合分析评价。
一般方案: • 选定一个分布模型作为标准(一般是正态 分布),认为它是最不感兴趣的结构; • 将数据投影到低维空间上,找出数据与标 准模型相差最大的投影; • 将上述投影中包含的结构从原数据中剔除, 得到改进了的新数据; • 对新数据重复步骤(2)(3),直到数据 与标准模型在任何投影空间都没有明显差 别为止。
优化问题
ቤተ መጻሕፍቲ ባይዱ

a = ∑ a2 = 1 j
j =1
5.综合评价聚类分析: 根据最优投影方向,便可计算反映各评价 指标综合信息的投影特征值 zi 的差异水平, zi 以 的差异水平对样本群进行聚类分析。
六、遗传算法(GA)
• 定义:遗传算法(Genetic Algorithm,简称GA)以生物 进化过程为背景,模拟生物进化的步骤,将繁殖、杂交、 变异、竞争和选择等概念引入到算法中,通过维持一组可 行解,并通过对可行解的重新组合,改进可行解在多维空 间内的移动轨迹或趋向,最终走向最优解。它克服了传统 优化方法容易陷入局部极值的缺点,是一种全局优化算法。 主要特点: • 直接对结构对象操作,不存在求导和函数连续性的限定; • 具有内在的隐并行性和更好的全局寻优能力; • 采用概率化的寻优方法,能自动获取和指导优化的搜索空 间,自适应地调整搜索方向,不需要确定的规则。
n
1 I n (a ) = 2
J
4、信息散度指标 高维数据在不同方向上的一维投影与正态分布的差别是不一 样的,它显示了在这一方向上所含有的有用信息的多少,因 此可以用投影数据的分布与正态分布的差别来作为投影指标。 设f是一维密度函数,g是一维标准正态分布密度函数,f对g +∞ 的相对嫡为 d ( f g ) = g ( x ) ⋅ log f ( x ) dx
n 2 T T T i =1 i
如果我们求max Q(a X ) ,得到的 的方向。
相关文档
最新文档