投影寻踪技术的理论及应用研究进展
投影寻踪方法及应用

投影寻踪方法及应用
投影寻踪方法是一种图像处理技术,主要用于跟踪或寻找图像中的某个目标或区域。
它通过对目标的投影进行分析和处理,从而实现目标的寻找和跟踪。
常见的投影寻踪方法包括:
1. 基于阈值的方法:将图像转换为二值图像,然后使用阈值来提取目标的投影,通过对投影进行分析和处理来实现目标的寻踪。
2. 基于模板匹配的方法:使用预先定义的模板与图像进行比较,通过对比图像中的局部区域与模板的相似度来实现目标的寻踪。
3. 基于特征点的方法:通过检测图像中的特征点,并使用特征点间的相对位置和运动信息来实现目标的寻踪。
4. 基于边缘检测的方法:通过检测图像中的边缘,并利用边缘的形状和分布信息来实现目标的寻踪。
投影寻踪方法在许多领域都有应用,例如:
1. 视频监控:用于实时跟踪目标物体,如行人、车辆等。
2. 机器人导航:用于机器人的自主导航和避障。
3. 动作识别:用于分析和识别人体动作,如姿态跟踪、手势识别等。
4. 医学图像处理:用于跟踪和分析医学图像中的病变和器官。
5. 航空航天:用于航空器或卫星的轨迹预测和跟踪。
总的来说,投影寻踪方法是一种重要的图像处理技术,可以在许多领域中应用,实现目标的寻找和跟踪。
农业气象灾害预警模型研究

农业气象灾害预警模型研究近年来,随着气候变化的影响日益加剧,农业生产面临着越来越多的灾害风险。
例如,洪涝、干旱、风雹等自然灾害对农作物的生长发育和产量造成了严重影响,给农民和整个社会带来了严重的经济损失。
因此,通过气象预警系统及时预报和应对农业气象灾害,成为当下亟待解决的问题。
目前,国内外已经出现了多种类型的气象预警模型,其中投影寻踪技术(PT)、人工神经网络(ANN)和支持向量机(SVM)等方法均得到了广泛应用。
通过这些模型,可以对农业气象灾害发生的可能性进行预测和预警,为农民的生产提供决策参考和保障。
一、投影寻踪技术(PT)PT是一种最早应用于气象预测的技术,其基本思想是采用时间序列数据,对未来发展趋势进行预测。
其应用广泛的原因主要是由于其具有数据处理和预报流程简单、准确度高、易于实施和操作等优点。
通常,PT技术在解决农业气象灾害预报时,先通过寻找时间序列数据的趋势,在尚未发生灾害的情况下捕捉变化,依据这些变化进行气象灾害预报。
例如,在一些干旱地区,春季到入梅期,是该地区发生干旱的高发期。
利用PT技术,可以根据前几年的气象历史数据,预测出本年度入梅时间,从而对农民的生产提供相关的建议和指导。
二、人工神经网络(ANN)ANN是模拟人脑神经的信息处理机制,利用大量的历史气象数据,可建立一个非线性的、多层结构的神经网络,并利用神经元之间的连接权值进行信息处理。
其优点是可以应对多元和非线性的问题,并拥有良好的预测能力,使得其在农业气象预警中应用越来越广泛。
例如,在华南地区,由于气候温暖,导致芒果种植面临着病虫害的威胁。
通过ANN技术,可以将历年的气象数据与作物病虫害的数据结合起来,建立起相关的模型,做出病虫害预警。
同时,ANN技术还可以通过分析未来气温、降雨量、相对湿度等因素,进行芒果病虫害的预测,为芒果的生产提供及时的支持。
三、支持向量机(SVM)SVM是一种利用间隔最大化的思想进行分类和预测的机器学习方法,其能够处理高维、非线性和小样本问题,并能够有效避免过拟合。
投影寻踪技术在环境质量评价中的应用

庄 世 坚 ( r 市 环 境 监 测 中 心 站 , r 6 0 4 厦 l 厦 l310 )
摘要
计方 法 。
介 绍 了国 际统 计 界近 年 来迅 速 发 展 的投 影寻 踪 技术 及 其 方法 与 特 点 , 出这 是 适 合环 境 质 量评 价 的一 种 新兴 统 指
影 , 低 维 空 间 上 对 数 据 结 构 进 行分 析 , 在 以达 到 研 究 和 分 析 高 维 数 据 的 目的 。 投影寻踪技 术包 括二方 面 的 内容 : 是 “ 工 ” 一 手
子 ” 两 边 各 一 个 翅 膀 。 中 间部 分 的 点 代 表 正 常 人 的 , 化 验 数 据 , 两 边 分 别 代 表 显 示 和 隐 性 多 尿 症 患 者 而 的 化验 数 据 , 由此 说 明两 类 患 者 必 须 经 由正 常 状 态 才 能实 现 互 相 转 变 。
s a i tc t o is t n io t ts i s me h d ft o e v r nme t lq a i s e s n . n a u l y a s s me t t
Байду номын сангаас
Ke r s: o e t n pu s i; vr n ntlq aiy; ss me t y wo d Pr j c i r u t En io me a u lt Ase s n o
“ 械” 影 寻踪是 对 “ 工 ” 影 寻踪 的模 仿 , 机 投 手 投
ma n等 人 于 1 7 9 4年 编 制 的 , 们用 计 算 机 模拟 数 据 他 和 历史 数 据 成 功 地 进 行 了分 类 和 聚 类 分 析 。利 用 这
投影寻踪

∑a
j =1
m
j
x ij
,i=1,2…,n
3.目标函数 目标函数:聚类分析就是对样本群进行合理的分类,可以 目标函数 根据分类指标来构造目标函数,故将目标函数Q(a)定义为类 间距离s(a)与类内密度d(a)的乘积,即Q(a)=s(a)·d(a)。类间 距离用样本序列的投影特征值标准差计算, S(a)愈大,散布愈开。 设投影特征值间的距离
投影寻踪技术是国际统计界于70年代中期发展 起来的、用来处理和分析高维观测数据,尤其是非正 态、非线性高维数据的一种新兴统计方法。它利用 计算机直接对高维数据进行投影降维分析,进行数据 , 客观投影诊断,自动找出能反映高维空间规律的数据 结构,达到研究分析高维数据的目的。
一、产生背景
传统的多元分析方法是建立在总体服从某种分布比 如正态分布这个假定基础之上的,采用 “假定—模 拟—检验”这样一种证实数据分析法(Confirmatory Data Analysis,简称CDA)。 但实际问题中有许多数据并不满足正态分布,需要用 稳健的或非参数的方法去解决。不过,当数据维数很 高时,存在计算量大、维数祸根、稳健性变差等问题。
5.综合评价分析 综合评价分析:根据最优投影方向,便可计算反映各评价指 综合评价分析 标综合信息的投影特征值 zi ,以 zi 的差异水平对样本群进 行综合分析。
密度窗宽参数R的确定 密度窗宽参数 的确定
不同的R值对应不同的最佳投影方向,也就是从不 同角度观测数据样本的特性,对于某一样本群体, 只有选择合理的密度窗宽参数才能得到合理的分类 结果,因此,参数R的取值在模型中非常关键。目 前大多是通过试算或经验来确定,一般认为R的合 理取值为
xij =
x −x x
0 ij 0 max
投影寻踪

Q( s ) = s (a ) ⋅ d (a )
• 类间距离用样本序列的投影特征值方差计算
s ( a ) = [ ∑ ( zi − z a )
i =1 n 2
n]
1
2
s ,(a) 愈大,散布愈开。
n n i =1 k =1
• 类内密度 d (a) = ∑∑ ( R − rik ) f ( R − rik ) 其中 rij = zi − zk (i, k =1,2,⋯, n)
投影寻踪聚类模型
• 设第i个样本第j个指标为 xij (i = 1,2,⋯ , n; j = 1,2,⋯ , m) ,n为样 本个数,m为指标个数,建立投影寻踪聚类模型的步骤如 下: ' • 样本指标数据归一化: x ij = x ij x j max • 线性投影:在单位超球面中随机抽取若干个初始投影方 向 a ( a 1 , a 2 , ⋯ , a m ) ,利用样本i在一维线性空间的投影特 征值的表达式 z i = ∑ a j x ij' 计算其投影指标的大小,根据指标 j =1 选大的原则,最后确定最大指标对应的解为最优投影方向。 • 寻找目标函数:综合投影指标值时,要求投影值 zi 的散布 特征应为:局部投影点尽可能密集,最好凝聚成若干个点 团,而在整体上投影点团之间尽可能散开。故可将目标函 数Q(a) 定义为类间距离s (a) 与类内密度d (a ) 的乘积,即
一、投影寻踪的产生背景
• 传统的多元分析方法是建立在总体服从正 态分布满足正态假定,需要用稳健的或非 参数的方法来解决。但是,当数据的维数 很高时,即使用后两种方法也面临以下困 难: 1、维数增加,计算量迅速增大 2、维数祸根 (在给定逼近精度的条件下, 估计一个多元函数所需的样本点数随着变 量个数的增加以指数形式增长。) 3、对低维稳健性好的统计方法,用到高维 时则稳健性变差
投影寻踪算法

投影寻踪算法投影寻踪算法是一种计算机视觉算法,用于从图像或视频中提取出目标的轮廓和运动信息。
它在许多应用领域都有广泛的应用,如目标跟踪、人脸识别、动作捕捉等。
投影寻踪算法的核心思想是通过对图像或视频进行处理,提取出目标的轮廓信息,然后根据目标在连续帧之间的运动信息进行跟踪。
具体而言,投影寻踪算法一般包括以下几个步骤:1. 前景提取:首先需要将目标从背景中分离出来,得到前景图像。
常用的前景提取方法有基于颜色模型、基于纹理模型和基于运动模型等。
这些方法可以根据实际应用场景选择合适的算法。
2. 特征提取:在得到前景图像后,需要对目标进行特征提取,以便后续的目标跟踪。
常用的特征包括轮廓、颜色直方图、纹理特征等。
这些特征可以用来描述目标的形状、颜色和纹理等信息。
3. 目标跟踪:在特征提取后,可以使用不同的跟踪算法对目标进行跟踪。
常用的跟踪算法包括卡尔曼滤波器、粒子滤波器和相关滤波器等。
这些算法可以根据目标的运动模型和观测模型进行目标位置的估计和预测。
4. 跟踪结果评估:为了评估跟踪算法的性能,需要对跟踪结果进行评估。
常用的评估指标包括重叠率、漏检率和错误率等。
这些指标可以用来衡量目标跟踪的准确性和鲁棒性。
投影寻踪算法的优点是可以实时地对目标进行跟踪,并且对光照变化和背景干扰具有一定的鲁棒性。
然而,由于目标在连续帧之间的运动可能存在突变或遮挡等情况,因此在实际应用中仍然存在一些挑战。
总结起来,投影寻踪算法是一种用于目标跟踪的计算机视觉算法。
它通过对图像或视频进行处理,提取出目标的轮廓和运动信息,从而实现对目标的实时跟踪。
投影寻踪算法在许多领域都有广泛的应用,但在实际应用中仍然存在一些挑战,需要进一步研究和改进。
投影寻踪技术及其应用进展

投影寻踪技术及其应用进展投影寻踪技术是一种广泛应用于不同领域的分析方法,它旨在通过将高维数据投影到低维空间中,寻找数据中的结构或规律。
本文将介绍投影寻踪技术的基本概念、原理和发展历程,并探讨其在不同领域的应用进展。
本文将介绍投影寻踪技术及其在多个领域中的应用进展,重点探讨该技术的原理、算法和应用场景。
投影寻踪技术最初是为了解决高维数据的可视化问题而提出的。
由于高维数据的复杂性,人们很难通过直观的方式理解其内部的结构和规律。
因此,通过将高维数据投影到低维空间中,可以帮助人们更好地理解数据。
投影寻踪技术的原理主要是通过寻找最佳投影方向,使投影后的数据结构尽可能地保留原有数据中的信息。
随着技术的发展,投影寻踪技术已经发展成为一种广泛应用于多个领域的分析方法。
它的应用范围涵盖了医学、军事、工业等多个领域。
医学领域:在医学领域,投影寻踪技术被广泛应用于基因表达数据分析、医学图像处理等方面。
例如,通过将高维基因表达数据投影到低维空间中,可以帮助生物学家更好地理解基因之间的关系和功能。
军事领域:在军事领域,投影寻踪技术被应用于目标跟踪、雷达信号处理等方面。
例如,通过将雷达信号投影到低维空间中,可以更好地分析和识别目标。
工业领域:在工业领域,投影寻踪技术被应用于故障诊断、质量控制等方面。
例如,通过将机器运行数据投影到低维空间中,可以帮助工程师更好地分析机器的运行状态和潜在故障。
本文通过实验对比了不同算法在投影寻踪技术中的表现。
实验结果表明,基于随机森林的投影寻踪算法在处理高维数据时具有较好的效果。
通过将实验结果与传统的线性降维方法进行比较,发现基于随机森林的投影寻踪算法可以更好地保留高维数据的结构和规律。
实验一:在基因表达数据分析中,我们采用了基于随机森林的投影寻踪算法对一组基因表达数据进行降维处理。
通过将降维后的数据与原始数据进行对比,发现降维后的数据仍然能够很好地反映原始数据中的基因表达模式和规律。
实验二:在雷达信号处理中,我们采用基于随机森林的投影寻踪算法对一组雷达信号进行降维处理。
投影寻踪方法在工程环境影响评价中的应用

1 . 投 影 寻 踪 方 法 的概 述
1 . 1投影 寻踪方法 的定义 所谓的投影寻踪方法也就是一种新 型的统计方法 . 主要是对 高维 数据信息 的处理分析 . 从 而对原高位数据的结构和特征进行投影 . 实 现对高维数据信息的管理。 而早在上个世纪 8 O 年代 , 人们就开始推广 投影 寻踪 方法 . 并 且取得 了不错 的效果 . 从而有 助于人们对相关 数据 信 息的采集 。 1 . 2投影寻踪方法的背景和研究 内容 而在传统数据分析的过程中 . 对于高维数据进行采 集处理 有着十 分重要 的效果 . 但是有现代 化的数据信息 比较 复杂 . 而且其数 据化形 式结构也存在着一定的问题 . 这就导致人们在对其 相关 数据信息进行 分析的过程 中. 无法对数据信息的特征以及 变化规律进行掌握 。 为此 , 我们在对一些高维数据信息进行采集的过程 中 . 就将投影寻踪方法应 用到其 中 . 从 而使得信息评价的效果得到进一步的提高 。 目 前, 投影寻 踪方法 已经得 到了人们 的广泛应用 .而且随着科学技术的不断发展 . 人们也将网络信 息技术应用到其 中, 这就使得投影寻踪方法 的适应范 围得到进一步 的扩大 其 中我们在投影寻踪 方法研究分析的过程 中. 其研究 内容所 涉及到 的问题 主要包含了投影寻踪聚类分析 、 投影寻踪 回归以及投影 寻踪 网络学习这几个方面 . 这就使得数据信息采集 的效 果得到进一步的提高
综 合指 标值更 趋于理想状态值, 说 明建立东 江水 电工程有利于改善 区
域环境发展 。
2 . 综 合 评 价 模 型 的 建 立
投影寻踪是分析 高维数据 的一类统计方法, 其基本思想是把高维 数据投影到低维子空间上. 通过分析低维空间数据点 的变化特征 , 研究 高维数据结构特征 . 本 文将投影 寻踪方法 应用在水电工程的环境影 响 评 价中. 建立投影 寻踪综合评价 模型. 设有 m个 工程环境 影响 因素确 定 了 n个工程 环境评价状态 ( 此处 即理想环 境状态 、 工程 修建前环 境 状态和工程修建后环境状态1 用 影响因素的投影值构造 的综 合评价指 标确定综合评 价指标 的关键 是找到反映高维数 据特征结构 的最优 投 影方 向 a . 由于投影方 向是在多维空 间上 的单位 向量 , 因此, 将 优化投影 方 向转变为求解有约束的极值问题 . 即构造一个投影指标 ’ 作为优选投 影方向 的依据, 当指标达到极值 时, 就找到 了最优投影方 向, 可 由下述 数学模 型描述. 当投影方向确定后 , 根据式便可计 算各 状态下的综合评 价指标, 进而作 出环境影响评价 . 优化影方 向的方法很 多 本文 采用遗 传算法进行优化 工程环境影响评 价模 式下 的综合评标 法虽然在标底 和报价之 间 关系的处理上摆脱 了传统评标定标模式, 但事实上这 些方法仍然带有 定的主观性 和常规性 由于每一项进行公开招标的建筑工 程通常都 会面I 晦多个投标人 的多个投标方案 的选择 同 时对 每一个投标方案 的 描述又往往涉及 到多个要素, 因此, 在对每个投标方案进行综合效果评
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第24卷第1期2009年2月柳 州 师 专 学 报Journal of Liuzhou Teachers College Vol 124No 11Feb 12009 [收稿日期]2008-11-10 [基金项目]广西青年科学基金(0832092) [作者简介]吴春梅(1970—),女,讲师,研究方向:计算机应用和神经网络应用;罗芳琼(1971—),女(壮族),广西忻城人,讲师。
投影寻踪技术的理论及应用研究进展吴春梅,罗芳琼(柳州师范高等专科学校数学与计算机科学系,广西柳州 545004) 摘 要:投影寻踪技术是国际统计界于70年代中期发展起来的、用来处理和分析高维观测数据,尤其是非正态、非线性高维数据的一种新兴统计方法。
它利用计算机直接对高维数据进行投影降维分析,进行数据客观投影诊断,自动找出能反映高维空间规律的数据结构,达到研究分析高维数据的目的。
本文对30多年来投影寻踪技术在应用领域方面的文献进行收集整理,探讨投影寻踪技术在相关领域的应用和发展状况,为从事投影寻踪研究或应用的专业人员获取和利用相关信息提供线索和参考。
关键词:投影寻踪;岭函数;回归分析 中图分类号: TP30116 文献标识码: A 文章编号: 1003-7020(2009)01-0120-060 前言近三十多年来,随着计算技术的发展和计算机的普及,国际统计界发展了一类处理和分析高维数据的新兴统计方法———投影寻踪(Projection Pursuit ,简称PP )法,它是采用“审视数据→模拟→预测”探索性数据分析(Exploratory Data Analysis ,简称EDA )的新途径[1],适宜于非线性、非正态分布数据的处理,并能避免“维数祸根”,因为投影寻踪技术不需要人为地把高维数据整理成知识、构造成数据库进行训练后再推理,而是直接利用计算机对高维数据进行投影降维分析,进行数据客观投影诊断,自动找出能反映高维空间规律的数据结构,它具有稳健性、抗干扰性和准确度高等优点,因此在许多领域获得成功应用[2-3]。
1 投影寻踪技术的产生背景与实现方法111 投影寻踪技术的产生背景随着科学技术的发展,高维数据的统计分析越来越普遍,也愈来愈重要。
多元分析方法是解决这类问题的有力工具。
但传统的多元分析方法是建立在总体服从某种分布比如正态分布这个假定基础之上的,采用所谓的“对数据结构或分布特征作某种假定———按照一定准则寻找最优模拟———对建立的模型进行证实”,也就是“假定—模拟—检验”这样一种证实性数据分析法(C onfirmatory Data Analysis ,简称CDA )。
但实际问题中有许多数据并不满足正态分布,需要用稳健的或非参数的方法去解决。
不过,当数据维数很高时,这些方法都将面临一些困难:(1)随着维数增加,计算量迅速增大;(2)对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”,非参数法也很难使用;(3)低维稳健性好的统计方法用到高维时稳健性变差。
因此,当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,传统的CDA 方法很难收到好的效果。
其原因是它过于形式化、数学化,受束缚大,难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。
为了克服上述困难,需要对客观数据不作假定或只作极少假定,而采用“直接审视数据———通过计算机模拟数据结构———检验”这样一种探索性数据分析方法。
而PP 就是实现这种新思维的一条行之有效的途径。
PP 最早由Kruskal 在70年代初提出并进行试验。
他把高维数据投影到低维空间,发现数据的聚类结构和解决化石分类问题[4-5]。
随后Friedman 和Tukey 提出了一种把整体上的散布程度和局部凝聚程度结合起来的新指标进行聚类分析,正式提出了PP 概念[6]。
1981年,Friedman 等人相继提出了PP回归,PP 分类和PP 密度估计[7],Donoh 则提出了用21Shannan 熵作投影指标的方法,并利用PP 的基本思想给出了多元位置和散布的一类仿射同变估计。
Di 2aeonis ,Friedma 和Jones 还讨论了PP 的其他有关理论问题[8-10]。
Huber 在1985年对上述工作和结果作了概括和总结[11]。
我国学者成平等1985年证明了PP 密度估计的一个收敛性问题,并于1987年给出了PP 经验分布的极限分布[12]。
他们还对多元位置和散布的PP 型估计性质进行了讨论[13]。
陈忠琏和李国英等于1986年用PP 方法给出了散布阵和主成分的一类稳健估计[14]。
陈家骅在1986年证明了密度PP 估计的一个极限定理。
宋立新和成平于1996年提出的关于PP 回归逼近的均方收敛性,回答了Hu 2ber1985年的猜想[15]。
与此同时,郑祖国等从1985年起进行了PP 的应用开发研究,成功地完成了投影寻踪回归(PPR )和投影寻踪时序(PP TS )软件包的程序设计,对大量实例进行了验算,这些都是有益的工作。
112 投影寻踪技术的基本思想及其实现方法11211 投影寻踪技术的基本思想投影寻踪是一种用来处理和分析高维数据,既可作探索性分析,又可作确定性分析的有效方法,其基本思想是:利用计算机技术,把高维数据通过某种组合,投影到低维(1~3维)子空间上,并通过极小化某个投影指标,寻找出能反映原高维数据结构或特征的投影,在低维空间上对数据结构进行分析,以达到研究和分析高维数据的目的。
11212 投影寻踪技术的实现方法 用PP 探索高维数据的结构或特征时,一般采用迭代模式。
首先根据经验或猜想给定一个初始模型;其次把数据投影到低维空间上,找出数据与现有模型相差最大的投影。
这表明在这个投影中含有现有模型中没有反映的结构,然后把上述投影中所包含的结构并在现有模型上,得到改进了的新模型。
再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。
由于PP 是一种数据分析的新思维方式,因此将这种新思想与传统的回归分析、聚类分析、判别分析、时序分析和主分量分析等相结合,会产生很多新的分析方法。
例如投影寻踪回归PPR 分析模型,其实现方法如下:设Y =f (X )和X =(x 1,x 2,…,x p )分别是一维和p 维随机变量,为了能客观反映高维非线性数据结构特征,投影寻踪回归采用一系列岭函数的“和”去逼近回归函数,即f (X )≈∑Mm =1G m (Z m )=∑Mm =1G m (a T m X )=∑Mm =1G (∑pj =1a mj x j )(1)其中,G m (Z m )为第m 个岭函数,M 为岭函数的个数;Z m =a T m X 为岭函数的自变量,它是p 维随机变量X 在a m 方向上的投影,a m 为投影方向。
投影寻踪回归模型仍采用最小二乘法作为极小化判别准则,即选择式(1)中的参数a mj 和岭函数个数M 的适当组合,使下式LL =min E[Y -∑Mm =1G m (∑pj =1a mj x j )]2(2)达到极小,即要求Z m =a Tm X 最大化。
目前建立投影寻踪回归模型一般采用Friedman 和Stuetzle 提出的多重平滑回归技术[16],鉴于该方法涉及许多复杂的数学知识,不易编程,这在很大程度上限制了投影寻踪技术的广泛应用。
为此,采用遗传算法(G A )来求解较为方便。
2 投影寻踪技术的特点PP 方法的特点主要有:(1)PP 方法成功克服了高维数据所造成的“维数祸根”困难,是对传统CDA 法的突破。
(2)PP 方法使用了降维手段,当维数较高时,数据结构常表现在几个投影方向上。
PP 法正好能找出反映数据结构的投影方向,而排除了那些与结构无关的投影方向上的数据的干扰作用,因此,它能有效地发现高维数值的结构和特征。
(3)由于PP 方法采用了EDA 法,与传统的CDA法相比,它在处理数据时,无须人为假定,不会损失大量有用的信息,能自动找出数据内在规律,因此稳健性较好。
(4)PP 方法虽然以数据线性投影为基础,但它寻找的是线性投影中的非线性结构,因此,它可用来解决一定程度的非线性问题。
PP 的不足之处是计算量大。
此外能解决的问题有限,对于具有很凹的等高线的密度或等高线是若干个同心球面的密度,效果不太好。
3 投影寻踪技术的应用研究进展PP 法与传统的CDA 法相比,虽然有不少优越性,但是由于PP 是一种数据分析的新思维方式,PP 法也不能取代传统的CDA 法,而只能说PP 法为分析数据增添了新的有力工具而已。
因此只有将这种新思想与传统的回归分析、聚类分析、判别分析、时序分析和主分量分析等相结合,即在常规分析方法中引进PP 思想,才会产生新的方法[17],获得意想不到的结果。
正因为如此,PP 技术不仅吸引了统计理论的数学工作者,也引起了众多领域的应用科技工作者的兴趣。
投影寻踪技术的研究和应用在国内已经历了30余年的发展时间,虽然在前期较缓慢,但进入20世纪90年代后,文献量逐年提高。
早期的文献基本属于数学、概率论与数理统计等基础学科,随后逐渐应用于环境质量评价与环境监测、地球物理学、水资源调查与水利规划、大气科学、农业基础科学等自然科学121领域,近几年,基础科学研究文献量增速有所下降,而应用研究领域文献量增速上升,在社会科学领域应用的文献有所增加。
本文就30多年来投影寻踪技术的应用领域方面的文献进行收集整理,探讨投影寻踪技术在相关领域的应用和发展状况,为从事投影寻踪研究或应用的专业人员获取和利用相关信息提供线索和参考。
311 投影寻踪技术在环境质量评价与环境监测方面的应用张学喜等[18]针对边坡稳定性评价的多因素问题,建立了基于加速遗传算法的投影寻踪评价模型,并给出了相应的算法和步骤;实例表明该评价模型是有效可行的和通用的,可以应用于其他评价问题。
徐伟等用PPR建立了国民经济发展的“积累”和“消费”模型,其模型的精度优于L S方法建立的线性回归模型[19]。
陈青君[20]等最近还将PPR技术对光合速率及其相关因子进行了分析,结果表明PPR技术能够处理大量的多因子数据,快速寻找各个时期影响光合速率的主要因子及其影响程度,为生产中增施CO2气肥、调控温度管理指标提供了可靠的理论依据。
彭荔红、李祚泳、郑文教、肖金树等[21]应用投影寻踪回归新技术,建立了大气污染物SO2浓度的预测模型,其预测建模样本的拟合合格率为96%,预留预测检验样本预测准确率为80%,高于模糊识别模型的预测精度。
段沛霞、倪长健等[22]首次依据动态聚类思想,建立了投影寻踪动态聚类模型,并将方法用于四川省生态环境质量综合评价中,该方法克服了在实际应用中密度窗宽取值难以确定及聚类结果依赖主观判断等弱点,结果更具可观性,为生态环境质量评价提供了科学依据,是评价生态环境质量的有效方法。