主成分分析法在乐安河水质评价中的应用

合集下载

主成分分析法在水质评价中的应用及分析

主成分分析法在水质评价中的应用及分析
Ab t a t Pr cp o o e ta a y i a e e tma n c mp n n sfo ma y f co s i l e sr c u et r v d a i sr c : i i a c mp n n n ss c n s lc i o o e t r m n a t r ,smpi t tu t r o p ie b ss n l l fh o o i a t r o ef l w —u o k Asf rto e a v n a e ,p n i a o o e ta a y i i p l d i trq a i v u - fman fc o f rt l s h o o pw r. s d a t g s r cp lc mp n n n l ss s a p i n wa e u l y e a 8 o h i e t l t n a d i t d c d i rn i l s a d se s S l ce ve e e t n a d eg t a t r ft e ma n sr a o ah v ri ・ i n n r u e t p c p e t p . e e td e lv n s c i i h c o o i te m fHu i e Ri e An o o s i n o n f s h n h iP v n e T e r s l h we h t P n i a o o e t n lss i a f ci ey meh d w i h v l ai n o a e u i u r i c . h e u t s o d t a : r c p lc mp n n sa ay i s n e e t l t o h l t e e au to fw t rq a t o s i v e l y

主成分分析法在水源水质评价中的应用

主成分分析法在水源水质评价中的应用
S a g a o ra fP ee tv dcn h n h i un lo rv nie Me iie J
文 章 编 号 :04— 2 1 2 1 ) 0— 4 5一O 10 9 3 (0 1 1 0 8 2

环 境 与 K 业 卫 生 ・ q ,
主成分分析法在水源水质评价中的应用
分析 的一个特例 , 为多个 有相关 性 的变量 间存在起 支 认 配作用 的共 同因子。采用数 理统计 方法 , 将原 来 的 n维 变量 的总方差分解成 n 互不相关 因子 ( 分 ) 个 成 的方差 , 根据方差在 总方差 中的比率 ( 比率越 高表示对 原始 变量 差异 的解释能力越强 ) 从 大 到小选择 作为 主成分 , , 使累
10 .2 2 .6 O3 7 .4 29
0 9 .0 1 .9 7 9 9 .3 O 9
0 2 .3 0 2 .2 4 6 .5 4 4 .1 9 .9 10 0 5 5 0 .0
响, 对方差为 0的变量要舍去 。
2 3 主 成 分 载 荷 矩 阵 .

计算 :. 1 变量间的相关 系数矩阵 R;. 阵 R的特征 2矩
1 资料 与 方 法
2 结 果
2 1 变 量相 关 关 系矩 阵 .
标 准化后 的变 量表 示为 : 高锰 酸盐 指数 ( 1 、 Z ) 氨氮 (2 、 Z ) 总磷( 3 、 z ) 总氮( 4 、 酸盐 ( N计 ) Z ) z )硝 以 ( 5 。变 量相关 关系矩 阵见表 1 S S ( P S软件默认 自动进行 变量的 标准化) 。统计检验 显示 , M K O值 为 0 59 B re 球体 .9 , a l t tt 检验值为 5 .2 , 12 6 卡方统计值 的显 著性水 平为 0 0 0小 .0

基于主成分分析的水质评价方法

基于主成分分析的水质评价方法

BOD 5 - 0. 465 - 0. 356 0. 386 - 0. 442 3. 141 0. 451 - 0. 491 - 0. 500 - 0. 411 - 0. 486 - 0. 479 - 0. 347
TN - 1. 110 - 0. 452 0. 434 - 0. 348 2. 485 0. 999 - 0. 876 - 1. 210 - 0. 456 - 0. 256 0. 033 0. 757
表 3 监测指标的相关矩阵
X X X X X X X X X
1 2 3 4 5 6 7 8 1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
1. 0000 - 0. 5187 - 0. 5062 - 0. 5087 - 0. 6548 - 0. 3710 0. 1177 0. 2582
- 0. 5187 - 0. 5062 - 0. 5087 - 0. 6548 - 0. 3710 1. 0000 0. 9996 0. 8631 0. 7966 0. 5011 0. 9996 1. 0000 0. 8602 0. 7952 0. 4975 0. 8631 0. 8602 1. 0000 0. 8935 0. 5338 0. 0713 0. 2763 0. 7966 0. 7952 0. 8935 1. 0000 0. 3618 - 0. 1211 0. 3256 0. 5011 0. 4975 0. 5338 0. 3618 1. 0000 0. 7844 0. 1196
X
1
87
X
2
5
X
6
X
7
X

基于主成分分析法的浰河水质评价

基于主成分分析法的浰河水质评价
Received: Jan. 30th, 2019; accepted: Feb. 18th, 2019; published: Feb. 25th, 2019
Abstract
Principal components analysis (PCA) was applied to assess the water quality at the end of the Lihe River in 2017, based on the monitoring data of 13 indicators of BOD5, CODMn, NH3-N, TP, TN, DO, pH, etc. The result showed that the water pollution score was the highest in July and lowest in January; Domestic pollution, river sediment and industrial waste water are the main causes of water pollution in the river.
关键词
浰河,主成分分析,水质评价
刘刚 等
Copyright © 2019 by author(s) and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
2. 数据来源
浰河是汉江的主要支流之一,流经荆门市东宝区、钟祥市,长约 184 公里,控制流域面积 1140 平方 公里,主要界于北纬 30˚09'07''~30˚27'36''、东经 112˚00'17''~112˚24'45''。浰河入汉江口监测断面执行《地 表水环境质量标准》(GB3838-2002) III 类标准,本文选取该监测点 2017 年常规监测数据中的 pH、电导 率、水温、氨氮、溶解氧、高锰酸钾指数、生化需氧量、石油类、化学需氧量、总磷、总氮、氟化物、 六价铬等 13 项指标以及浰河水文站(陈安站)的流量数据作为数据源,见下表 1。

主成分分析方法在水库水质综合评价中的应用

主成分分析方法在水库水质综合评价中的应用

98.533
0.129
0.761
99.294
0.069 0.032 0.019
0.403 0.191 0.112
99.697 99.888 100
方差累计 贡献率 (%) 39.299 49.394 58.142 66.253 72.364 78.059 82.503 86.724
4.2 主成分综合得分计算
2. 水质评价的主成分分析法
2.1 主成分分析法的基本原理
主成分分析(Principal Components Analysis,PCA)也称为主分量分析,是一种通过降维 来简化数据结构的方法:如何把多个变量(指标)化为少数几个综合变量(综合指标),而 这几个综合变量可以反映原来多个变量的大部分信息。为了使这些综合变量所含的信息互不 重叠,应要求它们之间互不相关。用少量的几个综合变量代替原来的许多变量是有实际意义 的。由这几个综合变量出发还有可能得到一个总的指标,按此总指标来排序、分类,问题就 可能简单多了[3,4]。主成分分析法是多元分析法的一种,设法将原来众多具有相关性的指标 重新组合成一组新的相互无关的综合指标来代替原来指标。
6.681 1.716 1.487
39.299 10.095 8.748
39.299 49.394 58.142
6.681 1.716 1.487
39.299 10.095 8.748
1.379
8.111
66.253
1.379
8.111
1.039
6.111
72.364
1.039
6.111
0.968
5.696
3.4 原始数据标准化
主成分综合评价方法的关键是求主成分,其工具是协方差矩阵。由于协方差矩阵易受指 标的量纲和数量级的影响,经常要对原始数据进行标准化处理,标准化使协方差矩阵变成了相 关系数矩阵。但在消除量钢和数量级影响的同时,也消除了各指标变异程度上的差异信息,

主成分分析法在水质评价中的应用

主成分分析法在水质评价中的应用

0 .701 R =
0 .12 0
N1 � - 0.54 93 - 0.18 38 - 0.7332 2 N2 N3 � - 0.9 9 68 - 0.02 8 3 - 1.02 51 1 � 2 .078 8 - 0.159 3 1.9 19 4 4
0 .8 2 5 0 .508 0 .9 34 0 .8 62 0 .9 33 0 .532
0.9 8 9 - 0.771 0.756 - 0.073 1 - 0 .708
N4 � 0.4 674 0.3715 0.8 38 9 3
0 .412 0 .12 0 - 0.771 - 0.6 38 - 0.073 - 0.708 1
表1
各成分特征值及其贡献率
由表 4 可 以看出 ,N2 水质 最好,N1 水质次之 , 类水功能区基本要求,N3 , N4 水 类水域功能区要
1 /2 j
2
水质分析
文中采用 2 002 年 4 月的银川新城南郊地下水 4
-
个水样点水质分析结果作为水质评价对象 �选取钙离 TH , TD S, C OD 共 7 个 因子作 子, 氯离子, 硫酸根 , 铵, 为评价指标� 对原始水质分析数据进行标准化 , 具体 结果, 见表 1, 表2�
( 2 ) 计算相关系数矩阵和相应的特征值 , 特征向 量 �在标准化数据矩阵的基础上计算原始指标相关系 数矩阵 R , R 为实对称矩阵 �计算特征方程 R - I =
� � � � 水质等级� 综合得分 F � - 1.9 712 - 1. 9 712 �F 59 7 � - 0.8 - 0. 9 59 7�F 2 �0.59 8 0.59水质主成分分析结果
水样编号 F1 F2 综合得分 排名 水质等级

主成分分析耦合集对分析的区域初始水权分配效果后评价

主成分分析耦合集对分析的区域初始水权分配效果后评价

主成分分析耦合集对分析的区域初始水权分配效果后评价作者:吴振徐丹丹王开然张欣王薇傅世东来源:《人民黄河》2023年第10期摘要:科学合理的初始水权分配效果后评价对于充分发挥市场在水资源高效利用与优化配置中的关键调节作用、促进水权交易具有重要意义。

针对区域初始水权分配效果后评价中存在的指标体系定量赋权的客观性以及确定性与不确定性间的关联问题,采用主成分分析(PCA)法对指标赋权,并基于集对分析(SPA)理论,建立了PCA-SPA耦合的区域初始水权分配效果后评价方法。

将该方法应用于滨州市初始水权分配效果后评价,结果表明:邹平市、无棣县和博兴县的初始水权分配效果为“优秀”,惠民縣的初始水权分配效果为“良好”且升级到“优秀”的趋势较强,滨城区、沾化区和阳信县的初始水权分配效果为“一般”。

关键词:区域初始水权分配;后评价;主成分分析;集对分析中图分类号:TV213.4文献标志码:Adoi:10.3969/j.issn.1000-1379.2023.10.011引用格式:吴振,徐丹丹,王开然,等.主成分分析耦合集对分析的区域初始水权分配效果后评价[J].人民黄河,2023,45(10):62-66.随着全球气温日趋升高,我国工业化、城镇化快速发展面临日益严峻的水资源供需矛盾[1],各类水源性、工程性和水质性缺水问题并存[2]成为经济社会健康良性协调发展的关键制约因素。

构建最严格的水资源管理制度和技术标准体系,是从严、从细优化利用水资源的关键[3]。

将水权交易纳入水资源管理体系,结合政策、制度支持与科学系统管理手段,鼓励多种形式的水权交易,对创新水资源高效利用方式、支撑经济社会高质量发展具有重要意义[4]。

科学合理的初始水权分配[5-7],是充分发挥市场在水资源高效利用与优化配置中的关键调节作用、推进水权交易制度建设的重要前提条件[8]。

对区域初始水权分配效果进行科学的后评价,则是客观分析水权分配效益和可持续发展水平、为后续水资源管理水平的提升和相关政策措施的制定提供技术依据的重要支撑。

主成分分析法在水质综合评价中的应用

主成分分析法在水质综合评价中的应用

主成分分析法在水质综合评价中的应用学习主成分分析法的目的是:对水质评价因子进行筛选、组合,用于水环境综合整治工程的指导。

本论文就是以主成分分析法为依据建立综合评价模型,利用神经网络算法确定各评价因子的权重。

在神经网络算法的基础上,选取C-C作为遗传算法的初始值,经过多次迭代后,最终确定评价指标。

1、评价体系设计理论评价体系设计理论包括:确定指标体系的原则与指标赋权方法;确定指标的筛选方法;构建权重集;构建评价模型。

2、主成分分析法及其应用根据前人研究结果得出,水环境质量的综合评价指标具有高度的相关性和重复性,通过聚类分析将各因子划分成不同的类别,选择相应的阈值作为主成分,并根据重要性排序法确定权重,从而确定出最优综合评价指标体系。

3、基于成分相似性度量和分析结果,建立了数据驱动的评价模型基于主成分分析法,确定因子的权重。

通过改变因子的评价方式,以及根据因子的重要性赋予不同权重,对上海市黄浦江两岸水质综合评价模型进行重新调整,实现了三类评价指标之间的互补性。

基于因子重要性赋予评价指标权重的步骤是:①评价指标的选取及水平权重的确定。

由于水质的复杂性,采用因子评价指标体系,可以保证较大的信息容量。

②对水质评价指标的确定。

主成分的选择是关键问题,也是最难处理的问题,即综合评价指标选取时存在一个怎样的阈值问题。

③基于相似性指标和重要性,确定综合评价模型的形式。

④对比实例验证模型的可靠性。

4、结果及讨论3、基于成分相似性度量和分析结果,建立了数据驱动的评价模型。

因此,建立评价模型过程中应该遵循从简单到复杂,由单因素逐步过渡到多因素的规律,才能使分析结果更接近真实情况。

4、结果表明,建立的模型能很好地反映水质质量的状况,尤其适用于短时间的水质评价,以便于快速进行环境整治工程的决策。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

环境评价主成分分析法在乐安河水质评价中的应用万金保1,2, 曾海燕1,2, 朱邦辉1,2(1.南昌大学鄱阳湖湖泊生态与生物资源利用教育部重点实验室,江西南昌330047;2.南昌大学环境与化学工程学院,江西南昌330031)摘 要: 采用主成分分析法,借助SPSS 软件,对乐安河7个监测断面的DO 、COD 、COD M n 、BOD 5、NH 3-N 、Cu 、Cr 等7个水质指标进行了分析计算。

从原始数据中提取占总方差的82.367%的两个因子来反映水体的污染程度,经分析识别得到了乐安河的两个主成分因子:有机物及重金属(Cu 、C r),结果与实际情况相吻合。

证实主成分分析法是一种有效的水质评价方法。

关键词: 主成分分析法; 水质评价; 乐安河中图分类号:X824 文献标识码:C 文章编号:1000-4602(2009)16-0104-05Application of Pri ncipal Co m ponent Analysis i n Eval uati on ofW aterQuality of Lean R iverWAN Jin bao 1,2, ZENG H ai yan 1,2, Z HU B ang hui1,2(1.K ey Lab of P oyang Lake E cology and B io resource Utilization <M inistry of Education >,N anchang University,N anchang 330047,China;2.C ollege o f Environ m ental and Che m icalEng i n eering,N anchang University ,Nanchang 330031,China )Abst ract : W ith the help of SPSS so ft w are ,DO,C OD,COD M n ,BOD 5,NH 3-N,Cu and C r i n seven m on itoring secti o ns o fLean R iverw ere analyzed and ca lculated usi n g the pri n cipa l co m ponent anal ysis .The t w o facto rs t h at account for 82.367%o f the total variance were extracted fro m the or i g i n al data to reflect the degree of po ll u tion o fw ater bodies ,and t w o princ i p al co m ponent factors of Lean R iver w ere i d entified :(1)organ ic m atter ;(2)heavy m etals Cu and Cr .The result co i n cidesw ith the act u al situa ti o n .It is confir m ed t h at the princ i p al co m ponent analysis is an effective m ethod to eva l u ate t h e w ater qua lity .K ey w ords : princi p al co m ponent analysis ; w ater quality eva l u ation ; Lean R iver 基金项目: 十一五 国家科技支撑计划项目(2007B A B23C02)目前国内外进行水环境质量评价的常用方法有综合指数法[1]、模糊综合评价法[2]、灰色系统理论方法[3]、人工神经网络法[4]、投影寻踪模型法[5]等。

由于水质系统是由各种污染指标变量组成的复杂系统,各个因子之间具有不同程度的相关性,每一因子都只从某一方面反映水质情况,从而使上述方法在进行水质评价时表现出一定的局限性[6]。

而主成分分析法是将多个指标标准化为少数几个综合指标,简化了统计分析系统的结构,它是在确保不损失原有信息的前提下,将多种影响水质的指标重新组第25卷 第16期2009年8月 中国给水排水CH I NA W ATER &WA STE WAT ERV o.l 25No.16Aug .2009合成一组新的、相互之间无关的、较少的综合指标,来反映指标的信息,以达到降维、简化数据和提高分析结果的可靠性的目的[7]。

笔者采用主成分分析法,借助SPSS软件,对江西省境内的乐安河进行水质综合评价,找出其主要影响水质指标及其水质污染程度的排序,以期为该流域的水污染防治及水资源合理开发利用提供决策指导。

1 主成分分析法简介1 1 基本原理主成分分析的基本原理[8]是在原坐标系下的数据点图中寻求数据点 波动最大的方向作为新的坐标轴方向,数据点在该坐标轴上的坐标即为第一主成分,然后再寻求第二个方向,第二个方向与新的坐标轴垂直且最能反映数据点的 波动,将这个方向作为第二个新的坐标轴方向,数据点在该坐标轴上的坐标即为第二主成分,依此类推得到能够表达原信息的所有主成分。

1 2 主成分分析法及其计算步骤设共有n个待评水体样本,每个样本有p个指标变量,则构成一个n∀p阶的水质数据矩阵:X=x11x12#x1px21x22#x2p####x n1x n2#x np(1)经降维处理,p个指标变量可综合成m个新指标F1,F2,#,F m,则X i可由F m表示为:X=LF+ (2)X=(x1,x2,#,x p)T(3)L=x11x12#x1mx21x22#x2m####x p1x p2#x pm(4)F=(F1,F2,#,F m)(5)=( 1, 2,#, p)(6)上述模型[9]应用于水质综合评价时,可根据精度分析要求(通常累计贡献率E>80%),在p个指标变量中合理选取m个综合指标(m<p),略去线性表达式中的特殊因子 ,从而达到数据降维的目的。

其中,F为综合指标的向量集合,据此可进行相关分析。

L为原变量上的载荷值,体现了原指标变量与综合指标变量的相关程度。

从而实现对水样数据的简量化、可比性的分析。

具体的操作步骤如下:∃ 建立原始变量矩阵X设有n个样本,每个样本有p个指标变量,构成数据矩阵:X=(X ij)n∀p,其中i=1,2,#,n,j=1,2, #,p;X ij表示第i个样本的第j项指标值。

% 对原始数据做标准化处理由于主成分分析中各个因子的量纲、大小以及评价指标往往差别很大,可比性较差,因此首先进行标准化,使其具有良好的可比性[10]。

用Z-Score变换对原始变量矩阵X进行标准化处理,得到变换后的新矩阵Z n∀p,即:Z ij=x ij-x jS j(i=1,2,#,n;j=1,2,#,p)x j=1n&ni=1x ij,S2j=1n-1&ni=1(x ij-x j)2∋ 计算标准化数据的相关系数矩阵R=(r jk)p∀p(i=1,2,#,n;j=1,2,#,p)r jk=1n-1&ni=1Z ij!Z ik(j,k=1,2,#,p)( 求相关系数矩阵R的特征根和特征向量,确定主成分求相关矩阵R的特征根 1) 2)#) p,它是主成分的方差,表示各个主成分在描述被评价对象上所起作用的大小。

根据每个特征根求出相应的特征向量,L g=l g1,l g2,#,l gp(g=1,2,#,p),将标准化后的指标变量转换为主成分:F g=l g1Z1+l g2Z2+# +l g p Z p(g=1,2,#,p)。

F1称为第一主成分,F2称为第二主成分,#,F p称为第p主成分。

∗ 确定主成分的个数根据累计方差贡献率来进行确定,即按照方差占总方差的比例=&pi=1i/&ni=1i(通常取)85%)来选取,p为主成分的个数。

+ 确定综合评价函数对每个主成分的线性加权值,F g=l g1Z1+l g2Z2 +#+l g p Z p(g=1,2,#,p),再对p个主成分进行加权求和,即得最终评价函数:F=11+ 2+#+ p F1+21+ 2+#+ p F2+ #+p1+ 2+#+ p F p(7)万金保,等:主成分分析法在乐安河水质评价中的应用第25卷 第16期2 实例分析2 1 样本点及监测指标的确定乐安河源于江西与浙江省的交界处,流经婺源、德兴、乐平、万年、波阳等县(市),最后进入鄱阳湖,河道全长为279km,流域面积为9616km2,平均径流量为80.6∀108m3/a。

由于受沿岸工业废水、生活污水等的污染,该河水质不断恶化。

江西省政府一直以来对乐安河流域的环境综合治理问题都极为关注,早在1997年就将乐安河列入全省的 四河整治对象之一。

鉴于此对乐安河水质状况做出科学、准确的评价具有一定意义。

研究所用数据是在乐安河枯水期的7个监测断面获得的7个水质指标[11](见表1)。

表1 乐安河枯水期水质评价指标T ab.1 Evalua ti ng ind i cato rs of L ean R i v er w aterqua lity i n lo w w ater season m g!L-1监测断面DO COD CODM n B OD5NH3-N Cu Cr海口10.7425.264.218.420.130.000.021中洲9.7925.684.288.560.140.280.021香屯9.6627.484.589.160.140.970.021戴村10.8525.84.38.60.350.390.008虎山9.927.04.59.00.410.050.008韩家渡9.2029.14.859.70.450.020.007龙口8.612.62.14.20.040.020.0002 2 计算过程根据主成分分析法的具体步骤,将原始监测数据进行标准化后求出相关系数矩阵,用SPSS软件分别对7个评价指标DO(X1)、COD(X2)、C OD M n (X3)、BOD5(X4)、NH3-N(X5)、Cu(X6)、Cr(X7)的相关系数矩阵和特征值进行计算,以确定评价的主因子数。

据特征值方差累计贡献率确定选取主成分的个数。

对原始数据进行标准化消除量纲的影响,得到标准化数据(见表2)。

表2 标准化的水质数据T ab.2 S tandardized data o f wa ter qua lit y监测断面DO COD COD M n B OD5NH3-N Cu Cr 海口1.1540.1010.1010.101-0.662-0.7001.014中洲-0.0380.1780.1780.178-0.6000.0931.014香屯-0.2010.5050.5050.505-0.6002.0491.014戴村1.2920.2000.2000.2000.6970.405-0.499虎山0.1000.4180.4180.4181.068-0.559-0.499韩家渡-0.7780.8000.8000.8001.315-0.644-0.615龙口-1.530-2.210-2.202-2.202-1.218-0.644-1.429 利用SPSS求得其相关系数矩阵、特征值和主成分贡献率及累计贡献率,初始因子载荷矩阵分别见表3~5。

相关文档
最新文档