基于贪心核特征提取方法的中期峰值负荷预测 (1)

基于贪心核特征提取方法的中期峰值负荷预测 (1)
基于贪心核特征提取方法的中期峰值负荷预测 (1)

第29卷第9期V ol.29No.9

控制与决策

Control and Decision

2014年9月

Sep.2014基于贪心核特征提取方法的中期峰值负荷预测

文章编号:1001-0920(2014)09-1661-06DOI:10.13195/j.kzyjc.2013.0774

李军

(兰州交通大学自动化与电气工程学院,兰州730070)

摘要:针对中期电力负荷预测,提出基于贪心核主元回归(GKPCR)、贪心核岭回归(GKRR)的特征提取建模方法.通过对核矩阵的稀疏逼近,GKPCR和GKRR两种贪心核特征提取方法旨在寻找特征空间中数据的低维表示,计算需求低,适用于大数据集的在线学习.将所提出的方法应用于不同地区的电力负荷中期峰值预测,并与现有预测方法进行了比较.实验结果表明,在同等条件下,所提出的方法能有效地改进预测精度,而且性能更好,显示了其有效性和应用潜力.

关键词:贪心算法;特征提取;核主元回归;核岭回归;负荷预测

中图分类号:TN911文献标志码:A

Greedy kernel feature extraction method for medium term electricity peak load forecasting

LI Jun

(School of Automation and Electrical Engineering,Lanzhou Jiaotong University,Lanzhou730070,China.E-mail: lijun691201@https://www.360docs.net/doc/a1167384.html,)

Abstract:For midterm electricity load forecasting,modeling methods of feature extraction based on greedy kernel principal component regression(GKPCR)as well as greedy kernel ridge regression(GKRR)are proposed.On the basis of sparse approximation of the kernel matrix,the proposed greedy kernel feature extraction methods aim to?nd a lower dimensional representation of data embedded in the feature space.Modeling methods of greedy kernel feature extraction have low computational requirements and allow on-line processing of large data sets.The proposed GKPCR and GKRR methods are then applied to electricity peak load forecasting instances in different https://www.360docs.net/doc/a1167384.html,pared to existing other kernel-based forecasting methods,experimental results show that,the employed methods may signi?cantly improve the accuracy of peak load forecasting under the same condition,which have considerably better performance,and show the effectiveness and applicability.

Key words:greedy algorithm;feature extraction;kernel principal component regression;kernel ridge regression component;load forecasting

0引言

电力负荷的中长期预测对于电力部门有计划地制订电网规划、增容和改扩建方案至关重要.构建适应性更强的电力负荷中长期预测模型,对智能电网的发展规划和运行调度具有重要意义.

负荷预测通常依靠历史负荷数据和气候等因素构建预测模型.近年来,V olterra滤波器[1]、神经网络[2]、支持向量机(SVM)[3-4]等预测方法已成功应用于电力负荷中短期预测领域,而且SVM和高斯过程(GP)等基于核的学习方法被广泛关注.另一方面,将岭回归(RR)、主元回归(PCR)和偏最小二乘(PLS)等方法引入高维特征空间,可形成核岭回归(KRR)[5]、核主元回归(KPCR)[6]、核偏最小二乘(KPLS)[7]等基于核学习的方法,该类方法的求解避免了SVM中二次规划问题的求解,提高了计算效率,在建模方面同样具有很好的应用潜力.然而,与SVM、GP方法相似,这些方法也存在随着数据集的增大核矩阵计算较为复杂的困难.为了解决上述问题,可以基于期望最大化算法(EM)[8]迭代地计算提取主元特征,也可以通过对核矩阵进行稀疏逼近,使用基于贪心逼近算法的贪

收稿日期:2013-06-10;修回日期:2014-01-13.

基金项目:甘肃省高等学校基本科研业务费专项资金项目(620026);甘肃省教育厅硕导项目(1104-09).作者简介:李军(1969?),男,教授,博士,从事计算智能、机器学习、系统建模控制等研究.

1662

控制与决策

第29卷

心核主元分析(GKPCA)方法[9-10].GKPCA 方法不仅适宜于大数据集的在线学习,还能很好地挖掘数据的内在特征,增强模型的推广性.

本文在贪心核逼近算法的基础上,提出基于贪心核特征提取建模的GKPCR 和GKRR 方法,并将其应用于不同地区的中期电力负荷峰值预测的实例中,以评价预测的效果和性能.在同等条件下,与现有多种预测方法进行比较,验证了所提出方法的有效性.

1贪心核主元分析

1.1贪心核逼近算法

与PCA 方法提取特征不同,GKPCA 使用贪心核逼近算法提取非线性特征,其基向量的选取直接取自训练数据而非训练数据的线性组合,且满足数据重构误差最小,因此可获得对训练数据集逼近的次优解.

令Γ={?(x 1),?(x 2),???,?(x l )}为训练数据集映射至高维特征空间的集合,I ={1,2,???,l }为训练样本集Γ的索引集,J ={j 1,j 2,???,j m }为从训练样本集Γ中选择的样本子集S 的索引集,即S ={?(x i ):

j ∈J }.首先利用选择的训练子集作为非线性特征逼

近原训练样本数据集,即

??(x i )=∑

j ∈J

[ξi ]j ?(x j ),?i ∈I.

(1)

其中:J ∈I 包含m 个所选择的样本子集S ,系数向量

ξi ∈?m 为线性组合的系数.依赖于所选择的子集,

逼近目标是由均方误差所定义的重构误差,即

εMS (Γ∣J )=1l

∑i ∈I

?(x i )?

∑j ∈J

[ξi ]j ?(x j )

2.(2)

若给定选择的子集,则借助核函数,最优的系数可通过最小化式(2)求得,即

ξi =arg min ξ∈R m

?(x i )?

∑j ∈J

[ξi ]j ?(x j )

2=(K s )

?1

k s (x i ),

其中:核矩阵K s ∈?

m ×m

由所选择样本子集构成,且

[K s ]i,j =??(x j i ),?(x j j )?=k (x j i ,x j j ),

???为内积符号;样本x i 与选择的子集S 中的样本形

成核函数向量

k s (x i )=

[k (x j 1,x i ),k (x j 2,x i ),???,k (x j m ,x i )]T ∈?m .

对训练子集的选择是满足重构误差最小化的优化问题,即

J ?=arg min J ∈I

εMS (Γ∣J ),

(3)

且子集集合的基数满足Card (J )=m .

为加快计算,逐次选择增加到子集中的样本时,需要满足在第t 次迭代时,均方重构误差的最大上界

最小化,即

εMS (t )(Γ∣J )=1l

∑i ∈I

∥?(x i )???(t )(x i )∥2?1l (l ?t )max j ∈I ?J

(t )∥?(x j )???

(t )(x j )∥2.(4)

其中:t 为所选择子集J (t )的样本数目,j ∈I ?J 为j 属于集合I 且不包含于集合J .

每次迭代时,仅有最大逼近误差的样本被增加到样本子集J (t )中,使得式(4)不断下降,可最小化逼近均方重构误差.进一步利用施密特正交化方法,渐进选择子集S 中的样本,即基向量,从而形成正交基向量构成的子集.因此,贪心核逼近算法的具体实现步骤如下.

Step 1:令t =0,置J (0)={0},εi (0)=k (x i ,x i ),

i ∈I ;

Step 2:令t =t +1,选择j t ∈arg max j ∈I ?J (t ?1)

ε(t ?1)

j

;

Step 3:计算

[z i ]t =1

√εj t (

k (x i ,x j t )?t ?1∑

?=1

[z i ]?[z j t ]?)

;Step 4:计算

q t =1

ε(t ?1)j t (

δ(t )?t ?1∑

?=1[z j t ]?q ?)

,εi (t )=εi (t ?1)?([z i ]t )2;

Step 5:置J (t )=J (t ?1)

{j t };

Step 6:迭代计算Step 2~Step 6,至满足Card (J )

=m 或达到期望的重构误差为止.

算法实现步骤中的δ(t )∈?m 是单位向量,其第t 个元素为1,其余为零.每次迭代时,具有最大化均方误差的一个样本x j t ,其索引号被包括到子集J (t )中,然后重新计算重构误差.算法的停止条件为达到期望的均方重构误差或迭代至t =m 为止.算法通过选择最优子集J (?)可得到基集合S ,参数矩阵Q =

[q 1,q 2,???,q m ]的维数为m ×m ,由正交基向量αt 形

成,Q 矩阵定义的正交基集合W 与基集合S 等价,具有同样的线性张成.1.2

贪心核主元分析

与普通KPCA 方法相似,GKPCA 方法计算所有样本在所选定的特征空间数据子集上的投影,以满足

数据重构误差最小,即

z =Q T k s (x )+b .

(5)

其中:z ∈?m 为数据映射到核子空间上的投影;z 为

?(x )在贪心核逼近算法所选择的正交基向量形成的

子集上的投影,即训练样本在正交基向量集合W 上

第9期李军:基于贪心核特征提取方法的中期峰值负荷预测1663

的投影.

考虑所有数据在正交基向量形成的子集上的投

影逼近,则有Z=[z1,z2,???,z l],其维数为m×l.贪心

核逼近算法依据方阵Z逼近原始核数据矩阵,近似核

矩阵满足定义?K≈Z T Z.

在贪心核逼近算法的基础上,GKPCA进一步应

用常规PCA方法,首先针对维数为m×m的核矩阵

K1=ZZ T,提取相应的特征值和特征向量λi、V i(i=

1,2,???,m).V为特征向量矩阵,V i为λi对应的特征

向量,位于矩阵V的第i列;然后,按特征值大小排列,

选取非线性主元的数目p(p?m);最后,计算投影在

V k上的第k个非线性主元如下:

βk(x)=(Q T V)k k s(x)+b=

(A)k k s(x)+b=

m

i=1

αk i k s(x)+b.(6)

其中αk∈?m为A的第k个列向量,它形成参数矩阵A=[α1,α2,???,αp],其维数为m×p.因此,训练数据集矩阵X∈?l×n将投影在V的前p个特征向量上,

投影矩阵P的维数为l×p.

KPCA方法需要针对整个数据集形成的核矩阵提取非线性主元,其计算复杂度为O(l3).若贪心逼近算法选取的基向量数目为m,则k的取值至多达到m,所以GKPCA的计算复杂度为O(lm2).可见,对于处理大数据集而言,当m选取较小时,GKPCA的运算效率显著提高.

2贪心核特征提取建模

将GKPCA与标准的ε-SVM相结合,形成多层

SVM,它对回归建模问题具有稀疏解.然而,在高斯噪声下,二次平方损失函数的最小二乘方法将对回归建模问题具有更好的逼近.因此,在GKPCA的基础上,本文提出基于贪心核特征提取的GKPCR方法和GKRR建模方法.

2.1GKPCR方法

考虑在特征空间上的标准回归模型,有

y=Φw+ε.(7)其中:y为l个目标输出所构成的向量;Φ为输入数据集映射至特征空间上且中心化后的由?(x i)l i=1构成的l×M矩阵,M为特征空间的维数;w为回归系数向量;ε为系数向量.

为了应用GKPCA方法,考虑将Φ(x i)首先投影到样本子集S上,再投影到V k上,形成第k个非线性主元βk(x),由式(6)求取.

将所有数据Φ投影到非线性主元上,式(7)改写

y=Bη+ε.(8)其中:B=ΦV为变换后的一个l×M的数据矩阵,其各列是正交的;V为由特征向量V k作为列向量构成的矩阵,维数为M×M.

系数向量w的最小二乘估计为

?η=(B T B)?1B T y=Λ?1B T y,(9)其中Λ为对角阵,由核矩阵K1的特征值λ1,λ2,???,λM构成其元素.因此,在特征空间中,原始回归模型(7)中的w估计值计算为

?w=V(B T B)?1B T y=

M

i=1

λ?1i V i(V i)T.(10)利用GKPCA方法提取前p个非线性主元,基于正交的回归变量在特征空间中构建线性回归模型,形成GKPCR模型如下:

f(x)=

p

k=1

ηkβk(x)+b=

p

k=1

ηk

m

i=1

αk

i

k(x j

i

,x)+b=

m

i=1

c i k(x j

i

,x)+b,(11)其中c i=

p

k=1

ηkαk i,i=1,2,???,m.实际应用时,舍弃具有小方差的主元,能够消除由多重共线性引起的回归模型输出估计误差.另外,由式(11)可见,与KPCR针对整个数据核矩阵提取非线性主元相比, GKPCR主元的提取是针对特征空间的子集核矩阵K1=ZZ T进行的,因此能够处理大数据集,满足核矩阵的计算需求.

2.2GKRR方法

KRR是另一种能消除多重共线性的回归建模方法.考虑式(7)的回归模型,其解需要满足正则化风险最小化,即

(w?,b?)=

arg min

w∈H,b∈R

[1

l

l∑

i=1

(y i?f(x i))2+?∥w∥2

]

.(12)

其中:f(x)=w T?(x)+b,?为正则化常数,H为特征空间.系数向量w的最小二乘估计为

?w=(ΦTΦ+?E l)?1ΦT y.(13)其中:E l∈?l为单位阵,y∈?l为目标输出向量.

对核矩阵中心化预处理可消除偏置项b.利用表示定理[5],由线性RR方法的对偶形式可得到KRR模型如下:

f(x)=

l∑

i=1

αi K(x i,x)=?α,k(x)?,(14)

1664控制与决策第29卷其中α=[α1,α2,???,αl]T.将式(14)代入(12),则α

的最优解为

α=(K+l?E l)?1y.(15)

当l较大时,求取式(15)中核矩阵的逆会带来计算和

内存需求的困难.

为克服KRR的缺点,GKRR方法利用贪心逼近

算法,首先选择一个数目为m的正交基向量构成的数

据子集,在特征空间中,将所有训练数据投影到所选

择的数据子集上完成核投影逼近,则有

Z=[z1,z2,???,z l]∈?m×l,

与式(12)相似.在正则化风险最小化的条件下,式

(14)的KRR模型变换为GKRR模型,即

f(x)=?ν,z?=?ν,A T k s(x)?.(16)

其中:核函数k s(x)=[k(x j1,x),???,k(x j m,x)]T,系数

向量ν∈?m.与式(15)的求解相同,ν的最优解为

ν?=(ZZ T+m?E m)?1Zy,(17)

其中E m为单位阵.

由式(17)可见,GKRR方法仅针对维数为m×m

的矩阵进行求逆运算,由于m?l,可适用于大数据

集的求解,且满足复杂运算需求.

3中期电力负荷峰值预测实验

将贪心核特征提取建模方法应用于不同地区的

电力负荷预测的实例中.应用贪心核特征提取方法时,

贪心核逼近算法的停止条件为满足基向量m的规定

数目或εmax=maxεj(x)=0.05最大重构误差.另外,

高斯径向基核函数与多项式核等其他核函数相比,具

有良好的性能.因此,相同条件下,用于对比实验的核

函数仍选取高斯核函数,即

k(x i,x j)=exp(?0.5∥x i?x j∥2/σ2).

由于负荷预测的复杂性,不仅考虑电力负荷历

史观测值,还需要考虑日历信息、节假日信息、气象

信息等因素.按照时间序列建模的方式,预测输入包

含历史负荷值(y t?1,y t?2,???,y t?Δ),Δ表示嵌入维

数,还包括日历、节假日信息.为了避免建模过程中

出现的计算饱和现象,电力负荷值的实际序列数据

归一化为零均值、单位方差的数值.按照多步迭代

预测的方法进行中期峰值负荷预测,即训练时采用

GKPCR或GKRR方法构建单步预测模型.测试时,递

推地将输出作为下一次预测输入,滚动进行直至预测

结束.

用平均绝对百分比误差(MAPE)、最大误差

(ME)和相对误差(RE)评价预测性能,即

MAPE=100n

∑i?1

y i??y i

y i

/

n,

ME=max∣y i??y i∣,RE=(?y i?y i)/y i.

其中:y i为预测日的实际负荷值,?y i为模型预测值,

n为预测的天数.

3.1EUNITE竞赛的电力峰值负荷预报实验

实验选取欧洲EUNITE网络组织的中期负荷预

测竞赛提供的电力负荷实际数据集[11],目标是预测未

来31天内,即1999年1月的每日最大电力负荷值,称

为每日峰值负荷.为了弥补气象因素的影响,以数据

分割的方式选取1997年1月~3月、1997年10月~

1998年3月、1998年10月~12月冬季时间段的历史

负荷数据作为训练数据集.电力负荷值的实际时间

序列数据的嵌入维取为7,结合日历信息和节假日

信息,日历信息用七位二进制编码表示,节假日信息

用一位二进制编码表示,模型的输入为15维,这与

文献[4]一致.文献[4]的结果是其作者用自己开发的

LIBSVM软件获得,且赢得当年EUNITE竞赛第一名.

实验中,通过交叉验证的方法选取高斯核函数

的超参数σ=2,m固定为全部训练数据集数目的

20%(m=0.2l).在GKPCR方法中,非线性主元为25,

GKRR方法中,正则化参数?=1e?2时,可获取较优

的实验结果.为了衡量本文方法的预测效果,在相同

条件下,将GKPCR、GKRR、GKPCA结合具有线性核

函数的SVM与其他方法构建的预测模型进行比较.

不同方法的预测结果评价由表1列出.

表1GKPCR、GKRR与其他方法的预测结果对比

预测方法MAPE ME/MW

SVM(C=4096,ε=0.5) 1.937948.2314

PCA+ε-SVM(C=100,ε=0.5) 2.028639.6708

KPCA+ε-SVM(C=4096,ε=0.5) 1.776549.7107

GKPCA+ε-SVM(C=4096,ε=0.5) 1.658741.6387

KPCR 1.698641.9692

EM-KPCR 1.698241.9748

KPLS 1.843748.6298

GKPCR 1.597738.7117

正则化的RBF网络 1.951947.6401

KRR 1.738846.5784

GKRR 1.570539.9190

在PCA结合具有高斯核函数的标准SVM方法

中,主元选为10.在KPCA结合具有线性核函数的

SVM、KPCR、EM-KPCR方法中,非线性主元均取为

25.KRR的正则化参数?=1e-2.在KPLS方法中,

提取主元是对输入和输出同时进行的,其主元数目

取为5.PCA、KPCA、GKPCA结合SVM构建的多层

SVM中,标准ε-SVM算法的实现使用LIBSVM软件

完成.正则化RBF网络方法中,RBF的聚类中心取

为9,正则化参数为1e-4,使用共轭梯度算法优化20

次作为算法的停止条件,它是文献[12]的延伸.由表1

第9期

李军:基于贪心核特征提取方法的中期峰值负荷预测

1665

可见,GKPCR 与GKRR 方法的MAPE 值最低,与其他方法相比,贪心核特征提取建模方法的预测精度显著提高.

图1给出了待预测日的实际电力负荷峰值和m

=0.2l 时,GKPCR 、GKRR 、GKPCA 结合SVM 与其他

方法(包括文献[4]的SVM 预测输出)峰值预测结果的比较.由图1可见,所提出的贪心核特征提取建模方法具有明显的预测效果.

0102030

/d

/M W

SVM

PCA+SVM KPCA+SVM GKPCA+SVM KPCR KPLS EM-KPCR RBF GKPCR KRR GKRR

图1日峰值负荷预测结果的比较

不同预测方法对未来31天的滚动预测相对误差(RE)如图2所示.由图2可见,基于贪心核特征提取建模的电力负荷中期预测方法相对误差波动较小,能够取得很好的预测效果.

10

20

30

/d

SVM

PCA+SVM KPCA+SVM GKPCA+SVM KPCR KPLS EM-KPCR RBF GKPCR KRR GKRR

-R E

图2日峰值负荷预测相对误差的结果比较

3.2新英格地区中期电力峰值负荷实验

实验数据取自美国新英格兰地区2004~2005年期间每隔1小时的负荷数据集.目标是预测未来21天内,即2006年5月1~21日期间的每日电力负荷峰值.采用数据分割方法选取2004年4~5月、2005年4~5月和2006年4月数据为训练数据.预测模型的输入包括过去一周的历史负荷峰值和节假日、日历信息,仍为15维,以多步迭代预测方式进行.实验中,由交叉验证法取核参数σ=5,基向量m 固定为训练数据的20%(m =0.2l ),GKPCR 中非线性主元为18.

GKRR 中,正则化参数?=1e -3时,可获取较优的实验结果.

为了评价预测效果,在相同条件下,将GKPCR 、GKRR 、GKPCA 结合具有线性核函数的SVM 与其他预测模型进行比较.不同方法的预测结果评价由表2给出.在PCA 结合SVM 方法中,主元选为5.在KPCA

结合SVM 、KPCR 、EM-KPCR 方法中,非线性主元均取为18.KRR 的正则化参数?=1e -3.KPLS 方法中的主元数目取为5,可获得较好的预测效果.SVM 算法的实现使用LIBSVM 软件完成,正则化RBF 网络中的聚类中心为9,正则化参数为1e -2,使用共轭梯度算法优化20次作为算法的停止条件.由表2可见,GKPCR 与GKRR 方法的MAPE 值、ME 值均较低,与其他方法相比,贪心核特征提取建模方法的预测精度显著提高.

表2

GKPCR 、GKRR 与其他方法的预测结果对比

预测方法

MAPE ME /MW SVM (C =100,ε=0.5) 1.7745778.7586PCA +ε-SVM (C =100,ε=0.5) 1.3542618.3577KPCA +ε-SVM (C =100,ε=0.5) 1.3185502.9616GKPCA +ε-SVM (C =100,ε=0.5) 1.3484518.3415KPCR 1.2953454.9888EM-KPCR 1.3143414.0364KPLS 1.7154592.9801GKPCR

1.2429411.5246正则化的RBF 网络 1.3712485.0001KRR 1.2817507.9621GKRR

1.2631

422.7857

图3给出了待预测日的实际电力负荷峰值和m

=0.2l 时,GKPCR 、GKRR 、GKPCA 结合SVM 与其他

方法(包括文献[4]方法的SVM 预测输出)峰值预测结果比较.由图3可见,所提出的贪心核特征提取建模方法具有明显的预测效果.

/d

SVM

PCA+SVM KPCA+SVM GKPCA+SVM KPCR KPLS EM-KPCR RBF GKPCR KRR GKRR

26

1014

18

/10M W

4图3日峰值负荷预测结果的比较

不同预测方法对未来21天的滚动预测相对误差(RE)如图4所示.由图4可见,基于贪心核特征提取建模的电力负荷中期预测方法相对误差波动较小,能够取得很好的预测效果.

SVM

PCA+SVM KPCA+SVM GKPCA+SVM KPCR KPLS EM-KPCR RBF GKPCR KRR GKRR

/d

2

6

1014

18

00.02

0.04-0.02-0.04

R E

图4日峰值负荷预测相对误差结果比较

1666控制与决策第29卷

在实验中,基向量的数目m固定为全部训练数据集的50%(m=0.5l)以下时,贪心核特征提取建模方法均可取得较好的预测效果,这表明本文方法的鲁棒性也较好.m的取值通常为数据集的25%左右,且随着m的增大,算法的训练时间也会加长.

4结论

针对实际的电力负荷预测,提出了基于贪心核特征提取建模的GKPCR和GKRR方法.GKPCR和GKRR方法通过贪心核逼近算法获取新的低维正交基向量构成的数据子集,以尽可能小的最小均方重构误差逼近训练数据集,而且使得投影函数的复杂性最小化.贪心核特征提取建模方法通过控制非线性主元的数目或正则化参数,抓住了数据的本质特征,提高了模型的推广性.GKPCR和GKRR方法是KPCR和KRR方法的进一步延伸,能克服由于数据集增大而引起的核矩阵计算困难和内存不足的缺点,适应于大数据集的在线学习.最后通过不同地区的中期电力负荷峰值预测实例,验证了所提出方法的有效性.

参考文献(References)

[1]杜杰,徐立中,曹一家,等.短期负荷预测V olterra滤波器

模型[J].控制与决策,2009,24(12):1903-1908.

(Du J,Xu L Z,Cao Y J,et al.Short-term load forecasting model based on V olterra?lter[J].Control and Decision, 2009,24(12):1903-1908.)

[2]Ghiassia M,Zimbrab D K,Saidane H.Medium term

system load forecasting with a dynamic arti?cial neural network model[J].Electric Power Systems Research,2006, 76(5):302-316.

[3]Elattar E E,Goulermas J Y,Wu Q H.Electric load

fore-casting based on locally weighted support vector

regression[J].IEEE Trans on SMC,2010,40(4):438-447.

[4]Chen B J,Chang M W,Lin C J.Load forcasting using

support vector machines:A study on eunite competition 2001[J].IEEE Trans on Power Load Systems,2004,19(4): 1821-1830.

[5]Saunders C,Gammerman A,V olk V.Ridge regression

algorithm in dual variables[C].Proc of the15th Int Conf on Machine Learning.Madison-Wisconsin:Morgan Kaufmann Publishers,1998:515-521.

[6]Scholkopf B,Smola A,Muller K.Nonlinear component

analysis as a kernel eigenvalue problem[J].Neural Computation,1998,10(5):1299-1319.

[7]Rosipal R.Kernel partial least squares for nnlinear

regression and discrimination[J].Neural Network World, 2003,13(3):291-300.

[8]Rosipal R,Girolami M.An expectation-maximization

approach to nonlinear component analysis[J].Neural Computation,2001,13(3):505-510.

[9]Franc V,Hlavac V.Greedy algorithm for a training set

reduction in the kernel methods[C].Proc of Computer Analysis of Images and Patterns.Berlin:Springer,2003: 426-433.

[10]Franc V.Optimization algorithms for kernel methods[D].

Prague:Department of Cybernetics,Czech Technical University,2005.

[11]Sincak P.World-wide competition within the EUNITE

network[EB/OL].(2001-08-05)[2012-11-06].http:// neuron.tuke.sk/competition/index.php.

[12]Moody J,Darken C.Fasting learning in networks of

locally-tuned processing units[J].Neural Computation, 1989,1(2):281-294.

(责任编辑:郑晓蕾)

基于MATLAB的点特征提取

基于MATLAB点特征提取实习报告 一、实习内容与目的 理解影像中每个像素灰度值的概念;理解点特征在灰度方面的特点;掌握常用的点特征提取算子及其对应的点特征提取方法,例如Harris算子。 利用MATLAB软件分析任意一种应用于数字图像处理中的边缘检测算子,研究它的提取方法以及实现提取特征点。 二、实习原理 基本思想:从图像局部的小窗口观察图像特征。 角点定义:窗口向任意方向的移动都导致图像灰度的明显变化。

Harris角点检测:数学描述 将图像窗口平移[u,v]产生灰度变化E[u,v] 由: 得到: 于是对于局部微小的移动量[u,v],可以近似得到下面的表达: 其中,M是2*2矩阵,可由图像的导数求得: 窗口移动导致的图像变化:实对称矩阵的特征值分析 其中,的特征值M的特征值λmax、λmin。

定义角点响应函数:R 其中 Harris角点检测结果如下图所示: 三、实习步骤及相关代码 filename='yuantu2.jpg'; X=imread(filename);%读取图像 %imshow(X); Info=imfinfo(filename);%获取图像相关信息 if(Info.BitDepth>8)

f=rgb2gray(X); end %《基于特征点的图像配准与拼接技术研究》 %计算图像亮度f(x,y)在点(x,y)处的梯度----------------------------------------------- %fx=[50-5;80-8;50-5];%高斯函数一阶微分,x方向(用于改进的Harris角点提取算法) ori_im=double(f)/255;%unit8转化为64为双精度double64 fx=[-2-1012];%x方向梯度算子(用于Harris角点提取算法) Ix=filter2(fx,ori_im);%x方向滤波 %fy=[585;000;-5-8-5];%高斯函数一阶微分,y方向(用于改进的Harris角点提取算法) fy=[-2;-1;0;1;2];%y方向梯度算子(用于Harris角点提取算法) Iy=filter2(fy,ori_im);%y方向滤波 %构造自相关矩阵--------------------------------------------------------------- Ix2=Ix.^2; Iy2=Iy.^2; Ixy=Ix.*Iy; clearIx; clearIy; h=fspecial('gaussian',[77],2);%产生7*7的高斯窗函数,sigma=2 Ix2=filter2(h,Ix2); Iy2=filter2(h,Iy2); Ixy=filter2(h,Ixy); %提取特征点--------------------------------------------------------------- height=size(ori_im,1); width=size(ori_im,2); result=zeros(height,width);%纪录角点位置,角点处值为1 R=zeros(height,width); Rmax=0;%图像中最大的R值 k=0.06;%k为常系数,经验取值范围为0.04~0.06 fori=1:height forj=1:width M=[Ix2(i,j)Ixy(i,j);Ixy(i,j)Iy2(i,j)];%autocorrelationmatrix R(i,j)=det(M)-k*(trace(M))^2;%计算R ifR(i,j)>Rmax Rmax=R(i,j); end;

电力负荷预测方法与应用

电力负荷预测方法与应用 一、概述 电力工业是国民经济的基础工业。随着我国产业结构完善和人民整体生活水平的改善,对电能的需求逐年加大,同时对电力质量的要求也越来越高,且由于电能生产和消费的同时性,对电网建设和布局提出了更高的要求。 电力负荷预测是电网规划建设的依据和基础。随着电力工业在国民经济中扮演着越来越重要的角色,电力负荷的正确预测显得尤为重要。 电力负荷预测是指通过对电力系统负荷历史数据的分析和研究,运用统计学、数学、计算机、工程技术及经验分析等定性定量的方法,探索事物之间的内在联系和发展变化规律,对未来的负荷发展做出预先估计和推测。电力负荷预测结果的准确与否直接关系到电力投资的效益,供电的可靠性,用电需求的正常发展,以及社会的经济效益和社会效益。但要做到预测准确或较准确是很困难的,因为影响电力负荷预测的因素相当多,且由于各地区产业结构和人民生活水平不同,各具体因素对电力负荷预测的敏感度是不一样的,因而电力负荷预测具模糊性。 回顾我国“十五”期间的预测情况与实际发展情况是很有意义的。 基于“九五”期间国民经济和电力工业的发展状况,在全国电力供需趋于平衡的前提下,我国制定的“十五”规划对电力工业发展提出了“可持续发展”的要求:电力工业发展方式要从数量速度型向质量效益型转变,从以供给导向为主转向以需求导向为主,优化电力资源配置。国家经贸委电力工业“十五”规划中预测:“十五”期间我国经济增长速度为年均7%左右,电力需求的平均增长速度为5%,到2005年全国发电装机容量将达到3.9亿千瓦,全国发电量将达到17500亿千瓦时以上。国家电力公司电力工业“十五”计划及2015年远景规划中预测:“十五”期间我国GDP年均增长7%左右,电力需求的平均增长速度在4.5%~5.0%之间,到2005年全国发电装机容量将达到3.65亿千瓦,全社会用电量将达到16200亿~16600亿千瓦时。 但实际的情况是:截至2005年年底,全国发电装机容量达到5.17亿千瓦,全国发电量达到24975.26亿千瓦时,全社会用电量为24689亿千瓦时。 比较我国“十五”期间电力工业发展中发电装机容量、发电量与全社会用电量等参数的预测值与实际值,可以发现我国“十五”电力规划中全国发电装机容量、发电量和全社会用电量的误差分别高达33%、43%和50%,这还是在2002年下半年至2005年间严重限电情况下发生的值,实际的电力需求值比这还高很多,也即误差比这还要高的多。这直接导致了自2002年6月以来的全国电力供需严重紧缺状态,直至“十五”末期电力供需形势总体来说仍然处于紧张状态,2005年曾在一季度拉闸限电省份达创纪录的26个,最大限负荷达3400万千瓦。而“十五”期间的严重缺电,不仅成为影响国民经济快速发展的“瓶颈”,其隐性损失更是不可估量:

电力负荷预测方法

1.负荷预测分类和基础数据处理 1.1负荷预测及其分类 1.1.1负荷预测概念 负荷预测是根据负荷的历史数据及其相关影响因素,分析负荷的变化规律,综合考虑影响负荷变化的原因,使用一定的预测模型和方法,以未来经济形势、社会发展、气候条件、气象因素等预测结果为依据,估计未来某时段的负荷数值过程。 1.1.2负荷预测的分类 按照预测方法的参考体系,工程上的负荷预测方法可分为确定性预测方法、不确定预测方法、空间负荷预测法。 确定性:把电力负荷预测用一个或一组方程来描述,电力负荷与变量之间有明确的一一对应关系。 不确定性:实际电力负荷发展变化规律非常复杂,受到很多因素影响,这种影响关系是一种对应和相关关系,不能用简单的显示数学方程描述,为解决这一问题,产生了一类基于类比对应等关系进行推测预测负荷的不度额定预测方法。 空间负荷预测:确定和不确定负荷预测是对负荷总量的预测。空间负荷预测是对负荷空间分布的预测,揭示负荷的地理分布情况。

1.2负荷预测的基础数据处理 1.2.1负荷预测的基础数据 基础数据大致包括四类,分别为:①负荷数据(系统、区域、母线、行业、大用户的历史数据;负荷控制数据;系统、区域、大用户等的最大利用小时数;发电厂厂用电率和网损率。)②气象数据(整点天气预报;整点气象要素资料;年度气温、降水等气象材料。)③经济数据和人口(区域产业GDP;城乡可支配收入;大用户产量、产值和单耗;电价结构和电价政策调整;城乡人口。)④其他时间(特殊时间如大型会议、自然灾害;行政区域调整) 1.2.2数据处理 为获得较好的预测效果,用于预测数据的合理性得到充分保证,因此需要对历史数据进行合理性分析,去伪存真。最基本要求是:排除由于人为因素带来的错误以及由于统计口径不同带来的误差。另外,尽量减少异常数据(历史上突发事件或由于某些特殊原因会对统计数据带来宠大影响)带来的不良影响。常见的数据处理方法有:数据不全、数据集成、数据变换和数据规约等。 2.确定性负荷预测方法 2.1经验技术预测方法 2.1.1专家预测法 专家预测发分为专家会议发和专家小组法。会议发通过召集专家开会,面对

特征提取方法

4.2.2 特征提取方法 图像经过一系列的预处理之后,原来大小不同、分布不规则的各个字符变成了一个个大小相同、排列整齐的字符。下面接要从被分割归一处理完毕的字符中,提取最能体现这个字符特点的特征向量。将提取出训练样本中的特征向量代入BP网络之中就可以对网络进行训练,提取出待识别的样本中的特征向量代入到训练好的BP网络中,就可以对汉字进行识别。 特征向量的提取方法多种多样,可以分为基于结构特征的方法和基于像素分布特征的方法,下面给予简单介绍,并说明本文所用的方法。 (1)结构特征。结构特征充分利用了字符本身的特点,由于车牌字符通常都是较规范的印刷体,因此可以较容易地从字符图像上得到它的字符笔画信息,并可根据这些信息来判别字符。例如,汉字的笔画可以简化为4类:横、竖、左斜和右斜。根据长度不同又可分为长横、短横、长竖和短竖等。将汉字分块,并提取每一块的笔画特征,就可得到一个关于笔画的矩阵,以此作为特征来识别汉字。 (2)像素分布特征。像素分布特征的提取方法很多,常见的有水平、垂直投影的特征,微结构特征和周边特征等。水平、垂直投影的特征是计算字符图像在水平和垂直方向上像素值的多少,以此作为特征。微结构法将图像分为几个小块,统计每个小块的像素分布。周边特征则计算从边界到字符的距离。优点是排除了尺寸、方向变化带来的干扰,缺点是当字符出现笔划融合、断裂、部分缺失时不适用。 ①逐像素特征提取法 这是一种最简单的特征提取方法。它可以对图像进行逐行逐列的扫描,当遇到黑色像素时取其特征值为1,遇到白色像素时取其特征值为0,这样当扫描结束后就获得一个维数与图像中的像素点的个数相同的特征向量矩阵。 这种特征提取方法的特点就是算法简单,运算速度快,可以使BP网络很快的收敛,训练效果好,更重要的是对于数字图像这样特征较少的图像,这种方法提取的信息量最大,所以对于本系统来说,这种方法较为适用。但是它的缺点也很明显,就是适应性不强,所以本文没有选用这种方法。 ②骨架特征提取法

实验一 点特征提取

实验一点特征提取 一、实验目的 1、理解点特征提取的基本概念; 2、熟悉进行点特征提取的基本方法; 3、掌握用MATLAB语言进行点特征提取的方法。 二、实验原理 特征主要指明显点,如角点、圆点等。提取点特征的算子称为兴趣算子或有利算子,即运用某种算法从影像中提取我们所感兴趣的,即有利于某种目的的点。本次试验使用Moravex算子进行点特征提取。 Moravex算子于1977年提出利用灰度方差提取点特征的算子,其特点是在四个主要方向上选择具有最大---最小灰度方差的点作为特征点。其基本步骤为: 1、计算各像元的兴趣值IV(interest value)。在以像素(c ,r)为中心的w×w的影像窗口中,计算四个方向相邻像素灰度差的平方和; 2、给定一定的阈值,将兴趣值大于该阈值的点作为候选点。阈值的选择应以候选点中包括所需要的特征点,而又不包括过多的非特征点为原则; 3、选取候选点中的极值点作为特征点。在一定大小窗口内,将

候选点中不是最大者均去掉,留下一个兴趣值最大者,该像素即为一个特征点。 三、实验要求 1、读取MATLAB图像处理工具箱中提供的p13.jpg这幅图像, 并显示。 2、用Moravex算子对图像进行点特征提取 四、运行结果 原图:

提取点特征之后的图像: 五、源程序代码 % clear all % close all % clc tic I=imread('p13.jpg'); originalmap=I; %calculate every pixel's IV(Interest value) %divide image I by w*w w=5; %divide to m*n m=floor(size(I,1)/w); %rows,round n=floor(size(I,2)/w); %columns

基于相关性的组合预测方法研究

Vol_21.No2 预测 FORECAS’llNG2002年第2期基于相关性的组合预测方法研究 王应明 (厦门大学管理学院,福建厦门361005) 摘要:本文对组合亍贞刹方法进行研究,提出了四种基于相关一胜的组合预测方法,即:关联度极大化组音预羽4方法,相关系数极大化组音预测方法,夹角余弦极太化组夸预测方法,Theil不等系数极小化组合预测方法。四种基于相关性的组合预羽4方法均能够取得比较好的蛆告预测效果。 关键词:组合预测;灰关联度;相关系数;夹角余弦;’I'heil不等系数 中图分类号:0221.1文献标识码:A文章编号:1003.5192-C2002}02.0058.05 ResearchontheMethodsofCombiningForecastsBasedonCorrelativity WANGYing—ming (Schcrdof^缸"“M㈣£.XiamenUnizersity,Xiarnen361005,China) Abstract:ThispSI’erstudiesthemethodologyofcombiningforecasts.Fournewmethodsarepropped.whicharemaxi—mHITtgreycorrelationdegreemethod,m8xjmLJmcorrelationcoefficientandincludedanglemsinemethodsaswellasmmimumThei】coefficientmethodAtIthcrrtethodscan】ead"tOsatisfactoryforecastingre.suits Keywolds:combiningfomzasts;greymrrelationdegree;correlolioncoefficient;includedanglecosine;Theilinefficient 1引言 组台预测由于比单方法预测更有效、能提高模型的拟舍精度和预测能力,因此,自从1969年问世以来,一直是国内外预测界研究的热点课题,并在世界各国范围内得到广泛应用。综观国内外研究现状可以发现,现有的组台预测方法都是基于直接改善某种拟合误差角度提出来的。笔者认为,这不是研究组合预测方法的唯一途径、也未必就是娃佳途径。另外,根据预测惯例,预测效果的评价至少可以从平方和洪差(SSE)、平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)、均方百分比误差(MSPE)等五个方面进行全方位的综合衡量,任何一种仅以其中某个误差指标为最优进行组合预测的方法都不是很全面的,因此,有必要研究新的组台预测方法以便能使各种误差指标皆得到不同程度的的改善。本文拟从相关性指标(如关联度、相关系数、夹角余弦、Theil不等系数等)的角度进行组台预测方法的研究。新的预测方法不直接考虑预洲误差的大小,与传统的组合预测方法有较大的差别。 收稿日期:2000—11—18 基金项目:霍英东教育基金会资助项目(71080) 58?2相关性组合预测原理殛参数估计 设某预测问题在梨一时段的实际值为Y,(t=1,2,…,”),对此预测问题有m种可行的预测方妆,其预测值或模型拟台值分别为^(沪l,2,…,,z;j=1,2,…,m)。又设"z种预测方法的组合权向量为W=(wl,w2,…,W,,,.)’,且满足归一化约束条件和非负约束条件 P1W=l(1) w≥O(2)其中eT=(1,l,…,1)。根据组合预测原理,我们可以有三种不同的组合方式,即:算术5F均组合、几何平均组合、调和平均组合,其组合公式分别为三 bW葶o。 负=正卜=∑w五,£=1,2,…,n(3)∑%’1 ,薯I!?肺m∥:Ⅱ彤卜1“2..,” (4)

图像中角点(特征点)提取与匹配算法

角点提取与匹配算法实验报告 1 说明 本文实验的目标是对于两幅相似的图像,通过角点检测算法,进而找出这两幅图像的共同点,从而可以把这两幅图像合并成一幅图像。 下面描述该实验的基本步骤: 1.本文所采用的角点检测算法是Harris 角点检测算法,该算法的基本原理是取以目标像素点为中心的一个小窗口,计算窗口沿任何方向移动后的灰度变化,并用解析形式表达。设以像素点(x,y)为中心的小窗口在X 方向上移动u ,y 方向上移动v ,Harris 给出了灰度变化度量的解析表达式: 2 ,,|,|,,()(x y x y x u y v x y x y I I E w I I w u v o X Y ??= -=++??∑∑ (1) 其中,,x y E 为窗口内的灰度变化度量;,x y w 为窗口函数,一般定义为2 2 2 ()/,x y x y w e σ +=; I 为图像灰度函数,略去无穷小项有: 222222 ,,[()()2]2x y x y x y x y E w u I v I uvI I Au Cuv Bv = ++=++∑ (2) 将,x y E 化为二次型有: ,[]x y u E u v M v ?? =???? (3) M 为实对称矩阵: 2 ,2 x y x x y x y y I I I M w I I I ???= ???????∑ (4) 通过对角化处理得到: 11 ,200x y E R R λλ-??= ??? (5) 其中,R 为旋转因子,对角化处理后并不改变以u,v 为坐标参数的空间曲面的形状,其特征值反应了两个主轴方向的图像表面曲率。当两个特征值均较小时,表明目标点附近区域为“平坦区域”;特征值一大一小时,表明特征点位于“边缘”上;只有当两个特征值均比较大时,沿任何方向的移动均将导致灰度的剧烈变化。Harris 的角点响应函数(CRF)表达式由此而得到: 2 (,)det()(())C RF x y M k trace M =- (6)

负荷预测方法一

1、单耗法 这个方法是根据预测期的产品产量(或产值)和用电单耗计算需要的用电量,即 A h =∑=n i 1Q i U i 式中 A h —某行业预测期的需电量; U i —各种产品(产值)用电单耗; Q i —各种产品产量(或产值)。 当分别算出各行业的需用电量之后,把它们相加,就可以得到全部行业的需用电量。这个方法适用于工业比重大的系统。对于中近期负荷预测(中期负荷预测的前5年),此时,用户已有生产或建设计划,根据我国的多年经验,用单耗法是有效的。 在已知某规划年的需电量后,可用年最大负荷利用小时数来预测年最大负荷,即 P n·max =T A n m ax 式中 P n·max —年最大负荷(MW ); A n —年需用电量(k W·h ); T max —年最大负荷利用小时数(h )。 各电力系统的年最大负荷利用小时数,可根据历史统计资料及今后用电结构变化情况分析确定。 单耗法分产品单耗法和产值单耗法。采用单耗法预测负荷的关键是确定适当的产品单耗或产值单耗。 单耗法可用于计算工业用户的负荷预测。 单耗法可根据第一、第二、第三产业单位用电量创造的经济价值,从预测经济指标推算用电需求量,加上居民生活用电量,构成全社会用电量。预测时,通过对过去的单位产值耗电量(以下简称“单耗”) 进行统计分析,并结合产业结构调整,找出一定的规律,预测规划第一、第二、第三产业的综合单耗,然后根据国民经济和社会发展规划指标,按单耗进行预测。单耗法需要做大量细致的统计、分析工作,近期预测效果较佳。 单耗法的优点是方法简单,对短期负荷预测效果较好。缺点是需做大量细致的调研工作,比较笼统,很难反映现代经济、政治、气候等条件的影响。

电力负荷预测方法

1.负荷预测分类和基础数据处理 负荷预测及其分类 负荷预测概念 负荷预测是根据负荷的历史数据及其相关影响因素,分析负荷的变化规律,综合考虑影响负荷变化的原因,使用一定的预测模型和方法,以未来经济形势、社会发展、气候条件、气象因素等预测结果为依据,估计未来某时段的负荷数值过程。 负荷预测的分类 按照预测方法的参考体系,工程上的负荷预测方法可分为确定性预测方法、不确定预测方法、空间负荷预测法。 确定性:把电力负荷预测用一个或一组方程来描述,电力负荷与变量之间有明确的一一对应关系。 不确定性:实际电力负荷发展变化规律非常复杂,受到很多因素影响,这种影响关系是一种对应和相关关系,不能用简单的显示数学方程描述,为解决这一问题,产生了一类基于类比对应等关系进行推测预测负荷的不度额定预测方法。 空间负荷预测:确定和不确定负荷预测是对负荷总量的预测。空间负荷预测是对负荷空间分布的预测,揭示负荷的地理分布情况。 负荷预测的基础数据处理 负荷预测的基础数据 基础数据大致包括四类,分别为:①负荷数据(系统、区域、母线、行业、大用户的历史数据;负荷控制数据;系统、区域、大用户等的最大利用小时数;发电厂厂用电率和网损率。)②气象数据(整点天气预报;整点气象要素资料;年度气温、降水等气象材料。)③经济数据和人口(区域产业GDP;城乡可支配收入;大用户产量、产值和单耗;电价结构和电价政策调整;城乡人口。)④其他时间(特殊时间如大型会议、自然灾害;行政区域调整)

数据处理 为获得较好的预测效果,用于预测数据的合理性得到充分保证,因此需要对历史数据进行合理性分析,去伪存真。最基本要求是:排除由于人为因素带来的错误以及由于统计口径不同带来的误差。另外,尽量减少异常数据(历史上突发事件或由于某些特殊原因会对统计数据带来宠大影响)带来的不良影响。常见的数据处理方法有:数据不全、数据集成、数据变换和数据规约等。 2.确定性负荷预测方法 经验技术预测方法 专家预测法 专家预测发分为专家会议发和专家小组法。会议发通过召集专家开会,面对面讨论问题,每个专家充分发表意见,并听取其他专家意见。小组法以书面形式独立发表个人见解,专家之间相互保密,最后综合给出预测结果。 类比法 类比法是将类似失误进行分析对比,通过已知事物对未知事物做出预测。例如选取国内外类似城市或地区为类比对象,参考该对象的发展轨迹对本地区作出预测。 主观概率发 请若干专家来估计某特定时间发生的主观概率,然后综合得出该时间的概率。 经典技术预测方法 单耗法 通过某一工业产品的平均单位产皮用电量以及该产品的产量,得到生产这种产品的总用电量。 用电量A=国民生产总之或工农业总产值b*产值单耗g

模式识别特征选择与提取

模式识别特征选择与提取 中国矿业大学计算机科学与技术学院电子信息科学系 班级:信科11-1班,学号:08113545,姓名:褚钰博 联系方法(QQ或手机):390345438,e-mail:390345438@https://www.360docs.net/doc/a1167384.html, 日期:2014 年06月10日 摘要 实际问题中常常需要维数约简,如人脸识别、图像检索等。而特征选择和特征提取是两种最常用的维数约简方法。特征选择是从某些事物中提取出本质性的功能、应用、优势等,而特征提取是对特征空间进行变换,将原始特征空间映射到低维空间中。 本文是对主成分分析和线性判别分析。 关键词:特征选择,特征提取,主成分分析,线性判别分析 1.引言 模式识别的主要任务是利用从样本中提取的特征,并将样本划分为相应的模式类别,获得好的分类性能。而分类方法与分类器设计,都是在d(变量统一用斜体)维特征空间已经确定的前提下进行的。因此讨论的分类器设计问题是一个选择什么准则、使用什么方法,将已确定的d维特征空间划分成决策域的问题。对分类器设计方法的研究固然重要,但如何确定合适的特征空间是设计模式识别系统另一个十分重要,甚至更为关键的问题。如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。本文要讨论的问题就是特征空间如何设计的问题。 基于主成分分析的特征选择算法的思想是建立在这样的基础上的:主成分分析方法将原始特征通过线性变换映射到新的低维空间时,获得的主成分是去了新的物理意义,难以理解,并且主成分是所有原始特征的线性组合。所以将主成分分析与特征选择相结合,设计多种相似性度量准则,通过找到与主成分相关的关键特征或者删除冗余、不相关以及没有意义的特征,将主成分又重新映射到原始空间,来理解成主成分的实际意义。 基于线性判别分析的高维特征选择将单个特征的Fisher准则与其他特征选择算法相结合,分层消除不相关特征与冗余特征。不相关特征滤波器按照每个特征的Fisher评价值进行特征排序,来去除噪音和不相关特征。通过对高维数据特征关联性的分析,冗余特征滤波器选用冗余度量方法和基于相关性的快速过滤器算法。分别在不同情境下进行数据分类实验,验证其性能。

组合预测模型

组合预测模型 1灰色神经网络(GNN)预测模型 灰色神经网络预测方法是灰色预测方法和人工神经网络方法相结合的算法,即保留灰色预测方法中“累加生成” 和“累减还原” 运算,不再求参数,而是由BP神经网络来建立预测模型和求解模型参数。 利用这种灰色神经网络进行负荷预测的算法如下。 1)对电力负荷的原始数据序列进行“累加生成”运算,得到累加序列。 2)利用BP神经网络能够拟合任意函数的优势解决累加序列并非指数规律的问题。训练BP神经网络,逼近累加数据序列Y。 3)利用现有已经训练好的BP神经网络进行预测,输出累加序列的预测值。 4)将累加数据的预测值进行“累减还原”运算,得到电力负荷的原始数据序列预测值。 2果蝇优化算法(FOA) 果蝇优化算法(fruit fly optimization algorithm,FOA)是由潘文超教授于2011年提出的一种基于果蝇觅食行为推演出寻求全局优化的新方法。这是一种交互式进化计算方法,通过模仿果蝇群体发现食物的行为,FOA能够达到全局最优。在实际中FOA已经被应用于许多领域,包括交通事件,外贸出口预测,模拟滤波器的设计等。依照果蝇搜寻食物的特性,将其归纳为以下几个重要步骤。 1)参数初始化:FOA的主要参数为最大迭代次数maxgen,种群规模sizepop,初始果蝇群的位置(X_axis,Y_axis)和随机飞行距离FR。 2)种群初始化:赋予果蝇个体利用嗅觉搜寻食物之随机方向与距离。

3)种群评价:首先,由于无法得知食物的位置,需要计算果蝇到原点的距离(Dist)。再计算气味浓度判定值(S)此值为距离的倒数。通过将气味浓度判断值(S)代入气味浓度判断函数(或称为适应度函数),求出果蝇个体位置的气味浓度(Smell)。并找出群体中气味浓度值最大的果蝇个体。 4)选择操作:保留最大气味浓度值和x、y坐标,此时,果蝇通过视觉飞往的最大浓度值的位置。进入迭代寻优,重复实施步骤2)~3),并判断味道浓度是否优于前一迭代味道浓度,若是则执行步骤4)。若味道浓度不再优于先前迭代的味道浓度值,或迭代次数达到最大,循环结束。 3GNN-FOA预测模型 GNN-FOA预测模型的程序结构框图如图1所示。采用果蝇优化算法(FOA)为灰色神经网络(GNN)模型参数a,b1和b2 进行迭代动态微调,使模型侦测能力提高,并获得最佳的GNN模型参数以进行预测。详情如下。 1)参数初始化。在果蝇优化算法的参数设定上,随机初始化果蝇群体位置区间X_axis,Y_axis∈[-50,50],迭代的果蝇寻食的随机飞行距离区间FR ∈[-10,10] ,种群规模sizepop = 20 ,而迭代次数max gen = 100 。 2)初始进化。设置初始迭代次数为0,设定果蝇个体i 寻食随机飞行方向rand()和飞行距离。其中rand()表示任意值产生函数。在GNN-FOA程序中,使用两个变量 [X(i,:),Y(i,:)] 来描述果蝇个体i 的飞行距离。分别设 3)初步计算和数据预处理。计算果蝇个体i距离原点的距离Disti 和气味浓度判断值Si。其中

电力负荷预测方法

电力负荷预测方法 发表时间:2018-08-02T15:26:39.817Z 来源:《电力设备》2018年第11期作者:刘自伟[导读] 摘要:电力设施是国家的基础设施,是国家经济发展不可缺少的基础条件。(韶关新丰供电局广东新丰 511100) 摘要:电力设施是国家的基础设施,是国家经济发展不可缺少的基础条件。随着经济的不断发展,珠三角的产业转移的趋势,电力设施配套建设已成为地区经济发展的关键。准确的电力负荷预测为电网规划提供强有力的依据,不仅可以获得巨大的社会效益,也可以获得巨大的经济效益。 关键词:电网规划;负荷预测;预测方法 1 序言 近年来,新丰经济的不断发展,珠三角的产业转移。为承接好珠三角产业转移,做好电力先行,准确地进行负荷预测十分重要。 2 负荷预测 电网规划很重要的一步就是电网负荷预测,电网负荷预测是安排电网基本建设项目的依据,确定了规划时期内的负荷水平也就确定了电力发展的速度;中、长负荷预测用来初步电源规划,而近期预测用来进一步确定变电站的容量。负荷预测是从已知的经济、社会发展和电力需求情况出发,通过对历史数据的分析和研究,对电力需求作出预先的估计和推测。根据这些预测结果,可以针对性地采取技术措施,如进行可中断负荷控制,增添低谷用电设备、采用蓄冷蓄热技术等,改变电力需求在时序上的分布,将用户的电力需求从电网高峰消减、转移或增加电网低谷期的用电以期提高系统运行的经济性和可靠性,在规划的电力网中还可以减少新增装机容量和节省电力建设投资,从而降低预期的供电成本。负荷预测的方法很多,主要有:综合产值单耗法、弹性系数法、时间序列法、参数回归法、比例系数增长法和经济模型预测法。 3 方法简介 3.1原始资料 3.1.1某县配电网装变容量 至2010年4月底,该县建有高压变电站4座,其中110kV变电站3座、200kV变电站1座:110kV变电总容量为430MV A。200kV变电总容量为360MV A,高压变电站总容量合计790MV A。 表1 某县高压变电站统计表 3.2 综合产值单耗法 3.2.1综合产值单耗法 单耗法是根据第一、二、三产业每单位用电量创造的经济价值,从预测经济指标推算用电需求量,加上居民生活用电量,构成全社会用电量。预测时,通过对过去的单位产值耗电量进行统计分析,并结合产业结构调整,找出一定的规律,预测规划期的一、二、三产业的综合单耗,然后按国民经济和社会发展规划的指标,按单耗进行预测。单耗法需要做大量细致的统计、分析工作,近期预测效果较佳。但在市场经济条件下,未来的产业单耗和经济发展指标都具有不确定性,对于中远期预测的准确性难以确定。 3.2.2计算过程 根据原始资料的数据对该县未来的负荷进行预测,其过程如下:先算出2010-2016年国内生产总值,设国内生产总值为T 亿元 亿元 亿元 亿元 再算出2007-2009各年的综合单耗

SIFT 特征提取算法详解

SIFT 特征提取算法总结 主要步骤 1)、尺度空间的生成; 2)、检测尺度空间极值点; 3)、精确定位极值点; 4)、为每个关键点指定方向参数; 5)、关键点描述子的生成。 L(x,y,σ), σ= 1.6 a good tradeoff

D(x,y,σ), σ= 1.6 a good tradeoff

关于尺度空间的理解说明:图中的2是必须的,尺度空间是连续的。在 Lowe 的论文中, 将第0层的初始尺度定为1.6,图片的初始尺度定为0.5. 在检测极值点前对原始图像的高斯平滑以致图像丢失高频信息,所以Lowe 建议在建立尺度空间前首先对原始图像长宽扩展一倍,以保留原始图像信息,增加特征点数量。尺度越大图像越模糊。 next octave 是由first octave 降采样得到(如2) , 尺度空间的所有取值,s为每组层数,一般为3~5 在DOG尺度空间下的极值点 同一组中的相邻尺度(由于k的取值关系,肯定是上下层)之间进行寻找

在极值比较的过程中,每一组图像的首末两层是无法进行极值比较的,为了满足尺度 变化的连续性,我们在每一组图像的顶层继续用高斯模糊生成了 3 幅图像, 高斯金字塔有每组S+3层图像。DOG金字塔每组有S+2层图像.

If ratio > (r+1)2/(r), throw it out (SIFT uses r=10) 表示DOG金字塔中某一尺度的图像x方向求导两次 通过拟和三维二次函数以精确确定关键点的位置和尺度(达到亚像素精度)?

直方图中的峰值就是主方向,其他的达到最大值80%的方向可作为辅助方向 Identify peak and assign orientation and sum of magnitude to key point The user may choose a threshold to exclude key points based on their assigned sum of magnitudes. 利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备 旋转不变性。以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度 方向。梯度直方图的范围是0~360度,其中每10度一个柱,总共36个柱。随着距中心点越远的领域其对直方图的贡献也响应减小.Lowe论文中还提到要使用高斯函 数对直方图进行平滑,减少突变的影响。

SIFT特征点提取与匹配算法

二 特征点提取算法 1、基于SIFT (Scale Invariant Feature Transform )方法的图像特征匹配 参看David G. Lowe 的“Distinctive Image Features from Scale-Invariant Keypoints ” 基于SIFT 方法的图像特征匹配可分为特征提取和特征匹配两个部分,可细化分为五个部分: ① 尺度空间极值检测(Scale-space extrema detection ); ② 精确关键点定位(Keypoint localization ) ③ 关键点主方向分配(Orientation assignment ) ④ 关键点描述子生成(Keypoint descriptor generation ) ⑤ 比较描述子间欧氏距离进行匹配(Comparing the Euclidean distance of the descriptors for matching ) 1.1 尺度空间极值检测 特征关键点的性质之一就是对于尺度的变化保持不变性。因此我们所要寻找的特征点必须具备的性质之一,就是在不同尺度下都能被检测出来。要达到这个目的,我们可以在尺度空间内寻找某种稳定不变的特性。 Koenderink 和Lindeberg 已经证明,变换到尺度空间唯一的核函数是高斯函数。因此一个图像的尺度空间定义为:(,,)L x y σ,是由可变尺度的高斯函数(,,)G x y σ与输入图像(,)I x y 卷积得到,即: ),(),,(),,(y x I y x G y x L *=σσ (1.1) 其中:2222/)(221 ),,(σπσσy x e y x G +-= 在实际应用中,为了能计算的相对高效,所真正使用的是差分高斯尺度空间(difference of Gaussian )(,,)D x y σ。其定义如下: ) ,,(),,() ,()),,(),,((),,(σσσσσy x L k y x L y x I y x G k y x G y x D -=*-= (1.2) 如上式,D 即是由两个相邻的尺度的差(两个相邻的尺度在尺度上相差一个相乘系数k )。

中长期负荷预测方法综述1

中长期负荷预测方法综述 摘要:负荷预测是电力系统规划、供电、调度等部门的重要的基础工作,讨论了负荷预测的特点、分类及各种成熟的负荷预测技术,研究了现代负荷预测技术的发展动态,并指出未来主要的研究方向。 中长期负荷预测各种预测方法都具有其各自的优缺点和适用范围,在实际预测工作中,必须根据实际情况,着重从预测目标、期限、精确度等诸多方面作出合理选择,寻求能获取所需精度的预测方法。本文针对电力系统中长期电力负荷预测方法做出分析。 关键字:负荷预测、中长期负荷、负荷预测方法、负荷预测综述 正文:负荷预测是从已知的电力需求出发,通过对历史数据的分析, 并考虑政治、经济、气候等相关因素,对未来的用电需求做出估计和预测。负荷预测是电力系统规划、供电、调度等部门的重要的基础工作。对于经济合理地安排发电机组的启停及检修计划,保持电网安全稳定运行以及未来电网的增容和改建等有十分重要的用。 电力系统负荷预测是电力系统安全经济调度、规划、设计研究的基础和前提,准确的负荷预测结果将意味着在满足供电质量要求的条件下对系统建设资金最大可能限度的利用和有限投资的最大社会经 济效益的获得,负荷预测工作因而引起了人们的普遍关注随着电力 系统的迅速发展尤其是我国电力工业市场化改革的推行负荷预测 工作面临如何准确合理地考虑电力工业市场化后对实际电力负荷从大小到特性上的影响和给整个系统运行规划带来的变化的难题可以

设想在强大的市场压力和竞争机制作用下适用于电力市场环境下 的负荷预测理论和算法必将获得突破性研究成果 随着我国国民经济的快速发展和人民生活水平的不断提高,人们对电量需求量以及电能质量的要求也越来越高。、 一、基于参数模型的中长期电力负荷预测方法 1.趋势外推方法。将已有的各年度的电力负荷看作一个时间序列,利用最小二乘拟合等方法寻求电力负荷与时间的函数关系,并利用这个函数关系预测以后年度的电力负荷。趋势外推方法可以保证对历史数据的拟合是最好的,但不能保证外推效果的可靠性。 2.回归分析方法。回归分析预测是电力系统负荷预测的一种常用方法,根据回归分析涉及变量的多少,可以分为单元回归分析和多元回归分析。在回归分析中,随机变量是自变量,非随机变量是因变量,由给定的多组自变量和因变量资料究二者之间的关系,形成回归方程。回归方程求得后,给定各自变量数值,就可求出因变量值。回归方程根据自变量和因变量之间的函数形式,又可分为线性回归方程和非线性回归方程。在负荷回归分析法方法简单、预测速度快、外推性好,对于历史预测问题中,回归方程的因变量一般是电力系统负荷,自变量是影 响电力系统负荷的各种因素,如经济、人口、气候等。上未出现的情况有较好的预测性。但它对数据的要求高,特别是历史数据残缺或存在较大误差的情况下,预测效果很不理想;用线性方法描述比较复杂

opencv特征提取解析

特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 特征的定义 至今为止特征没有万能和精确的定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”:同一场景的不同图像所提取的特征应该是相同的。 特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。 有时,假如特征提取需要许多的计算时间,而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。 由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样,它们的计算复杂性和可重复性也非常不同。 边缘 边缘是组成两个图像区域之间边界(或边缘)的像素。一般一个边缘的形状可以是任意的,还可能包括交叉点。在实践中边缘一般被定义为图像中拥有大的梯度的点组成的子集。一些常用的算法还会把梯度高的点联系起来来构成一个更完善的边缘的描写。这些算法也可能对边缘提出一些限制。

局部地看边缘是一维结构。 角 角是图像中点似的特征,在局部它有两维结构。早期的算法首先进行边缘检测,然后分析边缘的走向来寻找边缘突然转向(角)。后来发展的算法不再需要边缘检测这个步骤,而是可以直接在图像梯度中寻找高度曲率。后来发现这样有时可以在图像中本来没有角的地方发现具有同角一样的特征的区域。 区域 与角不同的是区域描写一个图像中的一个区域性的结构,但是区域也可能仅由一个像素组成,因此许多区域检测也可以用来监测角。一个区域监测器检测图像中一个对于角监测器来说太平滑的区域。区域检测可以被想象为把一张图像缩小,然后在缩小的图像上进行角检测。 脊 长条形的物体被称为脊。在实践中脊可以被看作是代表对称轴的一维曲线,此外局部针对于每个脊像素有一个脊宽度。从灰梯度图像中提取脊要比提取边缘、角和区域困难。在空中摄影中往往使用脊检测来分辨道路,在医学图像中它被用来分辨血管。 特征抽取 特征被检测后它可以从图像中被抽取出来。这个过程可能需要许多图像处理的计算机。其结果被称为特征描述或者特征向量。 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一、颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区

组合预测方法中的权重算法及应用.

组合预测方法中的权重算法及应用 [ 08-09-19 16:57:00 ] 作者:权轶张勇 传编辑:Studa_hasgo122 摘要系统地分析了组合预测模型的权重确定方法,并估计各种权重的理论精度,以此指导其应用。文章还首次提出用主成分分析确定组合模型权重的方法,最后以短期(1年)负荷预测为例,检验各种权重下组合预测模型的精度。 关键词组合模型权重预测精度负荷预测 1 常用的预测方法及预测精度评价标准 正确地预测电力负荷,既是社会经济和居民生活用电的需要,也是电力市场健康发展的需要。超短期负荷预测,可以合理地安排机组的启停,保证电网安全、经济运行,减少不必要的备用;而中长期负荷预测可以适时安排电网和电源项目投资,合理安排机组检修计划,有效降低发电成本,提高经济效益和社会效益。 常用的负荷预测方法有算术平均、简单加权、最优加权法、线性回归、方差倒数、均方倒数、单耗、灰色模型、神经网络等。 囿于不同的预测模型的理论基础和所采用的信息资料的不同,上述单一预测模型的预测结果经常千差万别,预测精度有高有低,为了充分发挥各种预测模型的优点,提高预测质量,可以在各种单一预测模型的基础上建立加权平均组合预测模型。为此,必须研究组合预测模型中权重的确定方法及预测精度的理论估计。 设Y表示实际值,■表示预测值,则称Y-■为绝对误差,称■为相对误差。有时相对误差也用百分数■×100%表示。分析预测误差的指标主要有平均绝对误差、最大相对误差、平均相对误差、均方误差、均方根误差和标准误差等。 2 组合预测及其权重的确定 现实的非线性系统结构复杂、输入输出变量众多,采用单个的模型或部分的因素和指标仅能体现系统的局部,多个模型的有效组合或多个变量的科学综合才能体现系统的整体特征,提高预测精度。 为了表达和书写方便,下面从组合预测的角度来描述模型综合的方法和类型。设{xt+l},(t=1,2,...,T)为观测值序列,对{xt+l},(l=1,2,...,L)用J个不同的预测模型得到的预测值为xt+l,则组合模型为: ■T+L=■*9棕j■T+L(j) 式中,*9棕j(j=1,2,…,J)为第j个模型的权重,为保持综合模型的无偏性,*9棕j应满足约束条件■*9棕j=1 确定权重常用的方法有专家经验、算术平均法、方差倒数法、均方倒数法、简单加权法、离异系数法、二项式系数法、最优加权法和主成分分析法等等。下面仅简单介绍最优加权法和主成分分析法。 最优加权法是依据某种最优准则构造目标函数Q,在满足约束条件的情况下 ■*9棕j=1,通过极小化Q以求得权系数。 设{xt},(t=1,2,…T)为观测序列,已经为其建立J个数学模型,则最优加权模型的组合权系数*9棕j,(j=1,2,…J)是以下规划问题的解:

相关文档
最新文档