电力用户侧大数据分析与并行负荷预测

电力用户侧大数据分析与并行负荷预测
电力用户侧大数据分析与并行负荷预测

第35卷第3期中国电机工程学报V ol.35 No.3 Feb.5, 2015

2015年2月5日Proceedings of the CSEE ?2015 Chin.Soc.for Elec.Eng. 527 DOI:10.13334/j.0258-8013.pcsee.2015.03.004 文章编号:0258-8013 (2015) 03-0527-11 中图分类号:TM 76

电力用户侧大数据分析与并行负荷预测

王德文,孙志伟

(华北电力大学控制与计算机工程学院,河北省保定市 071003)

Big Data Analysis and Parallel Load Forecasting of Electric Power User Side

WANG Dewen, SUN Zhiwei

(School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, Hebei Province, China)

ABSTRACT: With the development of smart grids, communication network and sensor technology, the electric power user side data is growing exponentially, more complexi, and gradually forms the big data of electric power user side. Now the traditional data analysis model can’t meet the demand of big data, so a new data analysis model aiming at analyzing and processing big data of power user side is urgently necessary. The source of the big data of electric power user side is analyzed in this paper. Those challenges facing data storage, availability, processing of the power user side are pointed out based on volume, variety and speed and other characteristics of the big data. Combining cloud computing technology, an analysis and processing platform of big data of electric power user side is given, which integrates smart meter data, SCADA systems data and various sensors data to be processed by MapReduce or Spark. A load forecasting method based on parallel random forests algorithm is proposed. Parallelization random forest algorithm is used to analyze data, such as load data, temperature, wind speed. The method shortens the time of load forecasting and improves random forests algorithm on data processing capability.Parallel load forecasting prototype system of electric power users side big data based on Hadoop is designed and implemented, including cluster management, data management, predictive classification algorithms library functions and so on. By using data sets of different sizes to do load forecasting experiment with parallelization random forest algorithm,the experiment results show that the prediction accuracy of the parallel random forest algorithm is significant higher than that of the decision tree. The prediction accuracy of different data sets is generally higher than the forecast accuracy of the decision tree, and applying the parallel random forest

基金项目:国家自然科学基金项目(61074078);中央高校基本科研

业务费专项资金资助项目(12MS113)。

Project Supported by National Natural Science Foundation of China (61074078); Fundamental Research Funds for the Central Universities (12MS113). algorithm to analyze and processing big data is a better choice.

KEY WORDS: big data; electric power user side; load forecasting; parallel processing; cloud computing

摘要:随着智能电网、通信网络技术和传感器技术的发展,电力用户侧数据呈指数级增长、复杂程度增大,逐步构成了用户侧大数据。传统的数据分析模式已无法满足需求,迫切需要解决电力用户侧的大数据在分析与处理方面的难题。该文分析电力用户大数据的来源,针对电力用户侧大数据的数据量大、种类繁多与速度快等特点,指出电力用户侧的大数据在数据存储、可用性、处理等方面面临的挑战。结合云计算技术提出一种电力用户侧大数据分析处理平台,将智能电表、SCADA系统和各种传感器中采集的数据整合,并利用并行化计算模型MapReduce与内存并行化计算框架Spark对电力用户侧的大数据进行分析。提出基于随机森林算法的并行负荷预测方法,将随机森林算法进行并行化,对历史负荷、温度、风速等数据进行并行化分析,缩短负荷预测时间和提高随机森林算法对大数据的处理能力。设计并实现基于Hadoop的电力用户侧大数据并行负荷预测原型系统,包括数据集群的管理、数据管理、预测分类算法库等功能。采用不同大小的数据集对并行化随机森林算法进行负荷预测实验,实验结果表明,并行化随机森林算法的预测精度明显高于决策树的预测精度,且在不同数据集上预测精度普遍高于决策树的预测精度,能够较好的对大数据进行分析处理。

关键词:大数据;电力用户侧;负荷预测;并行处理;云计算

0 引言

智能电网是当前全球电力工业关注的热点,而用户作为智能化用电的行为主体,在智能电网需求响应中起着至关重要的作用[1]。对电网用户侧实时数据的采集、传输和存储,并结合累积的海量多源历史数据进行快速分析能够有效的改善需求侧管理,对用户侧数据进行管理与处理支撑着智能电网

528 中国电机工程学报第35卷

安全、坚强及可靠运行。

随着各类传感器和智能设备数量的不断增加,设备中进行获取与传输的各类数据也在发生着指数级的增长,这些数据不仅包括智能电表收集的用电量,还包括各类传感器按照固定频率采集的温度、天气、湿度、地理信息和风速信息等。用户侧数据复杂程度增大,数据存储规模将从目前的GB 级增长到TB级,甚至PB级[2],逐步构成了用户侧大数据。

大数据目前已成为学术界和产业界共同关注的研究主题[3]。2013年中国电机工程学会信息化专委会发布了《中国电力大数据发展白皮书》[4],文中阐述了电力大数据的特征,将会给社会带来的价值和在电力行业中的发展前景以及在发展过程中面临的技术挑战。

如何对电力用户侧大数据进行可靠存储、高效管理和快速分析,是当前重要的研究课题。电力用户侧大数据主要来源于智能电表的广泛使用、各类传感器的普及、智能家电的使用和用户消费模式的改变,其中智能电表覆盖率在2013年1月底已达到为40.5%,其中直供直管范围的智能电能表覆盖率为55%[5],而智能家电随着物联网和大数据的发展将使更多可控的智能家电进入居民生活中。根据其来源总结出电力用户侧大数据的特点如下:1)数据量巨大。美国太平洋天然气电力公司每个月从900万个智能电表中收集超过3 TB的数据,每年将存储超过39TB的数据[6]。一个地区如果有10000套传感器终端,按每套终端每5min采集一次数据计算,每月产生数据总量约9.3TB,每年产生数据接近1PB。随着电网智能化程度的加深,以及为了保证精细化、准确化控制,数据维度也从几十向上百过渡,同时影响电力负荷因素采集频率的提高和采集种类的增多,使上述数据量更加快速增长,而且在多数情况下还需要存储所有的历史数据值以满足溯源处理和复杂数据分析的需求[7]。

2)数据结构类型繁多。随着各类传感器的广泛使用,收集的数据包括各种结构化数据、半结构化数据和非结构化数据,这些数据在采集、传输、存储和处理的过程中形成了多源异构数据。

3)速度快。一次采集频度的提升就会带来数据体量的“指数级”变化,如对100万智能电表的数据采集中,采集频率15min将产生3.18TB的数据,频率为1min将产生47.7TB的数据,频率为1s将产生11.2PB的数据[4]。电力系统中的高级应用需要对海量的历史数据进行离线分析处理,这要求数据平台能够提供并行化的海量历史数据批处理的能力,以及能够快速传输与存储采集到的新数据。

4)数据的交互性。智能电网的一个重要特性之一是交互性,包括与用户的交互实现智能用电和与相关行业的数据交互融合进行全方位的挖掘分析,如将负荷数据与收集到的民生数据、气象数据进行融合进行电力负荷预测。

目前,云计算是解决大数据管理的一种基础平台和高效支撑技术。开源Hadoop技术已经成为大数据管理与并行处理的主流技术,主要包括分布式文件系统(Hadoop distributed file system,HDFS)和并行编程框架MapReduce两部分,该技术具有高性能、高可靠性和强大的可扩展能力等适合管理大数据的优点,已被淘宝、百度、京东等众多互联网公司使用。电力行业也已开始对其进行研究与应用,目前的研究成果主要集中在系统架构设计、系统模型和存储等方面。例如,文献[8]针对智能电网数据的特点,结合Hadoop云计算技术,提出智能电网云计算平台的解决方案,分析了基础设施层、平台层、业务应用层与服务访问层,但尚未讨论实现细节。文献[9]利用Hadoop技术对海量电网设备状态监测数据进行存储,设计并实现了一个数据存储原型系统,包括存储客户端和查询客户端,能够对数据进行高效的存储和快速的查询。

国家电网公司在发输电系统的技术与欧美差别不大,但在配用电侧特别是用户侧存在较大差异,不仅技术领域的名称不同,技术内涵和解决方案也有很大差别。由于相适应的市场机制尚未形成,中国实施智能用电技术的条件不够成熟,难以支持智能配电系统和用户侧管理系统的有效集成[6]。电力用户侧的大数据管理存在如下挑战:1)大数据整合。

传感器网络在智能电网中的广泛使用,智能电表和物联网技术的快速发展,使其产生的大数据模态千差万别,各单位数据口径不一,加工整合困难。针对海量异构数据,如何构建一个模型来对其进行规范表达,如何基于该模型来实现数据融合是亟需解决的问题。

2)大数据可用性。

大数据可用性问题是大数据的重要挑战之一。由于数据的采集方式多种多样,各个通信信道质量不一,不仅接收的数据质量低劣,而且对数据的管控能力也不足,从而导致利用这些低劣的数据进行

第3期王德文等:电力用户侧大数据分析与并行负荷预测 529

挖掘分析发现的知识也是不科学的,不能做出精准的决策。这已经在全球范围内造成了恶劣后果,严重困扰着信息社会。

3)大数据存储。

我国目前已累计实现1.55亿户用电信息采集,构建了大规模的高级量测体系(advanced metering infrastructure,AMI)系统,并在26个省区建成投运了电动汽车充换电站360座、充电桩15333个,这些设备汇集到后台将会产生庞大的数据量[8],而电力数据对储存时间的要求以及海量电力数据的爆发式增长对 IT 基础设施提出了更高的要求。大数据的数据类型复杂,传统的关系型数据库和文件存储格式已不能满足大数据快速增长的需求。

4)大数据分析技术。

智能电网的交互性决定了用户侧大数据处理具有实时性与精准性。而大数据作为一种技术变革的标志,传统的对数据分析技术不能对大数据进行快速数据挖掘分析,已不再适合大数据。从大量数据中挖掘发现可用知识越发困难,迫切需要新的分析技术对大数据进行分析以支持智能电网的推进。

针对电力用户侧大数据的特点和其面对的挑战提出一种基于Hadoop的电力用户侧大数据管理方案。利用Hadoop集群搭建大数据的基础存储平台,将各电网子系统采集到的数据整合成大数据存储,并利用并行化计算框架对电力用户侧的大数据进行快速挖掘分析。本文以电力负荷预测应用为例,将传统的负荷预测迁移到云计算平台,利用随机森林算法实现并行负荷预测,并与决策树算法进行对比。利用不同大小的数据集对并行化随机森林算法进行实验,分析其算法处理大数据的性能。

1 电力用户侧大数据分析平台

1.1 大数据分析平台

本文参照云计算技术体系结构[10]与处理工具,并结合电力用户侧大数据分析的实际需要,搭建以分析计算为主的电力用户侧大数据管理平台,其基本架构如图1所示,分为应用层、私有云计算层、数据管理层。

此框架主要是结合云计算技术,利用Hadoop 搭建电力用户侧大数据管理平台,在平台上采用HDFS、HBase与Hive建立大数据存储系统,在平台上搭建MapReduce并行化计算框架和Spark内存并行化计算框架作为大数据计算分析系统,对电力用户侧的大数据进行分析。

图1电力用户侧大数据管理平台架构图

Fig. 1 Architecture diagram of big data

manage platform of electric power user side

1.2 数据管理层

数据管理层主要是对数据进行采集和集成整合。数据采集主要包括从智能电表、SCADA系统和各种传感器中采集的数据,这些数据不仅包括电网内部的数据,还包括大量相关的数据,这些数据由不同产商的设备产生,模态千差万别,各单位数据口径不一,形成了海量异构数据流,加工整合困难。这些数据的集成整合主要是指对传统系统的产生的数据迁移至私有云平台,进行高效的管理。

虽然各产商都提供了相应的应用程序编程接口(application programming interface,API),但其自动化程度并不高。简单的使用API对大数据进行操作效率不高,需要使用第三方工具进行操作,例如Sqoop和Datanucleus等。Sqoop是一款在Hadoop 和关系数据库之间进行相互转移数据的工具。利用Sqoop可以使各个子系统的数据在大数据平台上进行整合[11]。Datanucleus是一款开源的java持久化工具,可以对HBase、Cassandra多种非关系型数据库进行操作。

平台针对数据集成整合这一难点采用sqoop工具对数据进行抽取整合工作,将各个独立的系统产生的数据及历史数据利用sqoop抽取整合到Hive 与HBase中。使用Datanucleus对列存储数据库进行操作,将基于云计算的应用产生的在线数据写入到HBase中。大数据的抽取整合流程如图2所示。

530 中国电机工程学报第35卷

图2电力用户侧大数据的抽取与整合流程

Fig. 2 Extraction and integration of

electric power user side big data

1.3 私有云计算层与应用层

私有云计算层主要负责大数据的存储和计算分析功能。

云计算层利用Hadoop搭建而成,大数据存储在分布式文件系统HDFS中,利用Hive、Pig和HBase对数据进行管理,电力大数据在存储方面已进行了一些研究,例如文献[12-13]提出利用云计算存储、运算技术进行电力数据中心的搭建。文献[14]在云计算平台上将数据映射成数据空间的点集,充分利用计算存储资源,实现数据集到数据中心的布局方案。文献[15]在对数据进行存储时考虑到数据的安全性,利用HBase 高性能优势和现代密码技术,将密钥与密文的管理分离,开发了基于Hadoop 的智能电网数据安全存储原型系统。

该平台利用HBase存储电力负荷数据和相关数据,HBase数据库是列为存储单元的,方便对整列数据进行查询,而随后使用的随机森林算法在学习过程中需要多次对整列数据进行读取计算,对数据的操作需求符合HBase数据存储的特点。

利用并行化计算模型MapReduce对大数据进行并行化批量计算分析,而对数据密集型的迭代计算采用基于内存的并行化计算模型Spark。Spark是一个开源的分布式集群系统,用于大数据的快速处理分析。Spark克服了Hadoop在迭代计算上的不足,现已成为Apache的顶级项目。Spark提供了一种内存并行化计算框架,框架将作业所需数据读入内存,所需数据时直接从内存中查询,这样比基于磁盘的MapReduce访问数据的速度快,减少了作业的运行时间,也减少了IO操作。

并行计算模型主要是对大量的数据进行挖掘,其计算模型主要有MapReduce[16]、Dremel[27]、Dryad[18]和Cascading等,该平台主要利用Map Reduce模型对电力用户侧大数据进行挖掘分析。

应用层主要是利用私有云计算集群强大的存储和计算分析能力为企业各部门提供决策和指导功能接口。

2 基于随机森林算法的并行负荷预测

2.1 电力负荷预测

负荷预测是电网规划中的关键环节,是变电站、网架规划重要计算依据[19],高精度的短期负荷预测能够有效降低发电成本,有关键作用[20]。目前,短期负荷预测常用的方法主要包括以下几种:决策树、极限学习、遗传算法等。其中,决策树在传统预测算法中得到广泛研究,文献[21]分析了决策树ID3在扩展时易偏向属性值多的属性及属性间相关性考虑较少的缺点,对其进行改进,提出了属性–值对的两次信息增益优化算法,并用此算法进行日特征负荷决策树预测,预测结果能够满足并超过负荷预测实用化标准的要求,并具有较高的预测精度。文献[22]根据各时段负荷和平均负荷受相关因素影响的不同,结合决策树和解耦法提出解耦决策树方法进行预测,并将决策树前两层由实际经验指定,其余节点自动形成,该方法已在北方某市进行实际应用。随着大数据的产生,云计算技术也越来越多的应用在电力系统中,王保义等[23]针对智能电网中负荷数据的特性,结合云计算技术,利用极限学习进行负荷预测,使其具有分布式能力和多Agent 思想,提升了负荷预测算法预测准确率和速度。

以上方法均已取得了相应的研究成果,其中决策树是解决短期电力负荷的主流算法之一,但其自身原因和外界因素也存在很多不足,总结如下:1)在建树初始要把所有属性读入内存,这限制了可以处理的数据量,无法对大数据进行分析;

2)容易出现过生长现象,使决策树过于复杂,导致对训练数据集可以进行很好的分类,但对测试数据集分类效果不佳;

3)随着智能电网的不断发展,用电信息的采集频率不断提高,以及对预测的精度要求越来越高,采集到的影响负荷变化的随机因素也越来越庞大,不确定性也越来越大;因此,传统的数据挖掘算法已经不能满足大数据环境下短期负荷预测的要求。

随机森林是一种集成学习方法,以决策树为基本学习单元,包含多个由Bagging集成学习理论和随机子空间方法训练得到的决策树,输入待分类的样本,由各个决策树产生各分类结果,最终的分类

第3期 王德文等:电力用户侧大数据分析与并行负荷预测 531

结果由各个决策树的结果进行投票决定。随机森林是多个决策树的集成学习方法,不仅可以克服决策树的一些不足,而且具有良好的可扩展性和并行性,能够有效解决大数据的快速处理问题,针对大数据环境下的电力负荷预测有较好的应用前景。 2.2 随机森林算法原理

随机森林[24]是由一系列分类回归树组成的,在2001年由Leo Breiman 根据他的Bagging 集成学习理论和Ho 提出的随机子空间理论相结合提出的。在随机森林中,每个分类回归树都有各自独立的样本训练集TS ,TS 是由Bagging 算法从总样本S 中有放回的抽取与S 等数量的样本组成。算法在利用各个TS 进行分类回归树的训练学习,形成各个分类器过程中,每个内部节点的分支是根据随机子空间理论随机选取若干个属性值进行的,最后形成一个具有分类规则或者回归功能的决策树群。随机森林的最终结果为各个分类回归树进行投票选择或者各分类回归树结果的平均值。随机森林中单个决策树训练过程如图3所示。

图3 随机森林中单个决策树训练过程

Fig. 3 Training process of a single decision tree in random forests

单个分类回归树的构造过程主要包括从属性集中选择合适的属性值进行分支,然后在其产生的子树上分别重复划分搜索过程,直到满足一个停止生长规则为止。

进行分支属性值的选择依据为Gini 指数和最小二乘偏差,其中Gini 指数适合于分类树,而最小二乘偏差适合于回归树,具体计算如下:

1)Gini 指数。

Gini 指数可以度量节点的不纯性,其公式为

2GINI()1(/)j

t p j t =?∑ (1)

式中:t 为当前节点分支属性;p (j /t )表示目标类别j 在节点t 中出现的比例。

节点t 按属性值s 划分的Gini 标准定义为

GINI(,)GINI()GINI()L L R R s t p t p t =+ (2)

划分标准为使GINI(s ,t )最小。

2)最小二乘偏差。

最小二乘偏差多用来度量回归树,节点t 的拟合误差公式为

21

Err()()t

i t D t

t y k n =

?∑ (3)

式中:n t 为节点t 中实例的个数;k t 为每个节点中

实例的目标值的平均值,1

l

t l D l k y n =∑。

节点t 按属性值s 划分的最小二乘偏差标准定义为

Err(,)Err()Err()tL tR L R t t

n n

s t t t n n =

+ (4) 为简化在计算机中的计算过程,避免多次遍历属性值,对式(4)进行简化,可得

22

Err(,)L R

tL tR

S S s t n n =+ (5)

式中iL

L i D S y =∑,iR

R i D S y =∑,划分标准是使式(5)

最大。

2.3 随机森林算法的并行化依据

随机森林算法是一个集成学习算法,这成为并行化的基础,但随机森林并不是K 个决策树模型的简单组合,这使随机森林并行化并不只是量的变化。随机森林的Bagging 与随机子空间为算法并行化提供了理论依据,分别叙述如下。

1)Bagging 思想。

从总样本S 中有放回的抽取K 个训练样本,其样本数为|S |,其中约有37%的数据没有被抽到,使得每个学习单元的训练样本不一样,构建的过程是相互独立的。这确保了随机森林的训练过程不仅可以进行数据的并行化,也可以进行学习单元的并行化,提高模型生成的速率,能够更有效的进行大数据的处理分析。

2)随机子空间思想。

学习单元在每个节点进行属性测试时,随机的从样本属性中抽取若干个属性进行测试。这就避免了一次把所有测试属性读入内存,也避免了决策树在形成过程中容易产生过度拟合的问题。

这两个思想确保了随机森林算法是一个可以并行,能够对大数据进行分类预测的算法,具有较高的分类预测精度,而且对噪声和异常值有较好的稳健性,具有较强的泛化能力。

目前,随机森林算法的应用仍然是单机版的串

532 中国电机工程学报第35卷

行应用。随机森林算法是多个决策树的集成,每个决策树的训练是很耗时的,使得随机森林预测模型的建立需要较长的时间,无法直接应用于大数据环境下的电力负荷预测中。本文针对随机森林在大数据负荷预测中的不足提出了基于MapReduce的并行化随机森林算法(MapReduce-random forests,MR-RF)。

2.4 基于并行随机森林的负荷预测过程

整个过程利用3个MapReduce 作业类执行算法的训练过程,每一个MapReduce的输出作为其后一个的输入。训练结束后得到的随机森林模型保存在Hadoop的分布式集群中,其分为三部分:生成数据字典;生成决策树;形成随机森林。

生成数据字典就是对进行训练的样本数据进行描述,产生一个文件来描述样本中条件属性和决策属性,记录条件属性值的类型和决策属性的位置,以及要创建的模型是进行分类还是回归运算。这个过程由第一个MapReduce完成,每个Map过程读取实验数据的一部分,记录数据的属性类型和负荷值或者类型标识。产生的描述文件以key/value 的形式存储在Hadoop的文件系统HDFS中,以备随后的MapReduce使用。

生成决策树过程为整个并行化算法的核心,其并行化过程主要其中在以下几方面:

1)对原数据集Dataset利用Bagging算法进行随机有放回的抽取K个与原样本数据集大小一样的样本数据TS1,2,…,k。因为是有放回的抽取,所以可以并行对原数据集进行抽取,而不会对TS产生影响。一个TS对应一个决策树的训练集,每个TS 都有所不同,并且与原数据集大小一样,这样既保证了各个决策树的不同,又不会失去原数据集的知识规模。

2)根据样本数据中属性的个数M确定每个节点随机选择的属性个数m(m<

3)递归的进行节点的建立,生成决策树。

生成第k个决策树的map伪代码如下:

输入:n t个实例,实例中y值的总和S t,属性值X v;

输出:第k个决策树;

方法:按X属性值升序排序

S R = S t;S L = 0;

n R = n t;n L = 0;

BestValue = 0;

For 实例i in 所有的实例{

S L=S L+y i;S R=S R?y i;

n L=n L+1;n R=n R?1;

//X i,v为X属性值排序后第i个属性值

if(X i+1,v>X i,v){

SplitValue =(S2L/n L)+(S2R/n R);

If(SplitValue > BestValue){

BestValue = SplitValue;

BestSplitPoint=(X i+1,v+X i,v)/2;

}

}

}

K个决策树的生成是并行产生的,一个Map 生成一个决策树,实现了算法的并行。这个过程由第二个MapReduce 过程完成。此MapReduce只有Map过程没有Reduce过程。

形成随机森林也就是把每个决策树分类器组合起来。每个决策树都会产生一个结果,如果随机森林用来分类其最终结果为投票选取,当它用来回归预测时,K个树会给出K个值,最终值为各树的平均值。此过程由第三个MapReduce完成。

利用随机森林算法的并行化进行短期负荷预测的具体预测流程如图4所示。整个模型是建立在Hadoop的分布式集群上,对大数据进行分布式存储,利用MapReduce将随机森林算法并行化,使算

图4 并行化随机森林短期负荷预测流程图

Fig. 4 Flow chart of parallel random forests for

short-term load forecasting

第3期王德文等:电力用户侧大数据分析与并行负荷预测 533

法能够依托Hadoop集群的存储能力和计算能力对数据的挖掘和计算预测,整个过程都是并行执行的,能够有效提高预测的精度和改善负荷预测系统处理大数据的能力。

3 电力用户侧大数据并行负荷预测原型系统与实验分析

3.1 电力用户侧大数据实验平台

课题组在实验室构建了一个电力用户侧大数据实验平台。实验环境由35台配置相同的PC 机组成,每台PC机CPU为双核Inter i5-2400,主频3.10GHz,4.00GB内存,500GB 硬盘,其中一台PC机作为主节点,其它的PC均作为数据节点。主节点作为一个中心服务器,负责整个集群的资源分配和作业的调度,也是整个文件系统的管理节点,负责文件系统名字空间的管理与维护。数据节点主要是存储和运行任务。主节点将文件进行分块并存储与文件分块信息相关的名字空间和元数据,各个分块数据被冗余的存储在各个数据节点,每块数据默认存储在3个数据节点上。一个MapReduce作业提交到主节点之后,由主节点将此作业分解成多个小任务,并根据整个集群的资源和任务所需资源将小任务分配给各个数据节点进行运行,并对其运行过程进行监控。实验集群的拓扑结构如图5所示。

主节点

图5实验集群拓扑结构图

Fig. 5 Topology map of experimental cluster

图5中大数据集为各个系统在关系型数据库中存储的数据,包括传感器的监测数据、电力负荷的历史数据以及相关数据等。大数据集通过相关的数据整合工具迁移到Hadoop集群中,目前仍没有一个标准的高效的数据整合方法将各数据集整合到Hadoop集群中。本文采用3种整合方法,包括编写MapReduce作业、开源的java持久化插件DataNucleus、开源的Sqoop工具,分别叙述如下。

1)编写MapReduce作业。

根据需求编写MapReduce作业对操作者有较高的要求,需要操作者根据需求编写高效快速的程序,其运行效率与程序的编写有着直接的关系。在测试中将20万条测试数据插入到HBase中,单线程的逐条插入所需时间为9min,多线程的并发插入所需时间为1min,而利用HBase中表在HDFS 中存储特点,利用BulkLoad插入HBase所需时间为30s。

2)开源的java持久化插件DataNucleus。

DataNucleus是一个开源的持久化插件,支持当前众多主流存储系统。DataNucleus屏蔽了个存储系统的差异,提供统一的对外接口,操作者容易掌握,但其灵活度不高,操作者只能使用其提供的API对程序进行优化。在测试中将20万条测试数据插入到HBase中,所需时间为3min。

3)开源的Sqoop工具。

Sqoop可以将本地文件或者数据库表与HDFS 文件进行相互迁移。Sqoop是基于MapReduce实现的,使操作者不用过多的去关注MapReduce的实现和优化。在测试中将20万条测试数据插入到HBase 中,所需时间约为1min。

上述3种方法各有利弊,Sqoop虽然效果较好,但使用不够灵活;DataNucleus虽然效率较低,但利于集成开发;直接编写MapReduce作业效率最快,但对操作者有较高的要求。由于研究过程中需求的多样性,采用了3种整合方法。

3.2 基于Hadoop的电力用户侧大数据并行负荷预测原型系统

在此实验平台上搭建电力用户侧大数据管理平台,并在该平台上实现了基于Hadoop的电力用户侧大数据并行负荷预测原型系统(见附录A中图A1)。

系统功能包括数据集群的管理、文件管理、数据管理、序列化文件管理、预测分类算法库和预测结果展示。集群管理主要是向Hadoop集群注册用户,得到操作集群的权限,并对MapReduce作业进行实时监控。文件管理在HDFS文件系统上实现了文件的上传、下载、在线查看和编辑功能。数据管理是对各系统中的数据进行抽取整合到Hadoop集群中,并进行数据的展示。序列化文件管理主要是对较小的文件和MapReduce作业中的中间结果进行管理,将较小的文件进行序列化为SequenceFile 文件进行存储,有利于提高小文件的存储效率,对MapReduce作业的中间结果进行查看容易更好的理解MapReduce的执行过程。预测分类算法库包括

534 中 国 电 机 工 程 学 报 第35卷

了多种并行化的预测分类算法,包括K 均值算法、决策树算法、随机森林算法、贝叶斯算法。结果展示则是对预测分类的结果利用图表工具进行展示,提高数据的可视化程度。本文中实验均在此原型系统中进行。

3.3 实验数据和特征值的选取

实验数据来自某地区2011年3、4月的负荷信息和天气信息,负荷信息采集频率是0.5 h(共2 880行数据),天气信息为最高气温、最低气温、降雨量。实验中数据量虽然没有达到大数据的规模,但可以用此实验数据进行算法正确性实验,随后对实验数据进行人为的扩充达到大数据规模进行算法预测速率实验。进行反复多次的测试,取平均值为最终实验结果。

对大数据环境下负荷预测数据的研究发现这些数据呈现一种延续性、周期性、相关性特点,根据这些特点和大量文献

[25-26]

的研究成果确定样本

属性为星期、是否周末、最高气温、最高气温变化率、最低气温、最低气温变化率、降雨量、上月同时期负荷、上周同时期负荷、昨天负荷、预测负荷,其样本数据如表1所示。此外,负荷数据又是一个时间序列数据,有着近大远小的特点,则对上述属性设置加权值为上月同时期负荷的权值为0.2,上

周同时期负荷的权值为0.5,昨天负荷的权值为1。

表1 部分负荷训练数据集 Tab. 1 Part of load training data set

属性 值 星期

星期日

是否周末 1

最高气温 9.0 最高气温变化率

?2.5

最低气温 8.3

最低气温变化率 0.5

降雨量 25.9 上月同时期负荷 1 529.05 上周同时期负荷

1

453.64 昨天负荷 1 517.89 负荷

1 470.08

3.4 实验评价指标

负荷预测结果的评价指标采用平均绝对百分比误差(mean absolute percentage error ,MAPE),表达式为

1

MAPE [(/)]/100%n

t t t t Y y y n ==?×∑ (6)

式中:Y t 为预测值;y t 为真实值;n 为预测点的个

数。电力负荷预测中,MAPE 值越小,负荷预测值越准确。

算法并行性评价指标采用通用的加速比,表达式为

peedup /S t T = (7)

式中:t 为单机运行的时间;T 为集群运行的时间。 3.5 基于随机森林算法的并行负荷预测实验分析

实验一:本次实验将MR-RF 算法与传统决策树算法进行比较,以某地区2011-3-7至2011-4-27的历史数据为训练样本数据集,训练MR-RF 算法和决策树算法来预测2011-4-28当天的负荷值,实验进行多次求取平均值为最终实验结果,采用公 式(6)作为评价函数,实验结果如表2所示。由表2可见,MR-RF 的MAPE 为1.43%,而决策树的MAPE 为2.12%,这表明MR-RF 的预测精度高于决策树,这是因为MR-RF 是由若干个随机抽取的决策树集成在一起的,具备决策树优点的同时又克服了决策树的一些缺陷,表现出比决策树更好的特性。

表2 MR-RF 与决策树的MAPE Tab. 2 MAPE of MR-RF and decision tree

预测方法 MAPE/%

MR-RF 1.43

决策树 2.12

图6是2011-4-28当天真实负荷值和用MR-RF 算法、决策树算法的进行电力负荷预测的预测值的对比图。由图6可知,当真实负荷值变化比较平缓时,决策树算法和MR-RF 都表现出较高的准确度,但随着真实负荷谷峰的出现,决策树算法的预测精度有所下降,MR-RF 算法依然表现出较高的预测精度,可见MR-RF 算法更适合在生产实际中使用。

实验二:本次实验主要是对MR-RF 算法中决

策树的个数K 进行实验确定。不同树大小的MAPE

值如表3所示。由于数据集大小和数据集属性个数

电力负荷/k W

负荷量真实值

MR-RF 负荷量预测值决策树负荷量预测值

05

10 15 20每日负荷时间点/h

1 4001 2001 000800600

图6 电力负荷真实值与预测值的对比

Fig. 6 Comparison of actual and forecast load values

第3期 王德文等:电力用户侧大数据分析与并行负荷预测 535

表3 不同大小森林的MAPE Tab. 3 MAPE of different sizes forest

树的大小K MAPE/%

100 1.84 150 1.61 200 1.43 250 1.48 300 1.61

的影响,K 取值过小会使预测模型倾向决策树模型,预测精度不高,取值过大会随机森林模型分类过细,使集群计算量剧增,因此K 是决定MR-RF 预测精度的重要变量。由表3可以看出K =200时有较好的MAPE 。

实验三:本实验主要是比较数据量的增长对算法预测精度的影响。实验数据文件大小和包含的数据元组数如表4所示。

表4 数据文件大小和元组数

Tab. 4 Size of data files and number of tuples

文件大小/MB 410 820 1 640 3 280 6 560 元组数

4×106

8×106

1.6×107 3.2×107

6.4×107

将各不同的数据集分别用来进行并行负荷预测实验,然后分别计算各个MAPE 值,其实验结果如表5所示。

表5 不同数据集的MAPE Tab. 5 MAPE of different data sizes

元组数 MAPE/%

4×106 1.63 8×106 1.61 1.6×107 1.82 3.2×107 1.76 6.4×107 1.91

由表5可以看出,不同大小数据集的预测精度不一样,没有明显的变化规律,但其精度均小于实验一中决策树的预测精度,证明并行化的随机森林算法适合用户侧大数据的负荷预测。

实验四:本次实验主要是测试不同数据集导入不同大小Hadoop 集群的影响。将实验三中的数据分别导入5台和8台Hadoop 集群所用的时间如 图7所示。

由图7可以看出,不同大小数据文件导入集群的时间随着数据集的变化而变化,但所花费的时间较少。在5个节点和8个节点的集群上导入相同大小数据文件的时间曲线基本吻合,说明数据文件导入Hadoop 集群受集群规模的影响较小。

实验五:算法并行性的好坏用加速比来衡量,

时间/s

5个节点集群 8个节点集群

48

16

32 64

数据元组数/106

700

100

500

300

图7 数据文件导入两个集群的时间对比图 Fig. 7 Time comparison of two clusters

on data files importing

即式(7)。由于实验数据有限,人为的把原数据集扩大2.4 G 、12.4 G 、124 G ,分别运行在1、5、15、25、

35台大小的分布式集群上,运行结果如图8所示。

由图8可以看出,并行的随机森林算法在不同数据量不同大小的分布式集群中显示了接近线性增长的趋势,并且在相同集群大小的情况下数据量越大加速比也越大,但是随着集群的增多加速比会减少,但总的来说随着集群数量的增多加速比会变大。

加速比

2.4 G

12.4 G 124 G

集群大小

1510

15 3520 25 30 5

2

43

1

图8 并行随机森林算法的加速比

Fig. 8 Speedup of parallel random forest algorithm

4 结论

本文结合国内外电力大数据的研究现状,针对电力用户侧大数据展开了研究。分析了用户侧大数据的特点,提出了一个大数据分析平台,并在此平台上开发了基于Hadoop 的电力用户侧大数据并行负荷预测原型系统,在此原型系统上利用并行化后的随机森林算法进行负荷并行预测实验,经试验表明该方法提高了负荷预测的精度。

受实验环境的影响,实验中使用的数据集最大只达到GB 级,但是所进行的实验已从不同的角度模拟数据量的增加,其实验结果仍具有可参考性,下一步的工作准备对更大数据集进行分析和并行处理,对内存并行化计算框架Spark 进行深入研究。

536 中国电机工程学报第35卷

参考文献

[1] Rusitschka S,Eger K,Gerdes C.Smart grid data cloud:

A model for utilizing cloud computing in the smart grid

domain[C]//First IEEE International Conference on Smart Grid Communications.Gaithersburg,MD,USA:IEEE,2010:483-488.

[2] 丁杰,奚后玮,韩海韵,等.面向智能电网的数据密集

型云存储策略[J].电力系统自动化,2012,36(12):66-70.Ding Jie,Xi Houwei,Han Haiyun,et al.A smart grid-oriented data placement strategy for data-intensive cloud environment[J].Automation of Electric Power

Systems,2012,36(12):66-70(in Chinese).

[3] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计

算机研究与发展,2013,50(1):146-169.

Meng Xiaofeng,Ci Xiang.Big data management:

concepts,techniques,and challenges[J].Computer Research and Development,2013,50(1):146-169(in Chinese).

[4] 中国电机工程学会信息化专委会.中国电力大数据发展

白皮书[S].北京:中国电力出版社,2013.

Chinese society for electrical engineering.The white paper on the development of big data on china electric [S].Beijing: China Electric Power Press,2013(in Chinese).

[5] 宋亚奇,刘树仁,朱永利,等.电力设备状态高速采样

数据的云存储技术研究[J].电力自动化设备,2013,

33(10):150-156.

Song Yaqi,Liu shuren,Zhu Yongli,et al.Cloud storage of power equipment state data sampled with high speed[J].Electric Power Automation Equipment,2013,33(10):150-156(in Chinese).

[6] 张东霞,姚良忠,马文媛.中外智能电网发展战略[J].中

国电机工程学报,2013,33(31):1-14.

Zhang Dongxia,Yao Liangzhong,Ma Wenyuan.Development strategies of smart grid in China and abroad[J].Proceedings of the CSEE,2013,33(31):1-14(in Chinese).

[7] 宋亚奇,周国亮,朱永利.智能电网大数据处理技术现

状与挑战[J].电网技术,2013,37(4):927-935.

Song Yaqi,Zhou Guoliang,Zhu Yongli.Present status and challenges of big data processing in smart grid[J].Power System Technology,2013,37(4): 927-935(in Chinese).[8] 王德文,宋亚奇,朱永利.基于云计算的智能电网信息

平台[J].电力系统自动化,2010,34(22):7-12.

Wang Dewen,Song Yaqi,Zhu Yongli.Information platform of smart grid based on cloud computing [J].Automation of Electric Power Systems,2010,34(22):7-12(in Chinese).

[9] 刘树仁,宋亚奇,朱永利,等.基于Hadoop的智能电

网状态监测数据存储研究[J].计算机科学,2013,40(1):

81-84.

Liu Shuren,Song Yaqi,Zhu Yongli,et al.Research on

data storage for smart grid condition monitoring using Hadoop[J].Computer Science,2013,40(1):81-84(in

Chinese).

[10] 曹子健,林今,宋永华.主动配电网中云计算资源的优

化配置模型[J].中国电机工程学报,2014,34(19):

3043-3049.

Cao Zijian,Lin Jin,Song Yonghua.Optimization model

for resources allocation of cloud computations in active distribution networks[J].Proceedings of the CSEE,2014,34(19): 3043-3049(in Chinese).

[11] 王德文,肖凯,肖磊.基于Hive的电力设备状态信息

数据仓库[J].电力系统保护与控制,2013,41(9):

152-130.

Wang Dewen,Xiao Kai,Xiao Lei.Data warehouse of

electric power equipment condition information based on hive[J].Power System Protection and Control,2013,

41(9):152-130(in Chinese).

[12] 王德文.基于云计算的电力数据中心基础架构及其关键

技术[J].电力系统自动化,2012,36(11):67-71.

Wang Dewen.Basic framework and key technology for a new generation of data center in electric power corporation based on cloud computation[J].Automation of

Electric Power Systems,2012,36(11):67-71(in

Chinese).

[13] 赵俊华,文福拴,薛禹胜,等.云计算:构建未来电力

系统的核心[J].电力系统自动化,2010,34(15):1-8.Zhao Junhua,Wen Fushuan,Xue Yusheng,et al.Cloud

computing:Implementing an essential computing platform

for future power systems[J].Automation of Electric Power Systems,2010,34(15):l-8(in Chinese).[14] 丁杰,奚后玮,韩海韵,等.面向智能电网的数据密集

型云存储策略[J].电力系统自动化,2012,36(12):66-70.Ding Jie,Xi Houwei,Han Haiyun,et al.A smart grid-oriented data placement strategy for data-intensive cloud environment[J].Automation of Electric Power

Systems,2012,36(12):66-70(in Chinese).

[15] 张少敏,李晓强,王保义.基于Hadoop的智能电网数

据安全存储设计[J].电力系统保护与控制,2013,

41(14):136-140.

Zhang Shaomin,Li Xiaoqiang,Wang Baoyi.Design of

data security storage in smart grid based on hadoop [J].Power System Protection and Control,2013,41(14):136-140(in Chinese).

[16] Tom White.Hadoop权威指南:中文版[M].曾大聃,

周傲英,译.清华大学出版社,2010.

Melnik S,Gubarev A,Long Jingjing,et al.Dremel:

Interactive analysis of web-scale datasets[J].PVLDB,

2010,3(1):330-339.

第3期王德文等:电力用户侧大数据分析与并行负荷预测 537

[17] Isard M,Budiu M,Yu Yuan,et al.Dryad:distributed

data-parallel programs from sequential building blocks

[C]//Proc of EuroSys 2007.New York:ACM,2007:

59-72.

[18] 钟清,孙闻,余南华,等.主动配电网规划中的负荷预

测与发电预测[J].中国电机工程学报,2014,34(19):

3050-3056.

Zhong Qing,Sun Wen,Yu Nanhua,et al.Load and power

forecasting in active distribution network planning [J].Proceedings of the CSEE,2014,34(19):3050-3056(in

Chinese).

[19] 毛李帆,姚建刚,金永顺,等.中长期电力组合预测模

型的理论研究[J].中国电机工程学报,2010,30(16):

53-59.

Mao Lifan,Yao Jiangang,Jin Yongshun,et al.Theoretical

study of combination model for medium and long term load forecasting[J].Proceedings of the CSEE,2010,

30(16):53-59(in Chinese).

[20] 栗然,刘宇,黎静华,等.基于改进决策树算法的日特

征负荷预测研究[J].中国电机工程学报,2005,25(24):36-41.

Li Ran,Liu Yu,Li Jinghua,et al.Study on the daily characteristic load forecasting based on the optimizied algorithm of decision tree[J].Proceedings of the CSEE,

2005,25(24):36-41(in Chinese).

[21] 李响,黎灿兵,曹一家,等.短期负荷预测的解耦决策

树新算法[J].电力系统及其自动化学报,2013,25(3):13-19.

Li Xiang,Li Canbing,Cao Yijia,et al.New algorithm

of short-term load forecasting according to decision tree and decoupling[J].Proceedings of the CSU-EPSA,2013,25(3):13-19(in Chinese).

[22] 王保义,赵硕,张少敏.基于云计算和极限学习机的分

布式电力负荷预测算法[J].电网技术,2014,38(2):

526-531.

Wang Baoyi,Zhao Shuo,Zhang Shaomin.Distributed

power load forecasting algorithm based on cloud computing and extreme learning machine[J]. Power System Technology,2014,38(2):526-531(in Chinese).[23] Breiman L.Random forests[J].Machine Learning,2001,

45(1):5-32.

[24] 焦润海,苏辰隽,林碧英,等.基于气象信息因素修正

的灰色短期负荷预测模型[J].电网技术,2013,37(3):720-725.

Jiao Runhai,Su Chenjun,Lin Biying,et al.Short-term

load forecasting by grey model with weather factor-based correction[J].Power System Technology,2013,37(3):720-725(in Chinese).

[25] 张素香,刘建明,赵丙镇,等.基于云计算的居民用电

行为分析模型研究[J].电网技术,2013,37(6):

1542-1546.

Zhang Suxiang,Liu Jianming,Zhao Bingzhen,et

al.Cloud computing-based analysis on residential electricity consumption behavior[J].Power System Technology,2013,37(6):1542-1546(in Chinese).[26] Matei Zaharia,Mosharaf Chowdhury,Tathagata Das,

et al.Resilient distributed datasets:A fault-tolerant abstraction for in-memory cluster computing[C]// Proceedings of the 9th USENIX conference on Networked

Systems Design and Implementation.USA:USENIX

Association Berkeley,2012:2-2.

[27] Matei Zaharia,Mosharaf Chowdhury,Michael J,et

al.Spark:Cluster computing with working sets

[C]//Proceedings of the 2nd USENIX conference on Hot

topics in cloud computing.USA:USENIX Association

Berkeley,2010:10-10.

[28] 刘萌,褚晓东,张文,等.负荷分布式控制的云计算平

台构架设计[J].电网技术,2012,36(8):140-144.

Liu Meng,Chu Xiaodong,Zhang Wen,et al.Design of

cloud computing architecture for distributed load control

[J].Power System Technology,2012,36(8):140-144(in

Chinese).

附录 A

笔者所在实验室搭建了电力用户侧大数据管理平台,

并在该平台上实现了基于Hadoop的电力用户侧大数据并行

负荷预测原型系统,界面如图A1所示。

图A1基于Hadoop的并行负荷预测原型系统

Fig. A1 Parallel load forecasting prototype

system based on Hadoop

收稿日期:2014-09-29。

作者简介:

王德文(1973),男,博士,副教授,研

究方向为电力系统自动化与智能信息处

理,wdewen@https://www.360docs.net/doc/197984614.html,;

孙志伟(1987),男,硕士研究生,研究

方向为大数据与电力用户用电行为分析,

sunzw20120901@https://www.360docs.net/doc/197984614.html,.

王德文

(责任编辑李婧妍)

电力用户侧大数据分析与并行负荷预测

作者:王德文, 孙志伟, WANG Dewen, SUN Zhiwei

作者单位:华北电力大学控制与计算机工程学院,河北省 保定市,071003

刊名:

中国电机工程学报

英文刊名:Proceedings of the CSEE

年,卷(期):2015(3)

引用本文格式:王德文.孙志伟.WANG Dewen.SUN Zhiwei电力用户侧大数据分析与并行负荷预测[期刊论文]-中国电机工程学报 2015(3)

中长期电力负荷预测研究

中长期电力负荷预测研究 发表时间:2017-11-24T11:02:36.117Z 来源:《电力设备》2017年第19期作者:南志军童丽萍 [导读] 摘要:电力负荷预测是电力系统调度、用电、计划、规划等管理部门的重要工作之一。 (国网新疆哈密供电公司新疆哈密 839000) 摘要:电力负荷预测是电力系统调度、用电、计划、规划等管理部门的重要工作之一。该文对电力负荷预测的概念及分类等问题进行了简要论述,重点分析了中长期负荷预测的特点、成熟方法,对中长期负荷预测方法进行了综述。 关键词:中长期;电力负荷;预测;研究 电力系统负荷预测作为电力系统现代化管理的重要内容之一,在电力系统的控制运行和规划方面具有非常重要的作用,尤其是中长期电力系统负荷的预测,受经济、社会、人口、气候等因素影响很大,存在多样性、复杂性和许多不确定性,对其预测结果是制定电力系统输电规划和电源规划的基础,体现了未来负荷发展的规律,为未来负荷规划提供可靠的依据。 1中长期负荷预测的概述 电力负荷预测是指从已知的电力系统、经济、社会、气象等情况出发,通过对历史数据的分析和研究,运用哲学、社会学、经济学、统计学、数学、计算机、工程技术及经验分析等定性定量的方法,探索事务之间的内在联系和发展变化规律,对负荷发展做出预先估计和推测。长期预测以年为预测时段,以用电负荷、用电量等的年度统计数据作为预测内容,主要受国民经济发展情况、人口、产值单耗、产业结构调整情况、电价政策等的影响,其目的是为合理安排电源和电网的建设进度提供宏观决策的依据。中期预测以月为预测时段,以用电量、用电负荷等的月度统计数据作为预测内容,这些数据呈周期性增长,每年度的12个月具有相似的规律,其变化规律可分为月度量的年度发展序列和月度量的月度发展序列。 2电力负荷预测原理 负荷是指电力需求量,而需求量可用能量的时间变化率表示。在充分考虑一些重要的电力系统运行特性、增容决策、自然条件与社会影响的条件下,研究或利用一套系统的处理过去和现在负荷的数学方法,在满足一定精度要求的意义下,确定未来某特定时刻的负荷数值,称为负荷预测。由于中长期电力负荷受经济、社会、气候等多种因素影响,且存在多样性、复杂性和不确定性,传统的方法无法对复杂电力负荷系统进行准确的预测,导致预测精度低。由于电力负荷是一多维的动态非线性时间序列系统,影响因素很多,只有从中找出一组合适的因子才能有效地捕捉电力负荷变化趋势,从而对电力负荷进行准确的预测。设电力负荷的影响因子为: { x1,x2,…xm} ,m表示影响因子的个数,y 表示电力负荷真实观察值,xi表示第 i 个影响因素,通过一定的建模方法描述电力负荷和影响因子的非线性关系。 3目前常用的中长期电力负荷预测方法及分析 3.1 传统预测方法 回归分析预测法,根据回归分析涉及变量数分为单元、多元回归分析;根据自变量和因变量之间的函数形式,分为线性、非线性回归方程。该方法简单便捷、外推性好,可以很好的预测出从未发生过的情况;但在历史数据残缺或存在较大误差的情况下,预测效果很不理想,针对复杂参数变化,缺乏自学习能力,无法及时进行负荷模型更新。时间序列外推法,基本模型包括:自回归模型AR、动平均模型MA、自回归动平均模型ARMA。此方法适用于负荷变化不大的情况,优点是:对历史数据量要求较低;缺点是:对历史数据准确性要求高,模型系数的计算较繁琐,用线性方程来近似表达一种非线性关系,无法参考天气因素的影响,无法保证精度。灰色数学理论,利用GM 模型群实现电力负荷预测。当电力负荷呈严格指数增长时,灰色数学理论预测方法的预测精度高、所需样本数据少、计算简便以及可检验。但其缺点也比较突出:数据的灰度越大,预测精度越差,不适合长期预测;具有波动性变化的电力负荷,采用GM模型,误差大,无法实现实际需求。 3.2 现代负荷预测方法 模糊预测法,利用有限的规则近似表示任意的函数关系,其缺点是模糊推理FUZZY预测没有学习能力,不能很好的适应不断变化的电力系统,因而精度比较差。专家系统预测法,是对不可量化的经验进行转化的一种方法。其优点是:能汇集多个专家的知识和经验,最大限度地利用专家的能力,资料与信息量比较多,考虑的结果比较全面,从而可以得出较为准确的结果。其缺点是:知识面受数据库的限制,失去自学的能力;对突发性事件和不断变化的条件适应性差。遗传规划方法,是用能根据环境状况动态改变的广义的层次化计算机程序描述问题。在负荷预报应用中,能自动找出与负荷变化密切相关的因素,用其作为自变量,自动生成函数表达式来体现负荷的变化规律,建立负荷预测的数学模型。其预报精度可满足工程需要,在实际应用中,用遗传规划直接进行负荷预报可以作为其他预报方法的辅助工具。优选组合预测模型,对于同一个预测问题,将多个不同的预测模型的线性组合,在一定的条件下改善模型的拟合能力和提高预测精度。选取适当的权重进行加权平均或者选择拟合优度最佳或标准差最小的预测模型作为最优模型进行预测。 3.3 对中长期负荷预测方法的建议 对于年度预测具有单调性的特点,采用灰色预测法、回归分析预测法;若可以引入相关因素,可采用弹性系数法。对于月度预测时,按照年度发展序列构成的月度预测方法中,若历史数据具有单调性特点,则采用灰色预测、回归分析等方法;按照月度发展序列构成的月度预测方法中,根据12月的周期性,优先采用ARMA模型。 4中长期负荷预测要解决的问题及对其研究方向的建议 4.1 中长期负荷预测要解决的问题 需要充分考虑外界因素变化、未来相关因素不确定性、众多因素交互作用的结果以及对预测专家经验和意见有效分析利用的预测前提;遵循“近大远小”原则,采用加权参数估计方法实现区别对待各时段的拟合残差;由于需要按照一定参数估计方法求解若干待定参数(如最小二乘估计、岭估计等算法),使得预测效果差别较大,则如何选择适当的参数估计方法提高预测精度是需要解决的问题。 4.2 对负荷预测问题研究方向的建议 首先是,组合预测,但组合预测的权重确定的分析和估计策略的选择还需要深入研究。其次是,由于不同单位开发了多个电力负荷预测和分析的软件包,使得其独立性强,兼容性差,造成软件培训和系统维护的困难,基于Internet/intranet技术的发展,提供了一种全新的实现负荷预测技术的手段,为电力部门提供一个网上的负荷预测中心,从而有效地提高预测方法的准确性、预测操作的简单性和经济性,

负荷预测方法一

1、单耗法 这个方法是根据预测期的产品产量(或产值)和用电单耗计算需要的用电量,即 A h =∑=n i 1Q i U i 式中 A h —某行业预测期的需电量; U i —各种产品(产值)用电单耗; Q i —各种产品产量(或产值)。 当分别算出各行业的需用电量之后,把它们相加,就可以得到全部行业的需用电量。这个方法适用于工业比重大的系统。对于中近期负荷预测(中期负荷预测的前5年),此时,用户已有生产或建设计划,根据我国的多年经验,用单耗法是有效的。 在已知某规划年的需电量后,可用年最大负荷利用小时数来预测年最大负荷,即 P n·max =T A n m ax 式中 P n·max —年最大负荷(MW ); A n —年需用电量(k W·h ); T max —年最大负荷利用小时数(h )。 各电力系统的年最大负荷利用小时数,可根据历史统计资料及今后用电结构变化情况分析确定。 单耗法分产品单耗法和产值单耗法。采用单耗法预测负荷的关键是确定适当的产品单耗或产值单耗。 单耗法可用于计算工业用户的负荷预测。 单耗法可根据第一、第二、第三产业单位用电量创造的经济价值,从预测经济指标推算用电需求量,加上居民生活用电量,构成全社会用电量。预测时,通过对过去的单位产值耗电量(以下简称“单耗”) 进行统计分析,并结合产业结构调整,找出一定的规律,预测规划第一、第二、第三产业的综合单耗,然后根据国民经济和社会发展规划指标,按单耗进行预测。单耗法需要做大量细致的统计、分析工作,近期预测效果较佳。 单耗法的优点是方法简单,对短期负荷预测效果较好。缺点是需做大量细致的调研工作,比较笼统,很难反映现代经济、政治、气候等条件的影响。

电力大数据时代

浅谈风电产业如何应对数据大时代 甄剑峰(恒泰风电场) 摘要:近年来,大数据来势汹汹,对传统数据商业分析模式产生了重大地影响,对电力企业的数据驾驭能力提出了新的挑战与机遇。从人才培养、技术储备、数据驾驭、数据价值挖掘等方面剖析电力企业如何应对大数据的挑战,让电力企业在大数据来临时更加从容地选择适合的技术、方法论、解决方案和发展战略。 关键词:大数据电力企业海量价值 1 引言 随着数字信息化时代的迅猛发展,信息量也呈爆炸性增长态势。在人类充分享受信息化带来的资讯、方便和快捷时,也使得全球的数字信息资源正进入到一个前所未有的快速增长期。据IDC统计,2011年全球数据量已达到1.8ZB,相当于全世界人均产生200GB以上的数据,并且还将以每年50%的速度继续增长。在这汹涌来袭的数据浪潮下,社会各个领域也将开始其数据化进程。无论学术界、商界还是政府,都将不可避免的进入“大数据时代”。作为全球第二大经济体的基础能源支撑体系,中国电力工业概莫能外。 2 电力大数据的定义及特征 2.1 大数据的定义 目前业界还未对大数据有一个统一的定义,但是有两个关于大数据的定义很好地诠释了大数据的本质。第一个定义来自Gartner公司的Merv Adrian在2011年第一季度刊登在《Teradata Magazine》上的一篇文章:“大数据超出了常用硬件和软件工具在可接受的时间内为其用户收集、管理和处理数据的能力。”另一个定义来自于麦肯锡全球数据分析研究所(Mckinsey Global Institute)在2011年5月发表的一篇论文:“大数据是指大小超出了典型数据库软件工具收集、存储、管理和分析能力的数据集。” 2.2大数据的特征 概括来讲,大数据有三个特征,可总结归纳为“3V”,即量(Volume)、类(Variety)、时(Velocity)。量,数据容量大,现在数据单位已经跃升至ZB级别。类,数据种类多,主要来自业务系统,例如社交网络、电子商务和物联网应用。时,处理速度快,时效性要求高,从传统的事务性数据到实时或准实时数据。大数据主要包括以下几个特征:大容量:企业数据量大规模增长,单一数据集的规模范围从几十TB到数PB不等。电力数据涵盖发电、输电、变电、配电、用电、调度的各个环节,数据量庞大。随着智能电网建设和物联网的应用,非结构化数据呈现出快速增长的势头,其数据量大大超过结构化数据。

电力负荷预测方法

1.负荷预测分类和基础数据处理 1.1负荷预测及其分类 1.1.1负荷预测概念 负荷预测是根据负荷的历史数据及其相关影响因素,分析负荷的变化规律,综合考虑影响负荷变化的原因,使用一定的预测模型和方法,以未来经济形势、社会发展、气候条件、气象因素等预测结果为依据,估计未来某时段的负荷数值过程。 1.1.2负荷预测的分类 按照预测方法的参考体系,工程上的负荷预测方法可分为确定性预测方法、不确定预测方法、空间负荷预测法。 确定性:把电力负荷预测用一个或一组方程来描述,电力负荷与变量之间有明确的一一对应关系。 不确定性:实际电力负荷发展变化规律非常复杂,受到很多因素影响,这种影响关系是一种对应和相关关系,不能用简单的显示数学方程描述,为解决这一问题,产生了一类基于类比对应等关系进行推测预测负荷的不度额定预测方法。 空间负荷预测:确定和不确定负荷预测是对负荷总量的预测。空间负荷预测是对负荷空间分布的预测,揭示负荷的地理分布情况。

1.2负荷预测的基础数据处理 1.2.1负荷预测的基础数据 基础数据大致包括四类,分别为:①负荷数据(系统、区域、母线、行业、大用户的历史数据;负荷控制数据;系统、区域、大用户等的最大利用小时数;发电厂厂用电率和网损率。)②气象数据(整点天气预报;整点气象要素资料;年度气温、降水等气象材料。)③经济数据和人口(区域产业GDP;城乡可支配收入;大用户产量、产值和单耗;电价结构和电价政策调整;城乡人口。)④其他时间(特殊时间如大型会议、自然灾害;行政区域调整) 1.2.2数据处理 为获得较好的预测效果,用于预测数据的合理性得到充分保证,因此需要对历史数据进行合理性分析,去伪存真。最基本要求是:排除由于人为因素带来的错误以及由于统计口径不同带来的误差。另外,尽量减少异常数据(历史上突发事件或由于某些特殊原因会对统计数据带来宠大影响)带来的不良影响。常见的数据处理方法有:数据不全、数据集成、数据变换和数据规约等。 2.确定性负荷预测方法 2.1经验技术预测方法 2.1.1专家预测法 专家预测发分为专家会议发和专家小组法。会议发通过召集专家开会,面对

中长期电力负荷预测方法的简述及分析

中长期电力负荷预测方法的简述及分析 【摘要】介绍负荷预测的概念及所依据的原理,简述了目前常用的中长期电力负荷预测方法及分析了存在的问题,对一些新的现代负荷预测方法作了归纳说明。【关键词】负荷预测预测方法发展动态1.引言在一定的规划期内,电力系统的负荷水平决定了其发展的规模与速度。因此,中长期电力负荷预测的结果在一定程度上决定了未来规划期内电力系统的发展。当前电力市场正在逐步由卖方市场转向买方市场,过去的以产定销将变成以销定产,生产计划和基建计划的安排都对中长期电力负荷预测提出了更高的要求。本文在介绍电力负荷预测的概念和原理的基础上,把中长期电力负荷预测方法及现在使用的情况和发展趋势作一个简单的叙述和分析。2.负荷预测的概念和原理负荷预测是指在充分考虑一些重要的系统运行特性、增容决策、自然环境和社会影响的条件下,研究或利用一套能系统地处理过去与未来负荷的数学方法,在满足一定精度要求的前提下,确定某特定时刻的负荷数值。负荷预测根据规划目标年限分类,可分为长期预测(指未来10年到20年的负荷预测)、中期预测(指未来5到10年的负荷预测)和近期预测(指5年内的预测)。负荷预测工作是根据电力负荷的发展规律,预计或判断其未来发展趋势和状况的活动。这项活动基于以下的基本原理:(1)可知性原理作为预测的对象,负荷的发展规律、未来的发展趋势和状况是可以为人们所知道的。人们不但可以认识它的过去和现在,而且可以通过总结它的过去和现在而推测其未来。(2)可能性原理事物的发展变化是内因和外因共同作用下的结果。内因的变化及外因作用力大小不同,会使事物的发展变化有多种可能性。所以对某一具体指标的预测往往是按照其发展变化的多样性,进行多方案预测。(3)连续性原理又称惯性原理,是指预测对象的发展是一个连续的过程。其未来发展是这个过程的连续。它强调了预测对象总是从过去发展到现在,再从现在发展到将来。它认为事物发展变化过程中会将某些原有的特征保存下来,延续下去,电力系统的发展变化同样存在惯性,这种惯性是我们进行负荷预测的主要依据。(4)相似性原理在很多情况下,作为预测对象的一个事物,其现在发展过程和发展状况可能与过去另一事物过去一定阶段的发展过程和发展状况相类似,人们可以根据后一事物的已知发展过程和状况,来预测所预测对象的未来发展过程和状况,这就是相似性原理。目前,预测技术中使用的类推法和历史类比法就是基于这个原理的预测方法。(5)反馈性原理反馈就是利用输出返回输入端,再调节输出结果。预测的反馈性原理实际上是为了不断提高预测的准确性而进行的反馈调节。当预测结果和经过一段实践得到的实际值存在差距,可利用这个差距对预测模型进行调节,提高预测的准确性。反馈性预测的实质就将预测的理论值和实际要求相结合,在实践中检验,然后进行修改、调整,使预测质量进一步提高。(6)系统性原理这个原理认为预测对象是一个完整的系统,它本身有内在的系统,它与外界的联系又形成了它的外界系统。这些系统总和构成一个完整的总系统,预测对象的未来发展是系统整体的动态发展,也是整个系统的动态发展和它的各个组成部分和影响因素之间相互作用和相互影响密切相关的。系统性原理还强调系统整体最佳,只有系统整体最佳的预测,才是高质量的预测,才能为决策者提供最佳的预测方案。3.目前常用的中长期电力负荷预测方法及分析在目前的中长期电力负荷预测工作中,比较常用和普遍的有如下几种方法:(1)分产业产值单耗法单耗法即单位产品耗电法,是通过某一单位产品的平均单位产品用电量以及该产品的产量,得到生产这种总产品的总用电量,单耗法需要做大量细致的调查统计工作,但在实际工作中很难对所有产品较准确地求出其单耗,而且工作量太大。(2)电力弹性系数法电力弹性系数是电量平均增长率与国内生产总值之间的比值,该方法旨在分析电力弹性系数有单位国内生产总值电耗之间的关系,根据国内生产总值增长速度结合电力弹性系数得到规划期末的总用电量,同单耗法一样,电力弹性系数法需要做大量细致的统计工作。(3)分区负荷密度法负荷密度预测法是从地区土地面积(或建筑面积)的平均耗电量出发作预测,预测时,先预测出未来某时期的土地面积(或建筑面积)和单位面积用电密度,再乘以面积得到用电量预测值,分区负荷预测法首先根据近年来的发展情况、经济发展目标以及电力规划目标将待预测区域划分成多个功能区,然后

电力系统短期负荷预测方法综述

电力系统短期负荷预测方法综述 本文主要是针对电力系统的短期负荷预测的概念和意义 进行综述,就短期负荷预测的一些特点及其影响预测精度的各方面原因进行总体的分析。在目前的预测方法里,主要有经典的预测方法和传统的预测方法以及智能预测方法和预测新方法。从这些预测方法入手进行综合的应用原理分析,比较其不同预测方法的优点及不足的地方。并且提出了短期负荷预测的精度提升了,不仅在历史的数据上重视了其积累,还应重视在预测的模型选择上要合适,综合型预测模型在未来电力负荷预测方法的必然性。 标签:电力系统短期负荷预测 电力负荷预测在能量的管理系统组成中是极为重要的部分,而短期电力负荷预测则是对几个小时后或是一天、几天的电力负荷值上进行预报。短期电力负荷预测不仅在电力系统安全以及经济的运作下提供了相关保障,还为市场的环境编排高度计划等打下了基础。不过在这个电力生产与消费的日趋市场化下,针对负荷预测的准确及可靠性上也有了更为高的要求,而且就电力系统管理与运行来讲其负荷预测逐渐成为了一个主要的研究领域。预测精度是决定短期负荷预测的作用大小的,所以在短期负荷预测方法研究的重点上是如何对预测精度进行提高。虽然短期负荷预测的研究历史已經很长远了,国内外的学者也对其在方法还有理论方面对于预测模型进行研究工作。当短期负荷出现因素太多的情况下,从而限制了预测方法的范围以及精度。下文针对短期的预测方法展开一个综合性的探析。在研究未来发展方向的同时也为实际情况下短期负荷的预测提供了一个基础。 1 基于短期负荷的预测特点 对于短期电力负荷来讲其预测便是基于在电力负荷以及相关的历史数据对模型进行全面的建立,从而使得新世纪型的电力负荷更具备科学性和全面性。对于短期负荷所面临的事件不确定性以及其随机性,包含了各种特点:①在预测的结果上其短期的负荷存在着一定的不确定性。②不同的负荷预测方法存在相应的条件性。③短期负荷预测在时间上各有不同。④预测的结果包含多方案性。 短期负荷预测精度的影响因素:①以往历史数据。②自然天气情况。③其日期类型。④负荷预测模型。⑤相关社会事件等。 2 简述短期负荷预测方法 短期负荷由于受到来自不同方向的因素影响,面临时间序列问题上其随机的过程表现的很不平稳,就算面临的影响因素包罗万象,不过在这些因素中都存在一个特点那就是有规律性。能够为实际预测打下基础,其短期负荷预测的方法大致分为四类。

电力系统负荷预测

摘要 负荷预测是电力系统规划、计划、用电、调度等部门的基础工作。讨论了年度负荷预测、月度负荷预测和短期负荷预测的特点、成熟 方法,分析了负荷预测问题的各种解决方案,并指出未来的主要研 究方向。根据国内电力系统负荷预测的实践和国外的经验,对我国 开展电力系统负荷预测工作提出了一些建议。 关键词:电力系统;负荷预测;模型;参数辨识 第一章引言 负荷预测是从已知的用电需求出发,考虑政治、经济、气候等相关因素,对未来的用电需求做出的预测。负荷预测包括两方面的含义:对未来需求量(功率)的预测和未来用电量(能量)的预测。电力 需求量的预测决定发电、输电、配电系统新增容量的大小;电能预 测决定发电设备的类型(如调峰机组、基荷机组等)。 负荷预测的目的就是提供负荷发展状况及水平,同时确定各供电区、各规划年供用电量、供用电最大负荷和规划地区总的负荷发展水平,确定各规划年用电负荷构成。 第二章负荷预测的方法及特点 电力系统负荷预测的原理 通常来说预测电力系统负荷最直接最有效的方法是建立一个负 荷模型,该模型有两层含义:一是负荷的时空特性,二是负荷电压和频率特性。对于负荷的时空特性指的是随着时间与空间的不同分布,负荷的分布也会不同。这种负荷模型往往是比较复杂的,研究人员通常是采用负荷时间曲线来描述这种特性。这样负荷曲线以时间为依据,就可以分为日负荷、周负荷、季负荷以及年负荷;如果换成以时空角度为划分依据,则此曲钱又可分为系统、节点和用户三种负荷曲线;若按照负荷的性质来分,负荷曲线又可以分为工业、农业、市政以及生活负荷等。 在一般的安全运行的过程中,负荷模型指的就是未来时空特性,因此也可以将此作为负荷预测模型。通常负荷预测模型包含的内容是非常广泛的,在运行的过程中不仅能进行短期或者实时的负荷预测,还能在规划电力系统时做长期的预测。负荷的预测通常采用的是概率统计,有效地分析工具即为时间序列分析,由于是预测未来的负荷,所以会存在或多或少误差。对于未来负荷预测误差所产生的原因主要是一些不确定的因素与负荷变化的规律不一致,如某些自然灾害可能会导致停电,这样负荷曲线就会在事故时段出现一些突变。此时就不能依靠负荷预测模型所得出得结果了,因为有人的干预。但是也不能因为有不确定因素的存在就全盘否定负荷预测模型计算得出的结果,大多数情况下还是比较准确的。

八大案例深度解析电力大数据应用

八大案例深度解析电力大数据应用 麦肯锡曾有报告预测,在全球范围内,大数据分析方案的广泛使用能够带来每年3000亿美元的电费削减。电力大数据的有效应用可以面向行业内外提供大量的高附加值的增值服务业务,对于电力企业盈利与控制水平的提升有很 高的价值。有电网专家分析称,每当数据利用率调高10%,便可使电网提高20%~49%的利润。 电力行业的数据源主要来源于电力生产和电能使用的发电、输电、变电、配电、用电和调度各个环节,可大致分为三类:一是电网运行和设备检测或监 测数据;二是电力企业营销数据,如交易电价、售电量、用电客户等方面数据; 三是电力企业管理数据。通过使用智能电表等智能终端设备可采集整个电力系统的运行数据,再对采集的电力大数据进行系统的处理和分析,从而实现对电网的实时监控;进一步结合大数据分析与电力系统模型对电网运行进行诊断、优化和预测,为电网实现安全、可靠、经济、高效地运行提供保障。 一、电网监测及维护 1.运维监测系统及时反应 Enphase Energy(美国Enphase 能源股份有限公司) Enphase Energy每天从来自80个不同国家25万个系统收集大约2.5TB的数据。这些数据可以用来检测发电和促进远程维护、维修来确保系统无缝运行。另外,Enphase Energy还利用从发电系统收集到的数据来监测、控制或调整网络中的发电和负载状态,在电网和在出错或需要升级时做出相应的反应。 2.设备检修运维专题分析

电力企业可以基于永洪自研发的一站式大数据分析平台开展各业务领域的深度分析,如在电网检修运维领域,通过对电力设备资产管理、设备运检管理、设备技术管理、技改大修管理等方面,从安全、效益、成本三个方面进行关键 指标选取,分析检修管理中“安全”、“效益”、“成本”三者之间的相互影响,协调 三个因素综合最优,同时实现对电网企业检修指标的实时在线监控,为公司检修策略制定提供指导和服务。 (图中分析场景所用的数据为测试数据) 3.预防基础设备故障导致的停电 American Electric Power Co., Inc. (AEP)(美国电力有限公司) 在AEP的资产健康中心,数据分析师把设备派生的运行信息和智能信息应 用程序结合在一起。通过采用大数据算法和分析软件,他们可以密切监测传输基础设施的运行情况。 如今,AEP使用智能电表、通信网络和数据管理系统得到稳健的常规信息。 智能电网技术使客户更有效地用电和合理管理用电成本,收集到的数据也有助于该公司为客户定制电力管理程序和提供个性化定制服务。

电力负荷预测方法

1.负荷预测分类和基础数据处理 负荷预测及其分类 负荷预测概念 负荷预测是根据负荷的历史数据及其相关影响因素,分析负荷的变化规律,综合考虑影响负荷变化的原因,使用一定的预测模型和方法,以未来经济形势、社会发展、气候条件、气象因素等预测结果为依据,估计未来某时段的负荷数值过程。 负荷预测的分类 按照预测方法的参考体系,工程上的负荷预测方法可分为确定性预测方法、不确定预测方法、空间负荷预测法。 确定性:把电力负荷预测用一个或一组方程来描述,电力负荷与变量之间有明确的一一对应关系。 不确定性:实际电力负荷发展变化规律非常复杂,受到很多因素影响,这种影响关系是一种对应和相关关系,不能用简单的显示数学方程描述,为解决这一问题,产生了一类基于类比对应等关系进行推测预测负荷的不度额定预测方法。 空间负荷预测:确定和不确定负荷预测是对负荷总量的预测。空间负荷预测是对负荷空间分布的预测,揭示负荷的地理分布情况。 负荷预测的基础数据处理 负荷预测的基础数据 基础数据大致包括四类,分别为:①负荷数据(系统、区域、母线、行业、大用户的历史数据;负荷控制数据;系统、区域、大用户等的最大利用小时数;发电厂厂用电率和网损率。)②气象数据(整点天气预报;整点气象要素资料;年度气温、降水等气象材料。)③经济数据和人口(区域产业GDP;城乡可支配收入;大用户产量、产值和单耗;电价结构和电价政策调整;城乡人口。)④其他时间(特殊时间如大型会议、自然灾害;行政区域调整)

数据处理 为获得较好的预测效果,用于预测数据的合理性得到充分保证,因此需要对历史数据进行合理性分析,去伪存真。最基本要求是:排除由于人为因素带来的错误以及由于统计口径不同带来的误差。另外,尽量减少异常数据(历史上突发事件或由于某些特殊原因会对统计数据带来宠大影响)带来的不良影响。常见的数据处理方法有:数据不全、数据集成、数据变换和数据规约等。 2.确定性负荷预测方法 经验技术预测方法 专家预测法 专家预测发分为专家会议发和专家小组法。会议发通过召集专家开会,面对面讨论问题,每个专家充分发表意见,并听取其他专家意见。小组法以书面形式独立发表个人见解,专家之间相互保密,最后综合给出预测结果。 类比法 类比法是将类似失误进行分析对比,通过已知事物对未知事物做出预测。例如选取国内外类似城市或地区为类比对象,参考该对象的发展轨迹对本地区作出预测。 主观概率发 请若干专家来估计某特定时间发生的主观概率,然后综合得出该时间的概率。 经典技术预测方法 单耗法 通过某一工业产品的平均单位产皮用电量以及该产品的产量,得到生产这种产品的总用电量。 用电量A=国民生产总之或工农业总产值b*产值单耗g

中长期电力负荷预测研究

存档编号 XXOO!大学毕业设计 题目电力系统中长期 负荷预测研究 学院电力学院 专业热能与动力工程 姓名VVBB 学号200907925 指导教师HHJJ 完成时间2013年5月25日 教务处制

独立完成与诚信声明 本人郑重声明:所提交的毕业设计(论文)是本人在指导教师的指导下,独立工作所取得的成果并撰写完成的,郑重确认没有剽窃、抄袭等违反学术道德、学术规范的侵权行为。文中除已经标注引用的内容外,不包含其他人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律后果由本人承担。 毕业设计(论文)作者签名:指导导师签名: 签字日期:签字日期:

毕业设计(论文)版权使用授权书 本人完全了解KKJJ大学有关保管、使用毕业设计(论文)的规定。特授权华北水利水电大学可以将毕业设计(论文)的全部或部分内容公开和编入有关数据库提供检索,并采用影印、缩印或扫描等复制手段复制、保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交毕业设计(论文)原件或复印件和电子文档(涉密的成果在解密后应遵守此规定)。 毕业设计(论文)作者签名:导师签名: 签字日期:签字日期:

目录 摘要 (1) 第一章绪论 (3) 1.1中长期负荷预测研究背景和意义 (3) 1.2负荷预测的基本原理 (4) 1.3负荷预测的方法及特点 (5) 1.4研究现状 (8) 1.5目前存在的问题 (8) 1.6本文的主要工作 (9) 第二章负荷预测的方法 (10) 2.1负荷预测的分类 (10) 2.2负荷预测的特点 (11) 2.3影响中长期负荷发展的因素 (12) 2.4负荷预测的误差分析 (13) 2.4.1产生误差的原因 (14) 2.4.2预测误差分析 (14) 第三章回归分析基本理论及预测模型 (16) 3.1回归分析的基本思想 (16) 3.2回归分析的基本原理与方法 (16) 3.2.1基本原理 (16) 3.2.2基本方法 (16) 3.3回归分析步骤 (17) 3.4实例分析 (18) 第四章灰色系统的基本理论及预测模型 (22)

浅析电力系统负荷预测方法

浅析电力系统负荷预测方法 发表时间:2017-10-18T18:11:03.780Z 来源:《电力设备》2017年第15期作者:梅宇1 杨畅1 徐明虎2 陈斯斯1 王硕1 [导读] 摘要:电力工业是国家在能源领域的重大基础行业,电力是国民经济的命脉,经济要发展,电力是先行,电力对于我国经济建设、国家安全、社会稳定、生活质量具有至关重要的作用,现代文明社会已经处处离不开电力供应。 (1.国网辽宁省电力有限公司检修分公司辽宁锦州 121013;2.国网辽宁省电力有限公司技能培训中心辽宁锦州 121000)摘要:电力工业是国家在能源领域的重大基础行业,电力是国民经济的命脉,经济要发展,电力是先行,电力对于我国经济建设、国家安全、社会稳定、生活质量具有至关重要的作用,现代文明社会已经处处离不开电力供应。负荷预测是目标网架规划的基础,提高负荷预测准确率,对电网发展的具有十分重要的意义。 关键词:负荷预测;电力系统;方法探讨 引言 电力工业是国家在能源领域的重大基础行业,电力是国民经济的命脉,经济要发展,电力是先行,电力对于我国经济建设、国家安全、社会稳定、生活质量具有至关重要的作用,现代文明社会已经处处离不开电力供应。目标网架是城市电网规划的基础,确定电网发展的方向和目标,是近期规划和中长期规划的重要依据。为了提高电网规划方案的可行性,必须将城市电网目标网架规划纳入城市整体规划。负荷预测是目标网架规划的基础,提高负荷预测准确率,对电网发展的具有十分重要的意义。 一、电力系统负荷预测的特点 1、电力系统中的负荷一般分为城市的民用负荷、商业的负荷、农村的负荷、工业的负荷和其他的负荷等,不同类型的电力系统负荷会具有不同特点及规律。城市的民用负荷大多来自城市的居民家用电器的用电负荷,它有年年不断增长的趋势,并且随着季节的变化而变化,但民用的负荷还是和居民日常的生活及工作规律相关较为紧密。 2、商业的负荷,主要是指商业用电中的用电负荷,它覆盖的面积大,而且用电量增加的速度的平稳,商业的负荷同样也具有根据季节变化的波动特性。即使它在电力的负荷中占的比重不如工业负荷及民用负荷,但是商业负荷中的照明类的负荷占用了电力系统用电高峰时段。除此以外,商业部门因为商业行为会在节假日里会增加营业时间,因此成为节假日里影响电力负荷重要的因素之一。 工业负荷是指用在工业生产的用电负荷,一般的工业负荷比重在用电负荷里构成中居于第一位,它不仅仅由工业里负荷端的使用情况决定(也包括负荷的利用情况、企业工作班制度等),而且它和各个行业的特性及季节里的因素都有非常密切的联系,一般的负荷还是比较稳定的。 3、农村的负荷是指农村里居民用电及农业里生产的用电。这类负荷和工业里的负荷相比较,受到季节等其他自然环境的影响非常大,它是由于农业生产特点来定性的,农业的用电负荷同时也受到农产品的品种、耕种特点的影响,但是就电网系统而言,因为农业的用电负荷的集中时间和城市的工业的负荷使用高峰时间有很大差别,所以对于提高电网的负荷率很有好处。 从以上的分析可以发现电力的负荷特点是常常变化的,不仅按照小时变化、按日变化,而且还按周变化,按年变化,同时电力负荷又是以小时作为基本单位不断发生变化的,它具有很大的周期性,负荷的变化是个连续发展变化的过程,在正常的情况下,它不会产生大的跳跃,但是电力的负荷对于季节等因素是十分敏感的,在不同的季节,不同的地区的气候和温度的变化都将会对电力负荷造成十分重要的影响。 4、负荷预测目的是根据电力负荷的发展状况和水平,同时也确定各个供电公司计划的年供用总值,供用最大的电力负荷与规划的地区的总共负荷的发展水平,是由各规划的年用电负荷构成。它将为经济合理准确地安排各个电网内部的机组启停和检修,保持电网的运行安全和稳定性,电网发展的速度,电力的建设规模,电力工业的布局,能源资源的平衡,电力余缺的调剂和电网的资金以及人力资源需求和平衡等各个方面提供十分可靠的依据。 二、负荷预测的方法及特点 1、单耗法 按照国家安排的产品产量、产值计划和用电单耗确定需电量。单耗法分"产品单耗法"和"产值单耗法"两种。采用"单耗法"预测负荷前的关键是确定适当的产品单耗或产值单耗。从我国的实际情况来看,一般规律是产品单耗逐年上升,产值单耗逐年下降。单耗法的优点是:方法简单,对短期负荷预测效果较好。缺点是:需做大量细致的调研工作,比较笼统,很难反映现代经济、政治、气候等条件的影响。 2、趋势外推法 当电力负荷依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,就可以用时间t为自变量,时序数值y为因变量,建立趋势模型y=f(t)。当有理由相信这种趋势能够延伸到未来时,赋予变量t所需要的值,可以得到相应时刻的时间序列未来值。这就是趋势外推法。应用趋势外推法有两个假设条件:①假设负荷没有跳跃式变化;②假定负荷的发展因素也决定负荷未来的发展,其条件是不变或变化不大。选择合适的趋势模型是应用趋势外推法的重要环节,图形识别法和差分法是选择趋势模型的两种基本方法。 外推法有线性趋势预测法、对数趋势预测法、二次曲线趋势预测法、指数曲线趋势预测法、生长曲线趋势预测法。趋势外推法的优点是:只需要历史数据、所需的数据量较少。缺点是:如果负荷出现变动,会引起较大的误差。 3、弹性系数法 4、空间负荷密度法 空间负荷预测是对规划区域内负荷的地理位置和数值大小进行的预测,它提供未来负荷的空间分布信息。只有确定了配电网供电区域内未来负荷的空间分布,才能对变电站的位置和容量,主干线的型号和路径,开关设备的装设以及它们的投入时间等决策变量进行规划。由于空间负荷预测涉及大量的空间信息,地理信息系可以为空间负荷预测的数据收集、处理和预测结果的表示提供一个良好的平台。将GIS 引入空间负荷预测,可以极大地减少数据收集量,是空间负荷预测方法实用化的必要步骤。针对国内土地使用的实际情况,在空间负荷预测中采用了分类分区法,该方法是在分类负荷总量预测的基础上,根据城市规划用地图,计算分类负荷平均密度;再由小区面积构成、小区负荷同时率及修正系数求得小区最终负荷。同时,就分类分区法在预测过程中存在的一些问题进行了恰当的处理和改进。针对己有负荷预测软件在数据收集、统计,模型、方法选用,结果处理等方面存在的问题,在将传统、实用的常规预测方法用计算机加以实现的同时,

电力系统负荷预测的综合模型

电力系统负荷预测重要的组成部分就是序列量,其中序列量包含最大负荷数值以及电量数值等成分,当前得到社会各界广泛认可的是采用多样性的方法完成序列量的预测。首先要设定具体的条件,然后在该条件下进行一定的假定,然后通过单一的方法对包含的多个不确定因素进行分析,由于采用的方法较为单一,因此最后得到的参数与理想数值存在较大差别,因此需要进行修正,通常采用的是多种方法进行预测分析。实验过程中,采用不同的研究方法得到的分析结果也是不同的,各个数据之间具有较大的差异[32],那种预测结果最为接近真实情况,与预测人员的经验以及日常积累的常识等存在密切联系,此外还要综合考虑国家各项能源政策以及产业结构之间的关系,根据当地的经济发展状况,使用综合方法,对相关的数据进行分析预测,然后完成对比分析,从而得到最终的参数。还有一种常用的负荷预测模型是加权处理,使用多种方法完成历史序列等数据的分析和预测,通过一定的方式完成权重的设置,最后对获得的数据进行综合判断出来,得到最终分析数据。 首先,针对使用到的序列预测方法,做如下定义: 定义1:有关预测、推理及拟合序列: 当获得某一物理量后,在要求的历史时间段范围内如n t ≤≤1的取值分别为 n x x x ,,,21 对于未知时段N t n ≤≤+1范围内进行预测分析,可以得到如下预测公式: N n t t S f x t 2,1),,(?== 其中,预测模型的参数向量的数值用S 表示,例如当预测模型为线性状态时, 则有:T t b a S t b a t t S f x ],[,),,(?=?+==有 此时可以计算得到各个时段的预测数值大小,分别为N n n x x x x x ?,?,?,,?,?121 +,此时会将序列n x x x ,,,21 称为原始数列,n x x x ?,,?,?21 为原始数列的预测序列,在未来的某个时段得到的相对应的子虚列N n x x ?,?1 +称为原始序列的推理数列。相应 的拟合时段主要指的是时段n t ≤≤1这一段范围,推理时段主要指的是时段N t n ≤≤+1这一段范围。 定义2:拟合残差、方差以及协方差 采用m 种方法对原始数列的数值n x x x ,,,21 进行预测分析,其中的第i 中预 测方法对原始序列的拟合序列为n x x x ?,,?,?21 ,因此能够得到有关拟合残差的数值 大小:

电力大数据应用现状及多源异构数据分析技术研究

龙源期刊网 https://www.360docs.net/doc/197984614.html, 电力大数据应用现状及多源异构数据分析技术研究 作者:马平徐伟东沈浩钦吴杭 来源:《中国科技纵横》2014年第23期 【摘要】智能电网运行、检修和管理过程中会产生海量异构、多态数据,如何将它们进行高效可靠存储,并实现快速分析访问已是当前电力系统中重要的研宄课题。本文在分析电力生产各个环节大数据的产生来源和特点基础上,阐述市场已有大数据技术在电力系统应用的优势和不足。最后,从电网异构多源信息融合及可视化方向提出了一种应用方法。 【关键词】智能电网 ;大数据 ;异构分析 ;可视化 1 引言 近年来,随着全球能源问题日益严峻[1],世界各国都开展了智能电网的研究工作。智能 电网的最终目标是建设成为覆盖电力系统整个生产过程,包括发电、输电、变电、配电、用电及调度等多个环节的全景实时系统。而支撑智能电网的基础是电网大数据全景实时数据采集、传输、存储以及快速分析。目前智能电网中的大数据主要来自以下几个方面: (1)海量电网状态信息采集设备。常规的调度自动化系统含数十万个采集点,配用电、数据中心将达到百万甚至千万级。需要监测的设备数量巨大,每个设备都装有若干传感器,构成了一个庞大的数据网。 (2)高频电网状态信息捕获技术。为满足上层应用需求,设备的采样频率逐渐提高。在输变电设备状态监测系统中,为了能对绝缘放电等状态进行诊断,信号的采样频率必须在 200kHz以上,特高频检测需要GHz的采样率。 (3)视频及模式识别系统推广。智能电网视频监控系统不仅要求能够真实地反映电力系统的情况,并且还需自动判断情况的好与坏,同时自动采取相关措施,是一个“会思考”、“能做事”的智能化系统。为此,需要电网具备强大存储及处理能力。 2 现有大数据处理技术局限性 谷歌公司提出的分布式文件系统(distributed file system,DFS)和MapReduce技术,已成为现阶段Facebook、雅虎等网络公司大数据应用的解决方案[2]。 DFS技术,具备高容错性特点,可部署在海量且价格低廉的硬件设备上,而且它为应用程序提供了高吞吐量的数据访问,适合那些有着超大数据集程序。MapReduce为2004年由谷歌公司提出的一个用来进行并行处理和生成大数据集的并行编程模型。应用“解析器”,将复杂数

电力负荷预测方法

电力负荷预测方法 发表时间:2018-08-02T15:26:39.817Z 来源:《电力设备》2018年第11期作者:刘自伟[导读] 摘要:电力设施是国家的基础设施,是国家经济发展不可缺少的基础条件。(韶关新丰供电局广东新丰 511100) 摘要:电力设施是国家的基础设施,是国家经济发展不可缺少的基础条件。随着经济的不断发展,珠三角的产业转移的趋势,电力设施配套建设已成为地区经济发展的关键。准确的电力负荷预测为电网规划提供强有力的依据,不仅可以获得巨大的社会效益,也可以获得巨大的经济效益。 关键词:电网规划;负荷预测;预测方法 1 序言 近年来,新丰经济的不断发展,珠三角的产业转移。为承接好珠三角产业转移,做好电力先行,准确地进行负荷预测十分重要。 2 负荷预测 电网规划很重要的一步就是电网负荷预测,电网负荷预测是安排电网基本建设项目的依据,确定了规划时期内的负荷水平也就确定了电力发展的速度;中、长负荷预测用来初步电源规划,而近期预测用来进一步确定变电站的容量。负荷预测是从已知的经济、社会发展和电力需求情况出发,通过对历史数据的分析和研究,对电力需求作出预先的估计和推测。根据这些预测结果,可以针对性地采取技术措施,如进行可中断负荷控制,增添低谷用电设备、采用蓄冷蓄热技术等,改变电力需求在时序上的分布,将用户的电力需求从电网高峰消减、转移或增加电网低谷期的用电以期提高系统运行的经济性和可靠性,在规划的电力网中还可以减少新增装机容量和节省电力建设投资,从而降低预期的供电成本。负荷预测的方法很多,主要有:综合产值单耗法、弹性系数法、时间序列法、参数回归法、比例系数增长法和经济模型预测法。 3 方法简介 3.1原始资料 3.1.1某县配电网装变容量 至2010年4月底,该县建有高压变电站4座,其中110kV变电站3座、200kV变电站1座:110kV变电总容量为430MV A。200kV变电总容量为360MV A,高压变电站总容量合计790MV A。 表1 某县高压变电站统计表 3.2 综合产值单耗法 3.2.1综合产值单耗法 单耗法是根据第一、二、三产业每单位用电量创造的经济价值,从预测经济指标推算用电需求量,加上居民生活用电量,构成全社会用电量。预测时,通过对过去的单位产值耗电量进行统计分析,并结合产业结构调整,找出一定的规律,预测规划期的一、二、三产业的综合单耗,然后按国民经济和社会发展规划的指标,按单耗进行预测。单耗法需要做大量细致的统计、分析工作,近期预测效果较佳。但在市场经济条件下,未来的产业单耗和经济发展指标都具有不确定性,对于中远期预测的准确性难以确定。 3.2.2计算过程 根据原始资料的数据对该县未来的负荷进行预测,其过程如下:先算出2010-2016年国内生产总值,设国内生产总值为T 亿元 亿元 亿元 亿元 再算出2007-2009各年的综合单耗

电力负荷预测的要求

电力负荷预测是电力系统规划的重要组成部分,也是电力系统经济运行的基础,其对电力系统规划和运行都极其重要。 电力负荷预测包括两方面的含义,即用以指安装在国家机关、企业、居民等用户处的各种用电设备,也可用以描述上述用电设备所消耗的电力电量的数值。 电力负荷预测是以电力负荷为对象进行的一系列预测工作。从预测对象来看,电力负荷预测包括对未来电力需求量(功率)的预测和对未来用电量(能量)的预测以及对负荷曲线的预测。其主要工作是预测未来电力负荷的时间分布和空间分布,为电力系统规划和运行提供可靠的决策依据。 电力负荷预测的影响因素 在电力负荷预测中,很多因素不同程度地影响着电力荷的预测值。有些因素因自然而变化,比如气象。有些因按地区条件产生差异,如工农业发展速度;有些因素是无估计的重大事件,如严重灾害等,并且各个因素对负荷的响可能是不一样的,而且同一因素的不同水平对负荷的影也是不同的[1]。 1.气象因素的影响,很多负荷预测数学模型都引入了气象部门提供的气象预报信息,包括温湿度、雨量等在内的气象因素都会直接影响负荷波动,尤其在居民负荷占据较高比例的地区,这种影响更大。 2.节假日及特殊条件的影响,较之正常工作日,一般节假日的负荷都会明显降低,以春节为例,春节期间的负荷曲线一般会出现大幅度的下降变形,而其变化周期也大致与假日周期吻合。 3.大工业用户突发事件的影响对于大工业用户装接容量占用电负荷较高的地区,大工业用户在负荷预测偏差中起到的影响作用也比较大。 4.负荷特性分析和预测方法的影响目前,由于很多地区在负荷种类结构以及变化因素上的统计分析工作不够深入系统,导致在需要历史数据进行对照时无法展开工作,对于负荷特性和相关变化规律的总结也就无从谈起。 5.管理与政策的影响负荷预测是一项技术含量很高的工作,然而负荷预测工作在很多地区还没有得到足够的重视,基础工作薄弱,考核标准过于宽松,与大用户的信息沟通不畅,大用户的用电缺乏计划性和有序性;预测人员缺乏良好的综合素质、较高的分析能力和丰富的运行经验,不适应高标准工作的要求。

相关文档
最新文档