城市燃气负荷离群数据的挖掘及分析

合集下载

燃气负荷

燃气负荷
对于燃气学科的工程技术分析,燃气负荷也是基础性的。在进行工程技术问题分析时,往往要将其放在用气 工况的背景下进行研究。例如对液化石油气瓶组供气的技术分析,对输配系统的有效性的分析等。
负荷与应用
燃气终端用户在一段时间内对燃气的需用即形成燃气负荷。燃气负荷的因次是[体积] [时间]。燃气负荷和 时间一般都以离散形式取值。燃气负荷在一个时段内随时间的变化即称为燃气需用工况。燃气需用工况的表象即 用气不均匀性。在一段时间内燃气负荷的累积值即用气量,用气量大小的原始表述就是用气量指标(常采用热量单 位)。一般,往往将需用量也称为燃气负荷。
存在问题
在我国,多年来从教科书到一般工程运用,燃气负荷问题一般局限于确定用气量指标与用气不均匀系数(用气 工况)等。
用气量指标定义为单个居民或单位设施年耗气量(耗热量)。而用气工况用月不均匀系数、日不均匀系数以及 小时不均匀系数由按时间序列排列的离散的标准化的一系列数值给出。或者只用其峰值即月高峰系数、日高峰系 数、小时高峰系数表示。对用气量指标一般结合燃气工程的规划或项目的可行性研究进行确定,采用简单的算术 的统计方法,采集部分数据加以整理,针对工程项目的具体情况对影响用气量指标的因素作定性评估,制订出用 气量指标。这些数据的积累又可能编入各种手册资料,转而形成以后工程设计的参考依据。
研究意义
在任何工程技术中,负荷都是最基础性的数据。燃气负荷也不例外。在燃气系统中,燃气负荷数据(负荷大小 和负荷的变化形态)对项目规划、工程设计中设施和设备容量的确定、运行与调度以及工程技术分析都有根本的意 义。
最常用的燃气负荷的数据是其总量、幅值和时间序列变化。在城镇燃气规划、设计中需要年供气总量基础数 据,以便确定系统的配置规模,计算项目的经济性和确定建设所需资金。在工程项目的设计阶段,燃气负荷是各种 计算的基础,传统的燃气负荷有关指标有用气量指标和代表用气不均匀性的高峰系数(月、日、小时高峰系数)。 在长输管线设计和计算中,根据用气负荷的逐时变化数据对长输管道进行不稳定工况计算和分析。

城市燃气负荷影响因素及预测方法分析

城市燃气负荷影响因素及预测方法分析

城市燃气负荷影响因素及预测方法分析摘要:城市燃气负荷预测的方法,在输气管道工程中的体现最为明显,不仅表现在对负荷预测手段的应用中,更是不断推进城市燃气负荷预测分析的内在表现形式与手段的重要方向。

其中关于城市燃气负荷预测方法在研究中,发展城市燃气负荷预测内容是改进社会经济的重要途径,也是实现城市燃气负荷预测方向中最为基础的发展方向,是推进城市燃气负荷预测方法的手段实行,这是改进我们国家社会经济建设在整个燃气事业中的前进目标,也是不断推进社会经济发展的有效手段。

关键词:城市燃气;负荷影响因素;预测方法1燃气负荷的概念及分类城市燃气指的是在一定的时间段内城市内所使用的天然气总量,因此,燃气负荷是一个城市发展水平的衡量标准之一。

一般来说,城市燃气负荷主要由两部分组成,分别城市对天然气的需求量以及过去一段时间内城市天然气的使用量,因此,城市燃气负荷主要是呈现一种离散态势。

由于城市燃气将随着时间的变化而产生变化,因此,城市对天然气的需求量表现出了城市的用气不均匀性。

目前,城市燃气负荷主要以三种形式呈现,分别是用气总量、用气时间变化以及用气幅值变化。

2影响燃气负荷的相关因素2.1温度因素一般来说,温度是影响城市燃气负荷的主要因素。

夏季温度较高时,居民并不需要采暖用气,所以用气量较低,而冬季需要采暖用气,所以用气量相对较高。

目前的研究成果表明,日平均温度每降低1℃,则城市燃气用量将提高5%左右。

2.2空气因素影响城市燃气负荷的空气因素主要可以分为两个方面,分别是空气湿度和空气质量状况,目前,较为成熟的燃气负荷预测方法中都将这两种因素考虑在内,但是这两种因素如何对燃气负荷产生影响以及影响程度如何并没有明确的研究成果。

2.3人口规模一般情况下,随着城市人口规模的不断增加,燃气负荷会随着增加。

人口规模可以分为两个方面,分别是人口自然增长状况以及人口迁移状况。

其中,由于我国现阶段的人口自然增长率相对较低,所以此方面的因素并不会对燃气负荷产生较大影响;人口迁移对燃气负荷的影响较大,周内人口从郊区涌现城市,燃气负荷增加,周末人口从城市涌向郊区,所以燃气负荷可能会呈现降低趋势。

城市燃气用气负荷预测及调峰储气与研究论文

城市燃气用气负荷预测及调峰储气与研究论文

国燃气事业发展极其缓慢。

最近几年,随着石油的短缺,圈家开始重视天然气行业,我国的燃气事业开始了快速的发展。

西气东输工程的完成,陕京复线的竣工等等,所有这些都在蜕明一个问题,即我国的天然气行jIk正处丁大好的历史发展时期。

从下面对哈尔滨市的用气结构的分析中,我们不难得出这一结论。

哈尔滨市的城市用气存在多种气体并存的局面,其中有煤气、天然气、液化石油气等,由于煤气的热值较天然气低,而且煤气对火气的污染又较重,远没有天然气清洁。

因此,近几年天然气获得很大的发展。

在城市目前的用气结构中,煤气所占的份额在减少,而天然气所占的份额却在急速的上升。

哈尔滨市2001年煤气的用量为289586KNm3,天然气的用量为6451.977KNm3,液化石油气的用量为24366.21T,如果按热值计算(煤气热值为3700Kcal/Nm3,天然气热值为8100Kcal/Nm3,液化石油气的热值为10816Kcal/kg)其构成比例见图2.7。

哈尔滨市2003年煤气的用量为329120KNm3,天然气的用量为6448525KNm3,液化石油气的用量为79998T,按热值计算其构成比例见图2—8。

通过图可知,2001年哈尔滨市的煤气、天然气、液化石油气所占的比重分别为77.24%、3.77%、19%。

而2003年煤气、天然气、液化石油气所占的比重分些为2.24%、96.17%、1.59%。

可见,天然气的用量和比重都在急剧的增加。

虽然煤气的比重在减少,但是,煤气的用量却在增加。

液化石油气的用量也在增加而所占的比重在减少。

幽2—72001年哈尔滨市三种燃料的比例2-7Proportionofthreekindsoffuelsin2001inHarbinFigure图2-82003年哈尔滨市三种燃料的比例Figure2-8Proportionofthreekindsoffuelsin2003inHarbin6、燃气价格的影响价格影响供求,燃气的价格在很大程度上能决定它的用户数量。

城市天然气负荷预测及调峰方案研究

城市天然气负荷预测及调峰方案研究

城市天然气负荷预测及调峰方案研究煤、石油等固态化石能源应用引起的碳排放、环境污染等问题日趋严重。

天然气燃烧具有热值高、洁净、无废水、无废渣等优势,在国家节能减排政策的号召下,清洁能源天然气得到了人们的普遍关注。

“西气东输”、“川气东送”等国家重大天然气管网工程的建设及运营使各城市原来的单一天然气管网逐步形成全国性的大天然气管网,显然,这一变化将对上游生产能力、中游管网输送能力、下游城市管网配气能力、储气设施储气能力、城市天然气调峰及调度等提出了更高的要求。

与此同时,当城市到了用气高峰期,由于用气量较大,出现了“无气可用”的问题。

解决城市“气荒”问题,可从两个角度进行,一是从“供气方”角度,二是从“用气方”角度。

本文的研究是从“用气方”角度,即单一城市自身建设调峰设施,以达到“削峰填谷”的目的。

从“用气方”角度主要是从城市所需天然气“负荷”(也可以表述为“需求量”、“用气量”,本文进行研究时均称“负荷”)角度,确定了城市天然气负荷后,在此基础上进行调峰方案的制定及决策。

本文针对“用气方”的调峰方案决策方法适用于任何未建设或部分建设调峰设施的大、中及小城市。

具体的研究工作和主要结论如下:(1)本文研究的是城市天然气负荷预测,在此基础上进行调峰方案决策的问题,因此,首先分析了城市时、日及年负荷的特性,对目前城市天然气采用的调峰方式进行分析。

结果表明:城市天然气时负荷具有明显的周期性、日负荷具有明显的非线性、年负荷具有单调递增性;城市调峰单独采用高压管道调峰和高压管道-LNG(液化天然气)联合调峰是一种发展趋势,储气罐调峰逐渐被取代,以此作为城市天然气负荷预测模型和调峰方案决策研究的基础;(2)提出了基于小波理论和RBF(径向基函数)-Elman神经网络的城市天然气时负荷预测模型。

首先,采用小波分解对时负荷时间序列进行分解;其次,应用RBF对高频分量进行预测,运用Elman对低频分量进行预测;最后,小波重构。

对城市燃气短期负荷预测的分析

对城市燃气短期负荷预测的分析

对城市燃气短期负荷预测的分析作者:侯磊来源:《中国化工贸易·上旬刊》2019年第03期摘要:在燃气公司市场化运行模式下,做好燃气短期负荷预测工作十分重要,是帮助企业合理降低运营成本的关键途径。

文章首先对城市燃气短期负荷变化的主要影响因素进行分析,进而通过构建燃气短期负荷预测模型,对城市燃气的短期负荷变化进行预测,给出具体的实现算法。

关键词:城市燃气;短期负荷;预测分析1 城市燃气短期负荷变化的主要影响因素从目前已有的几种城市燃气短期负荷预测模型来看,多元线性回归方程的预测精度较高,计算过程完全由计算机软件完成,使用也较为方便。

但是由于未加入季节差的考虑,容易在温度影响分析的过程中出现问题。

人工神经网络预测模型具有较好的逼近效果,但由于预测过程属于“黑箱”操作,难以利用预测过程中的信息数据。

总体来看,目前城市燃气短期负荷预测模型各有各的优缺点,在构建新预测模型的过程中,还需要从城市燃气短期负荷变化的影响因素分析着手,确保模型的适用性。

从实际情况来看,我国绝大多數的大中型城市已经建立了完善的燃气供应体系,在分析燃气短期负荷变化的过程中,也较为全面。

其中,温度是影响燃气负荷变化最主要的因素,燃气负荷变化和日平均温度变化存在显著的反向相关性。

可以以此为着手点,建立燃气短期负荷变化的预测分析模型。

2 城市燃气短期负荷的预测模型及方法2.1 日负荷模型在城市燃气短期负荷预测模型的构建过程中,需要充分考虑燃气负荷变化受热惯性的影响,在根据日平均温度变化预测燃气负荷变化时,加入动态平均温度、有效温度两个指标。

其中,动态平均温度的计算公式为:其中n取3~5,i代表预测目标前一天,Ti为日平均温度。

有效温度的计算公式为:Teff=wT+(1-w)Tn其中w为权重因子,其取值范围为0~1。

通过对某北方城市近三年燃气负荷变化数据及气象数据进行研究,可以建立燃气日负荷、日平均温度、动态平均温度和有效温度之间的关系。

城市燃气管网用气不均匀性分析及负荷预测的开题报告

城市燃气管网用气不均匀性分析及负荷预测的开题报告

城市燃气管网用气不均匀性分析及负荷预测的开题报告题目:城市燃气管网用气不均匀性分析及负荷预测一、研究背景及意义随着城市化进程不断加快,城市居民的需求量不断增加,城市燃气消费也在逐年增长。

然而,城市燃气供应面临的一个重要问题就是用气不均匀性。

由于城市居民的用气需求存在明显的时空分布差异,特别是在冬季采暖期,部分区域的用气负荷会突然激增,而另一些区域则不受影响,这给燃气供应带来了很大的挑战。

因此,针对城市燃气管网用气不均匀性的研究和负荷预测具有很大的实际意义。

首先,可以帮助燃气运营企业科学调配资源,优化供应,提升供气能力和运行效率;其次,可以提高城市燃气的安全性和韧性,避免断气事故的发生;最后,还可以降低能源消耗,优化能源结构,推动城市可持续发展。

二、研究内容和方法本研究将通过收集城市燃气用户的用气数据、气象数据以及城市空间数据,综合分析城市燃气用气的时空分布特征,探讨用气不均匀性的原因和影响因素。

然后,将采用基于时间序列分析和数据挖掘技术的方法,对城市燃气负荷进行预测和优化调度,以提高燃气供应的稳定性和可靠性。

具体而言,本研究将开展以下内容:1. 收集城市燃气用户的用气数据和气象数据,并建立相应的数据仓库。

2. 利用空间数据分析工具,对城市燃气用气的空间分布特征进行探索,包括不同地域、不同行业、不同用户类型之间的用气差异性。

3. 运用时间序列分析方法,建立城市燃气负荷预测模型,并对未来一段时间内的燃气需求进行预测。

4. 运用数据挖掘技术,对城市燃气管网的负荷进行优化调度,提高燃气供应的可靠性和稳定性。

三、预期研究成果本研究的预期成果包括:1. 建立针对城市燃气管网用气不均匀性的分析方法和模型,探讨用气不均匀性的原因和影响因素。

2. 建立城市燃气负荷预测模型,提高城市燃气管网的供气能力和运行效率。

3. 提出城市燃气负荷优化调度方案,提高燃气供应的稳定性和可靠性。

四、研究进度计划本研究计划于2021年9月开始,预计2022年6月完成,进度计划如下:第一季度(2021年9月至2021年12月):收集城市燃气用户的用气数据和气象数据,建立数据仓库。

城市燃气负荷预测的研究

城市燃气负荷预测的研究城市燃气负荷预测的研究随着城市化进程的加快和人们对生活质量的要求不断提高,城市的燃气需求日益增长。

合理预测城市燃气负荷,在避免能源浪费和满足居民需求之间找到合适的平衡点,成为了许多研究者关注的焦点。

城市燃气负荷预测是指通过分析历史数据和现有信息,利用数学和统计模型,对未来一段时间内城市燃气需求的数量和趋势进行预测的技术。

这种方法不仅能够帮助燃气公司和相关政府部门进行合理的资源调配和规划,还能够促进燃气供应链的优化和能源消费的合理分配。

城市燃气负荷预测的研究可分为多个方面。

首先,对历史数据进行分析是预测模型的基础。

通过对过去几年的燃气需求数据进行分析,找出其中的规律和趋势,可以为未来的预测提供重要依据。

例如,将历史数据分析后发现,城市燃气需求在冬季明显高于夏季,且在工作日比非工作日要大等。

这种周期性规律的发现,可以帮助预测模型更准确地预测未来的燃气负荷。

其次,利用数学和统计模型进行预测是一种常用的方法。

根据历史数据的分析结果,可以选择适合的模型,如回归模型、时间序列模型等,进行预测。

回归模型可以通过研究燃气需求与各种因素(如气温、人口数量、赛事活动等)之间的关系,进行燃气负荷的预测。

时间序列模型则可以通过对时间序列数据进行建模,找出其中的周期性、趋势性和随机性等特点,进而对未来的燃气需求进行预测。

另外,数据挖掘和人工智能技术的应用也为燃气负荷预测提供了新的思路。

通过采集大量的实时数据,如天气数据、人口数据、燃气使用设备的信息等,利用数据挖掘技术分析其与燃气负荷之间的关系,可以建立更为准确的预测模型。

而人工智能技术,如神经网络和遗传算法等,可以进一步提高预测模型的准确性和稳定性,帮助预测人员更好地预测城市燃气负荷。

此外,城市燃气负荷预测研究还需要考虑到城市发展的可持续性。

在预测过程中,需要综合考虑可再生能源的利用、能源消费的减排和能源供需之间的平衡等方面的因素。

只有在可持续发展的基础上进行燃气负荷预测,才能更好地满足城市居民的需求,并为城市的发展提供可靠的能源保障。

对城市燃气短期负荷预测的分析

对城市燃气短期负荷预测的分析城市燃气短期负荷预测是指通过对城市燃气使用情况进行分析,预测未来一段时间内的燃气需求量,以便合理安排燃气供应,保障城市居民生活和工业生产的需求。

燃气短期负荷预测是城市燃气供应管理中的重要环节,准确的预测可以有效避免供需不平衡、保障用气安全、提高能源利用效率。

本文将对城市燃气短期负荷预测进行分析,探讨其在城市能源管理中的重要性和应用前景。

一、城市燃气短期负荷预测的重要性燃气是城市生活和工业生产中不可或缺的能源,其供需平衡直接关系到城市居民的生活质量和工业生产的正常运转。

燃气短期负荷预测的准确性对于保障燃气供应的连续性、稳定性和安全性至关重要。

其重要性主要表现在以下几个方面:1. 确保用气安全:准确的燃气短期负荷预测可以避免燃气供应不足或过剩的情况发生,从而确保城市居民和企业的用气安全。

2. 提高能源利用效率:通过对城市燃气使用情况进行分析,可以更好地合理规划燃气供应,避免能源的浪费和过度消耗,提高能源利用效率。

3. 优化能源供给结构:燃气短期负荷预测还可以为城市能源供给结构的优化提供重要参考,有利于促进清洁能源的应用和推广,实现能源供给的多样化和可持续发展。

城市燃气短期负荷预测需要基于城市燃气使用的实际情况和历史数据,结合相关的数学和统计方法进行分析和建模。

目前,常用的燃气短期负荷预测方法主要包括时间序列分析法、回归分析法、神经网络模型、灰色预测模型等。

这些方法各具特点,可以根据实际情况进行选择和组合使用。

1. 时间序列分析法:时间序列分析是一种基于历史数据的预测方法,通过对历史数据的趋势、季节性和周期性进行分析,建立合适的数学模型进行未来燃气负荷的预测。

该方法适用于对燃气短期负荷变化规律进行分析和预测。

2. 回归分析法:回归分析是一种建立因果关系的数学方法,通过对燃气使用量与相关影响因素的关系进行建模和分析,可以实现对未来燃气负荷的预测。

该方法适用于对燃气使用量的影响因素进行定量分析和预测。

城镇天然气规划中的燃气负荷指标预测分析

城镇天然气规划中的燃气负荷指标预测分析作者:张军伟来源:《数字化用户》2013年第17期【摘要】在本文中,作为一个完整的应用程序,在时间及燃气分部收购的指标,诚信的天然气负荷预测指数。

如何确定,收集数据,预测提出原则性建议,消费预测的气体的方法,从理论上提出,实际使用的表达自己的意见,现在的预测方法。

【关键词】天然气规划设计燃气负荷预测指标城市基础设施的重要方面,城市规划的框架内是进行了在天然气,城市煤气下,密切相关编写的文本质量和设计燃气和燃气负荷预测指标城市规划你。

为了确定经济分析的能力和技术的燃气负荷预测项目,设施和设备,以及进度和运行,项目设计和数据相同的基本计划的重要性。

燃气负荷预测的方法在本文中,将提出几点意见。

一、燃气负荷预测指标的完整性在规划和设计指标的选择是非常重要的。

每一个指标,有各种各样的角色。

燃气负荷是什么,你必须考虑当你设计吗?不断的设计,会加载天然气两类利益。

角度来看,年用气量,燃气每月消费,日常消费,可以分为气体从时间消耗的时间。

这样设计是为了计算的基本数据,每个数据起着不同的角色。

在实际的设计中,在许多情况下,我都忽略了其完整性。

时间耗气,不是很完整,只有部分是一个技术和经济分析全面的燃气消耗的唯一部分,这是不优选的。

当相关项目,每年的天然气消费,调整源资源,传输和配送系统提供被配置为确定经济规模建设的关键数据的必要的资金和计算项目我可以。

其次,根据不同的用户。

分为生活用气,空调商业用气,工业用气,汽车燃气,供热,天然气分布式能源供应体系或空中,发电,天然气,化工原料气。

大工业用户的天然气消费量必须是不同的列表中,我将解释气体的时间表和天然气的消耗。

燃气负荷预测,请提防泄漏你不这样做。

此外,还预测,考虑到转运交通,必须考虑在相关地域范围内的气体情况编制。

根据规划和设计的实际情况,而不可预知的金额一般不能预测金额的10%,5%。

燃气负荷预测指数,而不是预测的,你必须注意泄漏的完整性。

对城市燃气短期负荷预测的分析

对城市燃气短期负荷预测的分析随着城市的不断发展和人口的逐渐增加,城市燃气的需求也越来越大。

如何准确地预测城市燃气的需求,对于城市燃气公司的运营和管理具有重要意义,因此燃气短期负荷预测是一项非常关键的工作。

燃气短期负荷预测的基本流程是:首先收集相关数据,包括历史数据、天气数据等。

然后通过分析和处理这些数据,建立预测模型,最后利用模型进行短期负荷预测。

在数据收集方面,可以利用传感器和监测设备采集燃气用量和天气数据等。

历史数据是燃气短期负荷预测的重要基础,包括过去一段时间内的燃气用量和天气情况,通过对历史数据的分析可以得到燃气用量与天气因素之间的相关性。

在数据分析方面,需要借助一些统计学方法和数据挖掘技术,例如时间序列分析、回归分析、灰色预测等。

时间序列分析是一种经典的方法,它可以分析历史数据中的周期性和趋势性,并且可以利用历史数据预测未来的燃气负荷。

回归分析是一种常用的预测方法,它可以通过建立燃气用量与天气变量之间的数学模型,进行预测。

灰色预测是一种新兴的方法,它可以补充经典的时间序列方法和统计学方法的不足之处,提高预测的准确性和可靠性。

在模型建立方面,需要根据数据分析的结果建立合适的数学模型。

模型可以是传统的数学模型,也可以是一些新兴的模型,例如神经网络模型、支持向量机模型等。

神经网络模型模拟了人的神经系统的处理过程,它可以自适应地学习和调整模型参数,从而提高预测的精度和可靠性。

支持向量机模型则是一种基于统计学习的方法,它可以在非线性分类和回归问题上进行有效处理,具有较高的精度和泛化能力。

在预测方面,可以利用建立好的模型进行燃气短期负荷预测。

预测结果不仅可以为燃气公司提供重要的决策支持,还可以为用户提供方便的服务,例如用户可以预约添加燃气,以避免燃气短缺。

综上所述,城市燃气短期负荷预测是一项复杂的工作,需要集成多种技术和方法。

通过科学合理的燃气短期负荷预测,可以为燃气公司提供重要的决策支持,并为城市居民提供方便的服务。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

产生的原因 。结合实例, 采用燃气负荷特征曲线法 , 对查找出来的离群点进行修正。 关键词 : 城市燃气负荷; 数据挖掘 ; 离群数据 ; k - 最近邻距离法 中图分类号 : TU996 文献标识码 : A 文章编号: 1000- 4416( 2006) 03- 0014- 03
M ining and Analysis On Stray D ata fO r C ity Gas LOad
[ 3] k k
在某一数据段内只出现一个离群 点 ) , 只需要对该 点数据进行修正, 修正公式如下: X l ( i- 1 ) X l ( i + 1) + X t ( i- 1 ) X t ( i + 1) X r ( i) = X t ( i) 2 式中 X r ( i) & & & 修正后的负荷数据值 X l ( i - 1) & & & 离群数据 X l ( i) 所在序列的前 一点的数据值 X l ( i + 1 ) & & & X l ( i ) 所在序列的后一点的数 据值 X t ( i ) & & & 离群数据X l ( i )所对应的特征曲线 的数据值, 及其前一点与后一点的 数据值 X t ( i - 1 ) & & & X l ( i) 所对应的特征曲线的前 一点的数据值 X t ( i + 1 ) & & & X l ( i) 所对应的特征曲线的后 一点的数据值 若在某一数据段连续出现多个离群点 , 如曲线 X l 的点 p 1 至点 p 2 间出现多个离群数据, 则需要对 该数据段内的所有值都进行修正 , 修正公式如下 : X l ( p1 - 1 ) X l ( p2 + 1 ) + X t ( p1 - 1 ) X t ( p2 + 1 ) X r ( i) = X t ( i) 2 式中 i = p 1, p 1 + 1 , #, p 2 依据以上公式修正后的曲线更符合燃气日负荷 曲线的特征, 即使在偶然情况下有某些正常数据被 误认为是离群数据 , 用上述的方法进行调整后也不 会产生较大的偏差。 2 计算实例 以某城市 2004 年 1 月和 8 月的燃气日负荷数 据为例 (见图 1) , 对其进行离群数据挖掘和燃气负 荷特性分析。
% 14%
第 3期
苗 艳姝 , 等 : 城市燃气负荷离群数据的挖掘及分析
第 26 卷
距离, 记为 D (x p , x i )。将这些距离按照从小到大的 顺 序排 列成一 个集 合 {D ( xp , x 1 ), D ( xp , x 2 ), #, D ( xp , xN - 1 ) }, 则该距离集合中的第 k 个值即为点 x p 的第 k 个最邻近点与点 x p 的距离, 记为 D ( xp ) 。 定义 2 。对于时序数列 X 中的所有点 , 给 定整数 n 和 k, 将所有点的 D ( xp ) 按照从大到小的 顺序排列, 则其中前 n 个点 即为离群点。这样, 用 k k D (x p )作为衡量离群点的度量, D ( xp ) 越大, 则表 示点 xp 邻域内的数据分布点的离群程度越强。 1 3 离群数据的再挖掘 采用数据挖掘查找出燃气负荷时序数列中的离 群点, 这仅仅是研究燃气负荷特性的一种手段 , 不是 最终目的。通过上述的算法识别出离群点后 , 还需 进一步揭示出这些离群点的含义, 即为什么这些点 是离群点, 这些离群点与其他的数据点有何不同, 这 些离群点背后有什么样的潜在有用的信息。因此 , 需要通过离群数据的再挖掘分析燃气负荷的特性 , 这包括以下 3 方面内容: 离群数据的判断。确定离群数据是否确实 是离群数据。 离群数据的分析。由于燃气负荷受到多种 因素的影响 , 如居民生活习惯、 企业生产班次、 节假 日和气候等条件 , 有必要参照这些影响因素对离群 数据进行进一步的判断, 分析离群数据产生的原因。 ! 离群数据集的数据挖掘。对离群数据进行 再挖掘 , 判断其中是否存在潜在有用的信息。 1 4 离群数据的修正和调整 当确定某一数据确实为离群数据后, 需要对其 进行修正, 便于为随后的燃气负荷预测提供准确的 原始负荷数据。本文以燃气日负荷为例, 采用特征 曲线法对查找出来的离群数据进行修正。 特征曲线的获取 采集所分析城市若干年的燃气日负荷数据作为 原始数据, 考虑其特点和趋势, 总结出有代表性一年 的燃气日负荷数据集。以此数据作 为原始采样数 据 , 对其采用 6 次多项式进行数据拟合。采用 6 次 多项式能较好地拟合全年燃气日负荷曲线 , 可将拟 合曲线 作 为燃 气 日 负 荷的 特 征 曲 线, 用 X t 来表 示
( 1)
( 2)
。 离群数据的修正 将存在离群点的燃气负荷时序数列 X l 平移至
图 1 1 月和 8 月燃气日负荷曲线 F ig . 1 Curve O f da ily gas lO ad in Janua ry and( 即 % 15%
第 26 卷 第 3 期 2006 年 3 月
煤气与热力
GA S& H EAT
VO . l 26 NO. 3 M ar . 2006
城市燃气负荷离群数据的挖掘及分析
苗艳姝, 段常贵
( 哈尔滨工业大学 市政环境工程学院, 黑龙江 哈尔滨 150090)
摘 要: 采用 k - 最近邻距离法对燃气负荷时序数列进行离群点的数据挖掘, 分析了离群点
在城市燃气负荷的历史数据中, 常出现一些不 规则的离群数据 , 这些数据的存在会影响燃气负荷 预测的准确性和精确度。进行离群数据的挖掘 , 就 是从大量的数据中, 找出明显偏离其他数据、 不满足 数据的一般模式、 与其他数据不一致的数据。本文 采用 k - 最近邻距离法对燃气负荷时序数列进行离 群数据挖掘 , 分析离群数据产生的原因, 并应用燃气 负荷特征曲线法对离群数据进行了修正。 1 离群数据的挖掘 在大型数据库中, 存在不遵循数据模型普遍规 律的数据, 这些数据和其他数据相比有很大差异, 这 些数据就 称为离 群数据 , 相 应的 数据 点称为 离群 [ 1] 点 。 1 1 离群数据的挖掘方法 基于统计学的方法是假设已知的数据集符 合某种概率分布 , 根据该分布对数据集中的每一个 数据点进行检测。若所得结果与分布不符合 , 就认 为该数据点为离群点。 基于偏差的方法是模拟人类的思维方式 ,
[ 1] M ehm ed K ( 著 ), 闪四清 , 陈茵 , 程雁 , 等 ( 译 ). 数据挖 掘 & & & 概念、 模型 、 方 法和 算法 [ M ]. 北 京 : 清华 大学 出版社 , 2003. [ 2] 郑斌祥 , 杜秀华 , 席裕庚 . 一 种时序数据的离群数据挖 掘新算法 [ J]. 控制与决策 , 2002, ( 5): 324- 327. [ 3] 焦文玲 . 城市燃气 负荷时 序模型 及其预测 研究 ( 博士 学位论文 ) [ D ]. 哈 尔滨 : 哈尔滨工业大学 , 2001. [ 4] 苗艳姝 , 段常贵 , 张淑红 . 数 据挖掘技术在燃气负荷预 测的应用 [ J]. 煤气与热力 , 2005, 25( 11): 1- 4. 作者简介 : 苗 艳姝 ( 1977 博 士研究生 , 的研究。 电话 : ( 0451) 88220369 E - ma il : m iaO yanshu@ sO hu. c Om 收稿日期 : 2005- 06- 02 ; 修回日期 : 2005- 12- 10 ), 女, 辽宁沈阳人 ,
MI AO Y an shu, DUAN Chang gu i
( SchOO l Of M unicip al & E nvirOn m ental Engineering, H aerbin Institu te Of T echnO lOgy, H aerbin Abstract : 150090 , China ) T he data m ining On Outliers O f t i m e series O f gas lO ad is carr ie d Ou t usin g k nearest
[ 4]
图 2 典型年负荷曲线与特征 曲线 F ig . 2 Curve O f typical year ly gas lO ad and cha racte ristic curve O f gas l O ad
3 结语 实例证明, 离群数据反映了隐藏在数据背后的 不正常因素, 它所包含的信息远远大于一般正常的 数据。对燃气负荷时序数列中的离群数据进行挖掘 和分析, 对于发现燃气负荷更深层次的特性、 解决数 据错误以及进行更为精确的负荷预测有着极其重要 的意义。 参考文献 :

2004年 1 月 22 日是春节 , 即农历正月初一 , 查 阅该城市历年春节期间 ( 从除夕至正月十五, 共 16 d) 的日负荷曲线, 燃气 日负荷均呈现出较大波动 , 但这恰恰反映出了该城市春节期间燃气日负荷的波 动特点 , 是燃气负荷特性的真实体现。这些数据不 能按照离群数据处理 , 应该保存。 8 月份离群程度最大的点为 28 日的数据点 , 该 点为全年数据的最小值。分析 28 日的日期特征和 气象参数发现, 这一天不应出现全年最低值。根据 该城市的气候特点, 全年最低值一般出现在 7月份。 通过查阅该市燃气公司的调度日志发现, 28 日进行 了末站设备的维修, 某些用户未能正常供气, 导致日 负荷异常, 出现了离群数据点。显然 , 该点负荷是不 符合燃气负荷特点的数据。如果应用此段数据作为 原始数据对未来的负荷进行预测, 则应修正该点数 据。 ! 离群数据的修正 通过分析该市 1997 年至 2003 年共 7 a 的燃气 日负荷曲线 , 总结出典型的年日负荷曲线 , 采用 6 次 多项式对其进行拟合 , 得出日负荷的特征曲 线 ( 见 图 2) 。 对 8 月份的离群数据进行修正。采用日期对正 法将 8 月份的负荷曲线平移至燃气负荷特征曲线的
相关文档
最新文档