数据依赖约束下的任务调度资源选择算法_廖彬

合集下载

基于膜计算的蝙蝠算法在云计算资源调度的研究

优先出版计算机应用研究第32卷--------------------------------基金项目：国家自然科学基金资助项目(61172084)；国家自然科学基金资助项目(61272296)；湖北省自然科学基金资助项目(2013CFC026)；湖北省科技支撑计划资助项目(2013BHE022)作者简介：宁彬(1977-)，男，硕士，讲师，主要研究方向为软件工程、算法设计；谷琼(1973-)，女，博士，副教授，主要研究方向为算法设计；吴钊(1973-)，男，博士，副教授，主要研究方向为可行计算、云计算；袁磊(1959-)，男，学士，教授，主要研究方向为数据库应用；胡春阳(1975-)，男，博士，高级工程师，主要研究方向为云计算，算法设计．基于膜计算的蝙蝠算法在云计算资源调度的研究 *宁彬，谷琼，吴钊，袁磊，胡春阳(湖北文理学院，湖北襄阳 441053)摘要：如何进一步实现云计算环境下的资源利用最大化是目前研究的热点，本文首先建立云计算环境下的资源分配模型，云计算资源调度使用蝙蝠算法，同时引入膜计算概念，提出一种基于膜计算的蝙蝠算法，将膜系统内部分解为主膜和辅助膜，在辅助膜内进行蝙蝠的个体的局部寻优，将优化后的个体传送到主膜间进行全局优化，从而达到了云计算资源优化分配要求。

通过CloudSim 平台与其他算法进行仿真对比表明本文算法提高了云计算环境下的系统的处理时间和效率，使得云计算环境下的资源分配更加合理。

关键词：膜计算；资源调度；蝙蝠算法中图分类号：TP 文献标志码：ABats algorithm research in cloud computing resource schedulingbased on membrane computingNING Bin, GU Qiong, WU Zhao, YUAN Lei, HU Chun-yang(School of Science, Hubei University, Xiangyang Hubei 441053, China)Abstract: how to maximize the use of resources in cloud computing environments is the focus of current research. The author under cloud computing environments first established a resource allocation model, used the bat algorithm cloud computing to conduct resource scheduling, introduced the concept of membrane computing, and proposed bats algorithm based on membrane computing, which decomposed the internal membrane system into main membrane and auxiliary membrane, and optimized bat individuals inside of auxiliary membrane; the optimized individuals would be sent to the main membrane for global optimization to achieve cloud computing resource optimization allocation requirements. Simulation comparisons on CloudSim platform show that the proposed algorithm in this paper has improved the processing time and efficiency of the system under cloud computing environment, making cloud computing resources allocation more rational. Key Words: membrane computing; resource scheduling; bat algorithm0 引言云计算是一种新兴的宏观并行计算概念，它包含了分布式处理，并行处理以及网格处理。

基于队列模型的任务调度算法研究

基于队列模型的任务调度算法研究随着社会发展和科技进步，计算机技术得到了广泛的应用，任务调度算法作为计算机技术的一种重要算法，也应运而生。

任务调度算法是处理任务的顺序和执行时间，旨在使计算机系统达到最佳性能。

本文将探讨基于队列模型的任务调度算法研究。

一、任务调度算法概述任务调度算法是指将需要执行的任务按照一定的规则和优先级分配给不同的执行单元，使得各个任务被合理地分配和执行。

任务调度算法可以分为静态和动态两种类型。

静态任务调度算法是指在任务的集合已知的前提下，在执行前就统一规划好任务的分配和执行策略。

动态任务调度算法则是指在任务执行过程中，根据运行环境及任务情况不断动态调整，以达到最优的任务调度效果。

任务调度算法可以根据任务的执行方式和调度策略分为很多种，其中最常见的是基于队列模型的任务调度算法。

二、基于队列模型的任务调度算法原理基于队列模型的任务调度算法是指将需要执行的任务按照一定的规则以队列的形式排列，任务按照进入队列的先后顺序依次执行。

具体而言，基于队列模型的任务调度算法通常分为两种：队列调度和线程池。

队列调度是将任务按照顺序排列，每次执行队头任务，执行完之后再执行队列中下一个任务。

而线程池是将任务添加到线程池中，当线程池达到指定大小后，新的任务就会被阻塞直到线程池中有线程可用。

在队列调度算法中，新的任务总是被添加到队列的尾部，而且只有当当前队头任务执行完毕后，才会执行队列中的下一个任务。

这种算法的优点是简单高效，能够充分利用计算机系统的资源，减少由于频繁切换带来的开销，同时也保持了较高的效率。

在线程池中，每个任务都会分配一个线程来执行，当所有线程都在忙碌状态时，新的任务就会被放在队列中等待执行。

通过线程池可有效控制每个线程的创建和过多线程的开销，同时也能够支持多个客户同时进行请求。

三、实现基于队列模型的任务调度算法需要考虑的问题实现基于队列模型的任务调度算法需要考虑以下几个问题：1. 任务分配规则：任务如何进入队列，以及在队列中按照什么策略执行。

资源调度问题中的模型建立与优化方法研究

资源调度问题中的模型建立与优化方法研究资源调度问题是指在某一特定环境下，合理利用和分配有限的资源，以最大化效益或达到特定目标。

资源调度问题在实际生产、运输、项目管理等各个领域中都具有重要的应用价值。

为了解决资源调度问题，在模型建立和优化方法方面进行研究是关键。

一、资源调度问题模型建立的基本步骤模型建立是解决资源调度问题的第一步，准确地描述问题是保证后续优化有效性的前提。

下面是资源调度问题模型建立的基本步骤：1. 定义问题：明确资源调度问题的目标和约束条件。

例如，确定需要调度的资源种类、调度的时间范围以及可用的资源数量和属性。

2. 确定决策变量：通过分析问题，确定描述资源调度任务的决策变量。

例如，资源的分配方案、资源使用的时间和顺序等。

3. 建立目标函数：将资源调度问题转化为数学规划模型时，需要建立目标函数，以最大化或最小化某个指标。

目标函数的选择根据具体问题的特点决定。

4. 建立约束条件：根据实际情况制定资源调度问题的约束条件。

这些约束条件可以包括资源的供需平衡、时间窗口约束、作业间的依赖关系等。

5. 获得数学模型：通过将目标函数和约束条件以数学形式表示，得到资源调度问题的数学模型。

常见的数学模型包括线性规划、整数规划、动态规划等。

二、资源调度问题中的优化方法建立完资源调度问题的数学模型后，需要采用适当的优化方法求解模型，以得到最优解或次优解。

下面介绍几种常用的优化方法：1. 线性规划方法：线性规划适用于描述资源调度问题中目标函数和约束条件都是线性关系的情况。

通过线性规划方法可以求得问题的最优解，并且具有较高的计算效率。

2. 整数规划方法：当资源调度问题中存在离散的决策变量时，可以采用整数规划方法。

整数规划考虑了决策变量只能取整数值的情况，能够更准确地描述问题并获得更优的调度方案。

3. 启发式算法：启发式算法属于一类基于经验和规则的优化算法，常用于求解复杂问题。

在资源调度问题中，启发式算法可以通过快速的局部搜索和全局搜索策略，寻找近似最优解。

温度感知的MapReduce节能任务调度策略

温度感知的MapReduce节能任务调度策略廖彬;张陶;于炯;刘继;尹路通;郭刚【期刊名称】《通信学报》【年(卷),期】2016(037)001【摘要】现有的FIFO、Fair、Capacity、LATE及Deadline Constraint等MapReduce任务调度器的主要区别在于队列与作业选择策略的不同,而任务选择策略基本相同,都是将数据的本地性(data-locality)作为选择的主要因素,忽略了对TaskTracker当前温度状态的考虑.实验表明,当TaskTracker处于高温状态时,一方面使CPU利用率变高,导致节点能耗增大,任务处理速度下降,导致任务完成时间增加;另一方面,易发的宕机现象将直接导致任务的失败,推测执行(speculative execution)机制容易使运行时任务被迫中止.继而提出温度感知的节能任务调度策略,将节点CPU温度纳入任务调度的决策信息,以避免少数高温任务执行节点对作业整体进度的影响.实验结果表明,算法能够避免任务分配到高温节点,从而有效地缩短作业完成时间,减小作业执行能耗,提高系统稳定性.【总页数】15页(P61-75)【作者】廖彬;张陶;于炯;刘继;尹路通;郭刚【作者单位】新疆财经大学统计与信息学院,新疆乌鲁木齐830012;新疆医科大学医学工程技术学院,新疆乌鲁木齐830011;新疆大学软件学院,新疆乌鲁木齐830008;新疆财经大学统计与信息学院,新疆乌鲁木齐830012;新疆大学软件学院,新疆乌鲁木齐830008;新疆大学软件学院,新疆乌鲁木齐830008【正文语种】中文【中图分类】TP393.09【相关文献】1.云环境下基于化学反应优化的两阶段能耗感知任务调度策略 [J], 毋琳;王玉璟;阎朝坤2.基于动态遗传算法的云计算任务节能调度策略研究 [J], 钟潇柔;翟健宏3.社会属性感知的边缘计算任务调度策略 [J], 王汝言; 聂轩; 吴大鹏; 李红霞4.边云协同计算中安全感知的工作流任务调度策略 [J], 石文玉;张蕊5.基于Flink平台的资源感知任务调度策略 [J], 汪丽娟;钱育蓉;张猛;英昌甜;赵燚因版权原因，仅展示原文概要，查看原文内容请购买。

基于作业历史运行信息的MapReduce能耗预测模型

ｉｍｐｒｏｖｅｔｈｅｅｎｅｒｇｙｅｆｆｉｃｉｅｎｃｙｏｆｔｈｅＭａｐＲｅｄｕｃｅ．ＵｓｉｎｇｔｒａｄｉｔｉｏｎａｌｍｏｄｅｌｔｏｃａｌｃｕｌａｔｅｔｈｅＭａｐＲｅｄｕｅｅｊｏｂ＇ｓｅｎｅｒｇｙｃｏｎ — ｓｕｍｐｔｉｏｎｆａｃｅｓｃｈａｌｌｅｎｇｅｓ．Ａｆｔｅｒｒｅｓｅａｒｃｈｏｎｔｈｅｃｌｕｓｔｅｒｓｔｒｕｃｔｕｒｅ，ｊｏｂｔａｓｋｄｅｃｏｍｐｏｓｉｔｉｏｎａｎｄｔａｓｋｓｌｏｔｍａｐｐｉｎｇｍｅｅｈａ～ｎｉｓｍ，ｗｅｐｒｏｐｏｓｅｄｔｈｅｐｒｅｄｉｃｔｉｏｎｍｏｄｅｌｏｆｅｎｅｒｇｙｃｏｎｓｕｍｐｔｉｏｎｆｏｒＭａｐＲｅｄｕｃｅｂａｓｅｄｏｎｊｏｂｒｕｎｎｉｎｇｈｉｓｔｏｒｙｌｏｇｓ．
中图法分类号ＴＰ３１１文献标识码ＡＤＯＩ１０．１１８９６／ｊ．ｉｓｓｎ．１００２ — １３７Ｘ２０１５．９．０３７
ＰｒｅｄｉｃｔｉｏｎＭｏｄｅｌｏｆＥｎｅｒｇｙＣｏｎｓｕｍｐｔｉｏｎｆｏｒＭａｐＲｅｄｕｃｅＢａｓｄｅｏｎＪｏｂＲｕｎｎｉｎｇＨｉｓｔｏｒｙＬｏｇｓ

考虑不确定因素影响的保障任务调度算法

考虑不确定因素影响的保障任务调度算法曾斌;姚路;胡炜;杨光【期刊名称】《系统工程与电子技术》【年(卷),期】2016(38)3【摘要】It is important to schedule the limited maintenance resources efficiently for equipment support-ability.In the static modeling stage,a new mathematic description model is presented considering complex con-straints such as power configuration and assignments relationships of maintenance units.In the dynamic stage, a Petri nets model is established to translate the static mathematic model into the dynamic workflow model.In the Petri nets model,a set of firing rules are proposed to implement the constraints of the mathematic model, and the new net structures are designed to simulate the workflow of uncertainties and cooperative process.In or-der to solve the planning model,an optimization algorithm based on the annealing evolution algorithm is presen-ted in which a simulated annealing algorithm is adopted to solve the maintenance unit assignment problem and a search algorithm is used to generate the schedule results according to the Petri nets model.The simulation re-sults indicates that the algorithm can improve the unit utilization with a high evolution speed.%针对装备保障任务的优化调度问题，首先进行静态建模，提出了一个新的数学规划模型，能够有效描述保障单元的力量配置及与保障对象的指派关系等复杂约束条件；随后实施动态建模，利用混合Petri 网把数学模型转换为流程模型，不仅构建了变迁激发规则以表达静态数学模型的约束条件，而且设计了新的子网结构模拟突发事件及协同保障的动态过程。

调度问题中的算法

调度问题中的算法作者：***来源：《中国信息技术教育》2020年第11期说到“调度”，人们往往会想到交通运输部门的运行安排，也会想到企业中复杂的生产任务安排。

其实，日常生活中也经常面临着多个事项需要合理安排;只不过任务数不大，也不涉及明显的经济指标限制，人们凭经验就足以应付，很少会联想到“算法”。

当需要解决的任务数增加，且包含相互依赖关系时，算法可以帮助我们顺利有效地完成任务。

● 单纯依赖关系约束下的任务调度我们从仅考虑任务间的依赖约束开始。

如果任务X只能在另外某个任务Y完成后才能开始，我们就说X依赖Y。

下面来看一个简单的例子。

同学们打算在教室里组织一场联欢活动，还准备自己动手包饺子。

他们拟定了一张准备工作任务表，包含所有任务事项、每项任务耗时、任务间依赖关系（注意：只需列出直接依赖关系，而间接依赖关系自然地隐含在其中）。

管理上通常将这些任务的集合称为一个“项目”。

任务列表见表1。

有些任务之间没有依赖关系，执行顺序无关紧要，如果有多个执行者，这样的任务就可以并行。

这里说的“调度”，就是要给每项任务分配一个不同的序号，表示它们执行的顺序，满足：如果任务X依赖任务Y，则X的序号就要大于Y的序号;如果两个任务之间没有依赖关系，则对它们的序号关系没有要求。

从数学上看，原来所有任务间的依赖关系确定了一个“偏序”，即并非任意两个任务都必须“有先后”（称为“可比”）。

调度就是要在此基础上生成一个“全序”，即任何两个任务皆“可比”，对任意两个原来就“可比”的任务，新关系与原关系保持一致。

换句话说，如果按照这个序号串行执行，一定满足原来要求的依赖关系。

这个问题被称为“拓扑排序”问题。

读者应该注意到，如果只要解决拓扑排序问题，我们并不需要考虑上述例子中每项子任务的耗时。

我们可以建立一个有向图模型。

图中每个节点表示一个任务，节点X和Y之间存在从X 到Y的有向边（X→Y）当且仅当对应的任务X直接依赖于任务Y。

上述例子的图模型如下页图1所示。

基于改进粒子群算法的云计算任务调度算法

基于改进粒子群算法的云计算任务调度算法张陶;于炯;杨兴耀;廖彬【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)019【摘要】How to schedule tasks efficiently is one of the key issues to be resolved in cloud computing environment. A Double Fitness Particle Swarm Optimization algorithm(DFPSO)based on conventional Particle Swarm Optimization(PSO)is brought up for the programming framework of cloud computing. Through this algorithm, the better task scheduling not only shortens total task completion time and also has shorter average task completion time. Simulation results show that DFPSO is better than PSO, and the integrated scheduling performance is excellent, especially when the number of tasks increases.%如何对任务进行高效合理的调度是云计算需要解决的关键问题之一，针对云计算的编程模型框架，在传统粒子群优化算法（PSO）的基础上，提出了一种具有双适应度的粒子群算法（DFPSO）。

通过该算法不但能找到任务总完成时间较短的调度结果，而且此调度结果的任务平均完成时间也较短。

仿真分析结果表明，在相同的条件设置下，该算法优于传统的粒子群优化算法，当任务数量增多时，其综合调度性能优点明显。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

目标的资源选择方法通常需要根据不同任务的 QoS 需求进行不同的处理，当任务量巨大时，任务调度算法本身需要进行大量的计算，并且依赖于用户对 QoS 要求的描述，而在真实的环境中某些 QoS 指标往往难以精确获得。基于以上考虑，结合实际的分布式存储环境与任务执行的特点，本文提出一种数据依赖约束下的最优资源选择算法（ Optimal Ｒesource Selection algorithm with DataDependent Constraints，OＲS2DC）。算法简化了传统以 QoS 保障为目标的资源选择方法，在满足任务数据依赖约束的前提下为任务选择最优的资源。同时，与 Hadoop 中现有离请求者最近和随机选择算法相比， OＲS2DC 都能够选择出最优（资源函数ቤተ መጻሕፍቲ ባይዱ价值最大）的资源节点。
*
Abstract: Like MapＲeduce， tasks under big data environment are always with datadependent constraints． The resource selection strategy in distributed storage system trends to choose the nearest data block to requestor， which ignored the server's resource load state， like CPU， disk I / O and network， etc． On the basis of the distributed storage system's cluster structure， data file division mechanism and data block storage mechanism， this paper defined the clusternode matrix， CPU load matrix， disk I / O load matrix， network load matrix， filedivisionblock matrix， data block storage matrix and data block storage matrix of node status． These matrixes modeled the relationship between task and its data constraints． And the article proposed an optimal resource selection algorithm with datadependent constraints ( OＲS2DC ) ， in which the task scheduling node is responsible for base data maintenance， MapＲedcue tasks and data block read tasks take different selection strategies with different resourceconstraints． The experimental results show that， the proposed algorithm can choose higher quality resources for the task， improve the task completion quality while reducing the NameNode's load burden， which can reduce the probability of the single point of failure． Key words: big data computing; distributed storage system; task scheduling; data model; resource selection
如何更好地管理和利用大数据已经成为普遍关注的话题，大数据的规模效应给数据存储、管理以及数据分析带来了［1 ］极大的挑战。大数据环境下的数据处理需要分布式数据存储系统提供的数据存储服务，目前比较著名的分布式存储［2 ］ HDFS （ Hadoop 系统有 Google 的 GFS （ Google File System ）， Lustre、 MooseFs 以及清华大学自主 Distributed File System）［3］、研发的 CarrierFS 等。其中：GFS 管理着 Google 公司百万服务
Journal of Computer Applications 计算机应用，2014，34( 8) : 2260 － 2266 文章编号：1001-9081 （ 2014 ） 08-2260-07
ISSN 1001-9081 CODEN JYIIDU
2014-08-10 http: / / www． joca． cn doi：10． 11772 / j． issn． 1001-9081． 2014． 08． 2260
摘
现有的分布式存储系统任务要：大数据环境下的计算任务往往具有一定数据依赖性关系（如 MapＲeduce ），
资源选择策略选择离请求者最近的数据块响应服务，忽略了对数据块所在服务器 CPU、磁盘 I / O 与网络等资源负载状 CPU 负载矩阵、态的考虑。在分析研究系统集群结构、文件分块、数据块存储机制的基础上，定义了集群节点矩阵、磁盘 I / O 负载矩阵、网络负载矩阵、文件分块矩阵、数据块存储矩阵与数据块存储节点状态矩阵，为任务与数据之间的依，（ OＲS2DC ）。赖性构建了基础数据模型提出了一种数据依赖约束下的最优资源选择算法任务调度节点负责维护基 MapＲeduce 任务与数据块读取任务由于依赖资源不同而采取不同的选择策略。实验结果表明：所提算法能够础数据，为任务选择质量更高的资源，提高任务完成质量的同时减轻了 NameNode 负担，减小了单点故障发生的概率。关键词：大数据计算；分布式存储系统；任务调度；数据模型；资源选择中图分类号： TP311 ； TP274 文献标志码：A
0
引言
层分布式文件系统，由于能够部署在通用平台上，并且具有可扩展性、低成本、高效性与可靠性等优点使其在分布式计算领域得到了广泛运用，并且已逐渐成为工业与学术届事实上的［5 ］海量数据并行处理标准。考虑到 HDFS 的开放性与其广泛的运用，本文选取了 HDFS 为研究对象。大数据环境下的计［6 ］算任务往往具有一定数据依赖性关系（如 MapＲeduce ），传统的任务调度算法过多地考虑任务的多维服务质量（ Quality of Service，QoS）需求，这些算法运用到实际的大数据环境下 QoS 因子需求难以获得等问题的挑战。时，受到算法复杂度、考虑到现有任务调度资源策略（如 MapＲeduce）选择离请求者最近的数据块进行响应服务，忽略了对数据块所在服务器
第8 期
廖彬等：数据依赖约束下的任务调度资源选择算法
2261
CPU、本文提出一种磁盘 I / O 与网络等资源负载状态的考虑，新的分布式存储系统下的具有数据依赖关系的任务调度资源选择算法。本文在分析研究存储系统的集群结构、文件分块、 CPU 负载矩阵、数据块存储机制的基础上对集群节点矩阵、磁盘 I / O 负载矩阵、网络负载矩阵、文件分块矩阵、数据块存储矩阵与数据块存储节点状态矩阵进行了定义，为任务的数据依赖性构建了数据模型。根据 NameNode 的思想设计了任务调度节点，任务调度节点负责维护基础数据的同时为不同种类的任务（如：MapＲeduce 任务、数据块存储与读取等）选择最优的任务资源依赖映射方案。新的任务调度算法在优化 HDFS 集群中资源的使用，提高任务的完成质量的同时减轻了 NameNode 负担，减小了单点故障发生的概率。
［4 ］器上的海量数据，基于 GFS 的分布式数据库 BigTable 支撑地图、社交网络等服务； HDFS 作为 Hadoop 底着 Goolge 搜索、
收稿日期：2014-02-20 ；修回日期：2014-04-15 。 60863003 ， 61063042 ）；新疆维吾尔自治区自然科学基金资助项目（ 2011211A011 ）。基金项目：国家自然科学基金资助项目（ 61262088 ，男，四川内江人，博士研究生，主要研究方向：数据库、云计算、绿色计算；于炯（ 1964 －），男，北京人，教授，博士作者简介：廖彬（ 1986 －），生导师，博士，主要研究方向：网络安全、网格与分布式计算；张陶（ 1988 －），女，新疆乌鲁木齐人，硕士，主要研究方向：分布式计算、网格计算；男，新疆乌鲁木齐人，博士研究生，主要研究方向：分布式计算、网格计算与推荐系统。杨兴耀（ 1984 －），
Task scheduling and resource selection algorithm with datadependent constraints
LIAO Bin1 ， YU Jiong2 ， ZHANG Tao3 ， YANG Xingyao2
( 1 ． College of Statistics and Information， Xinjiang University of Finance and Economics， Urumqi Xinjiang 830012 ， China; 2 ． School of Software， Xinjiang University， Urumqi Xinjiang 830008 ， China; 3 ． Medical Engineering College， Xinjiang Medical University， Urumqi Xinjiang 830011 ， China)