1. 研究目的与意义、国内外研究现状(文献综述)
本课题的意义:
云计算将任务分布在大量异构计算机构成的资源池上,用户根据 按需计费模式使用服务。为了满足用户的计费服务,需要协同分布的计算资源、存储空间、硬件资源等来共同完成工作;如何满足用户日益增长的服务质量需求的同时减少云计算服务提供商的运维成本,使得其利益的最大化。因此,云环境下,对工作流的对目标资源供给的研究具有商业意义。
云计算的工作流一方面提供了对复杂应用的抽象定义、灵活配置和自动化运行,进而提供服务质量保证;另一方面提供了任务的自动调度、资源的优化和管理,压缩了云计算的成本。将工作流应用到云环境中,是用工作流技术来管理云计算资源;工作流的调度是工作流系统的重点内容。云环境下,对工作流的多目标资源供给的研究具有创新意义。
国内外研究概况:
与网格计算下的工作流技术不同,云计算体系下的工作流技术更多用于商业环境,其类型可大致分为两类:
(1)计算密集型科学工作流,该类型工作流应用于科学研究中,在科学研究存在数据管理、数据计算、数据分析、计算结果展现等多个独立任务,每个任务在云计算体系中可看做一个服务,服务之间通过计算逻辑关系和计算结果联系在一起,用来解决科学实验和数据处理中遇到的问题。
(2)实例密集型的商务工作流,该类型工作流存在于很多电子政务和电子商务的平台中。Magellan 工作流系统是为国美能源部科学办公室研究云计算的适用性而研发
的科学工作流管理系统。该系统提供高性能计算资源,大容量存储质量,和高速度网络资源。
CloudSim 系统和Aneka系统均是由澳大利亚墨尔本大学 CLOUD 实验室研发的用来进行云计算研究的科学实验。CloudSim是在离散事件模拟包 SimJava 上开发的函数库,可运行在多种操作系统的平台上,如Windows和Linux 系统。CloudSim提供研究者云计算的研究和开发环境,其中DateCenter、Datercenter Broker、Host、VM类库分别模拟数据中心、服务代理器,主机资源和虚拟机资源。CloudSim还支持用户自开发的调度和分配策略。Aneka是基于.NET面向 服务的商业云工作流系统。它不仅支持多个运行环境中应用程序的开发部署,还提供一个内部软件开发工具包(SDK),可扩展支持 API 的编程框架,目前Aneka管理平台已经成功应用在生命科学计算、教育、商业等多个领域。 应用前景: 无论在科学研究方面和工程应用方面,多目标优化都是非常重要的课题。自20 世纪 60 年代早期以来,多目标优化问题(MOP)吸引了越来越多不同背景研究人员的注意力。这是因为多目标优化问题在现实生活中非常普遍,并且处于非常重要的地位。在工程应用等实际问题中很多优化问题都是多目标优化问题,如工厂的最低成本和最大效益问题就是一个典型的多目标优化问题,类似的领域还包括软硬件系统的设计、工业制造、能量分配、工程管理等等。而这些实际问题非常复杂、困难,要很好地解决这类优化问题需要科研人员投入更多的精力。在多数情况下这些问题的多个目标之间往往是相互冲突的。因此,解决多目标优化问题是一个非常有实际意义和科学价值的课题。 云计算的潜在应用方面有:金融、医疗服务、商业企业等。与其他先进技术(如:网络和网格)不同,云计算起源于商界而不是科学领域抽,在一定程度上在科学界的应用还是未知领域。 主要参考文献: [1]柴学智,曹建.面向云计算的工作流技术[J].小型微型计算机系统,2012,33(1): 125 [2]L. Ramakrishnan, P. T. Zbiegel, S. Campbell. Magellan: Experiences from a science cloud [C]. Proceedings of the 2nd international workshop on Scientific cloud compNew York, USA,10 Oct.2011, pp.49-58. |
2. 研究的基本内容和问题
研究目标,内容: 我们求解多目标优化问题时,由于有多个目标且存在目标之间的无法比较和冲突现象,要使所有的目标函数同时达到最大(或最小)是不可能的,多目标遗传算法的核心就是协调各目标函数之间的关系,找出使各目标函数能尽量达到比较大(或比较小)的最优解集,一个解可能在其中某个上是最好的,但在其他目标上是最差的,不一定有在所有目标上都是最优的解。 工作流模型主要包括四种基本结构,即顺序结构,并联结构,选择结构和循环结构。复杂的工作流模型也基本上是由这四种简单的结构组合而成的。因此本文直接使用这四种简单的基本结构为工作流进行建模。工作流基本结构中也包含一些特定的活动,因此通过求解事务在特定活动中的平均逗留时间可以求出事务在工作流中的平均逗留时间,并且工作流模型中事务在所有活动的逗留时间和处理时间相互独立。 本文针对公共云中基于工作流的资源供给,对多目标服务工作流的优化问题进行研究。利用工作流实例,根据假设的逗留时间概率密度函数,建立工作流和逗留时间关系模型,并通过实例说明该模型有效性。 拟解决的关键问题: (1)、详细了解工作流模型。 (2)、学习并会解决多目标优化问题。 (3)、建立逗留时间与工作流关系模型。 |
3. 研究的方法与方案
研究方法: 利用逗留时间的概率密度函数建立逗留时间与工作流关系模型。 技术路线: 利用工作流的基本原理,以工作流为基础,云计算为背景,解决多目标资源供给。 实验方案及可行性: 本文根据所研究的问题建立3个递进关系模型。 1、 工作流基本逗留时间关系模型。 2、 调用资源数量与逗留时间关系模型。 3、 资源配置成本最小时间最少模型。 |
4. 研究创新点
特色或创新之处 利用逗留时间关系的概率密度函数来建立各个模型。 利用概率密度函数及积分的知识来求解工作流与逗留时间关系的模型。 在经济成本优化的基础上提出了多目标优化及经济成本和时间成本同时达到优化。 |
5. 研究计划与进展
2014年12月:基本逗留时间关系模型。
2015年1月:资源数量与逗留时间关系模型。
2015年3月到4月:配置成本实时间最少模型。
2015年5到6月:实例分析。
