超市预算管理系统的设计与实现外文翻译资料

 2022-11-20 17:24:53

英语原文共 32 页,剩余内容已隐藏,支付完成后下载完整资料


摘要

背景:信息技术占世界发电量的10%,为此做出贡献二氧化碳排放和高能源成本。数据中心,特别是数据库使用高达23%这种能量。因此,构建高能效(绿色)数据库引擎可以降低能耗和二氧化碳排放。

目标:了解推动数据库整个能耗和执行时间的因素他们的演变。

方法:我们通过两个MySQL数据库对能耗进行了实证研究引擎,InnoDB和MyISAM,跨越40个版本。我们检查了四种软件的关系衡量能耗和执行时间,以确定哪些指标反映了绿色和数据库的性能。

结果:我们的分析表明,数据库引擎的能耗和执行时间增加随着数据库的发展。此外,代码行度量与能量强烈相关消费和执行时间在88%的情况下。

结论:我们的发现为从业者和研究人员提供了见解。数据库管理员可以使用它们来选择一个快速,绿色的MySQL数据库引擎版本。 MySQL的数据库引擎开发人员可以使用软件度量来评估产品的绿色和性能。研究人员可以使用我们的发现来进一步开发新的假设或建立模型来预测绿色和数据库的性能。

1介绍

信息技术(IT)能源需求非常重要。文献显示,每年1500太瓦时(TWh)(或全球能源生产的10%)被IT消耗。通过采用的云范例,数据中心消耗高达23%(350 TWh )的总能量由IT使用。仅在美国,预计数据中心能耗将从91增长能源法案从2013年的90亿美元增长到2020年的139亿美元,能源费用从90亿美元增加到137亿美元。

不仅能源消耗昂贵,而且还会影响环境。平均每月二氧化碳在大气中的浓度在2015年达到百万分之400,是过去80万的最高值年。据估计,与世界能源有关的二氧化碳排放量将从323亿公吨增加到2020年达到356亿公吨,2040年达到432亿公吨。美国的数据中心到2013年二氧化碳排放量达到9700万公吨,预计到2020年排放量将增加到1.47亿公吨。环境可持续性研究侧重于经济,环境,社会和环境影响环境和人类的人类驱动因素。在这方面,一般而言,IT和软件,特别是可以通过发展环保事业来促进环境的可持续发展友好的系统。这可能以不同的方式发生,例如,通过减少使用量来有效利用能源资源,从而减少二氧化碳排放量。而且,IT流程可以做得更多通过减少能源消耗和公司和个人的负面排放实现可持续发展。绿色IT专注于研究这些问题。正式来说,绿色IT是高效使用的研究和实践

计算资源以减少对环境的负面影响,它可以应用于各种高科技领域,如数据中心,移动计算和嵌入式系统。但是,在这论文,我们将重点关注数据中心领域。

显然,数据中心的能源被硬件消耗。但是,由于硬件驱动通过软件,软件也负责消耗能量。软件方面收到较少已经提出了比硬件方面更多的关注和一些解决方案(如能源测试套件)了解能源效率。

软件制造商现在更加关注如何让企业软件更加节能高效(绿色)。这不仅受到来自客户的外部请求的驱动(需要减少维护他们的数据中心的成本),而且还受到软件制造组织内部的要求。大多数软件制造商(例如亚马逊,谷歌,IBM,微软,甲骨文和SAP)都提供他们的产品通过云平台即服务(PaaS)或软件即服务(SaaS)交付模式。内部技术运营团队负责管理PaaS和SaaS产品,同时也为其增加声音客户的合唱团要求减少内部数据中心的能源费用。

软件开发团队也可能从自己的软件更加绿化中受益。通过持续交付和集成实践,例如每晚构建和自动单元和回归测试,基于文献和作者的经验,每个产品需要数百个构建和测试服务器。这种计算能力需要在多个平台上构建和运行数以万计的测试套件支持给定产品的多个版本(由开发团队维护)。因此,通过使自己的软件更环保,开发人员可以通过减少内部服务器场的能源费用来降低开支。

数据库被认为是软件世界的中坚力量;因此,他们负责一个整个软件能源消耗的比例很大。因此,我们重点了解如何通过尝试确定影响数据库的主要因素来使数据库更高效(更环保)能源消耗和执行时间。另外,很多数据库引擎(特别是关系数据库引擎)是已经开发了几十年的成熟产品(例如,第一个Oracle数据库在1978年发布,IBM DB2 - 1983年和MySQL - 1995年)。这些产品有多个版本可供使用和维护由他们的开发团队。因此,理解数据库引擎的绿色如何从发布版本发布到发布是非常重要的。

研究目标:我们的目标是确定数据库的能耗和执行时间除了理解之外,当数据库从一个版本发展到另一个版本时,引擎可能会发生变化这些更改如何与某些与数据库相关的属性(如原始数据大小,数据库引擎)相关联类型(MyISAM / InnoDB)和数据库内存大小。此外,这项研究调查了该软件可以直接影响数据库中可持续发展的指标关于能耗和执行时间。通过使用这些指标,软件开发人员可以评估绿色通过测量其代码的特征,从而消除了执行参考的需要针对软件产品的工作量和直接测量能耗(反过来又节省时间和成本)资源)。为了实现我们的研究目标,我们专注于回答两个研究问题:

RQ1数据库引擎的能耗和执行时间如何随产品而变化成熟(从一个版本到另一个版本)?

RQ2哪些软件指标反映了能源消耗和执行时间?

回答RQ1将帮助我们确定导致绿色数据库和希望快速数据库的因素。回答RQ2将帮助我们构建可基于软件度量预测软件绿色和性能的模型可以很容易地从源代码中提取(例如代码大小或代码流失度量)。此信息应该对从业者感兴趣,因为软件供应商如苹果,IBM和微软正在寻求更低的能耗和执行时间的可持续产品。这应该也是研究人员感兴趣的,因为这些信息可以用来构建软件的通用模型能源消耗和性能。

为了回答这些研究问题,本文中,我们研究了MySQL数据库的两个数据库引(MyISAM和InnoDB)的40个不同版本(2005年至2014年间发布)的能耗和执行时间。 MySQL是世界上最常用和最流行的开源数据库。我们选择MySQL作为研究中的软件,因为MySQL数据库是一个成熟的产品(自1995年以来已经开发)以及正在积极开发的大量(大约100万行代码)代码库。 这为我们提供了足够的数据来研究产品的发展。

为了回答RQ1,我们研究了所有MySQL的能耗(或执行时间)之间的关系正在研究中的版本。为了回答RQ2,我们考察了软件衡量标准与一方之间的关系来自另一侧的能量消耗(或执行时间)。

这种类型的工作需要构建一个框架来自动化所有必要的过程,例如数据库安装,从版本升级到版本,执行工作量,读取和收集测量从特殊的测量仪表中记录所有使用的MySQL版本的测量结果除了为所有实验数据结果创建一个数据库之外。它还要求建立一个系统从MySQL的代码库中提取软件度量标准,以便衡量标准之间的关系并可以建立另一方的能源消耗(或执行时间)。所有这些要求在这项工作中得到解决。这是第一个研究不同的MySQL数据库版本与其能量之间关系的研究消耗以及执行时间。这项研究不同于以前的研究检查了不同版本的Firefox浏览器与他们的表现之间的联系。

这是第一个研究不同MySQL数据库版本与其能耗以及执行时间之间关系的研究。 这项研究与以前的研究不同,它考察了不同版本Firefox浏览器与其性能之间的联系。 此外,据我们所知,这项工作是第一项研究,旨在建立MySQL数据库的能耗与其执行时间之间的链接和软件度量(即代码行(LOC),代码行数 (LOCC)和传统/改进的圆环复杂性(TCC / MCC))。

本文的其余部分的结构如下。 第2节讨论相关工作。我们实验的方法论在第3节中解释。第4节提供了我们实验的结果。 第5节给出了有效性的威胁。最后,第6节总结了论文。

2相关工作

本节结构如下。与能源有关的研究,主要集中在计算机部件和操作上系统(OS)级软件,在2.1节中提供。与能源有关的基准和框架是在2.2节讨论。相关的数据库相关研究在2.3节中给出。最后,研究相关挖掘软件库和能源消耗数据见2.4节。

2.1能耗:硬件和操作系统级软件

许多研究人员都把重点放在了IT的能源消耗上。 Delaluz等人进行了全面的研究软件和硬件系统以确定DRAM模式控制能力的好处节约能源。他们解决了移动和计算环境中的节能问题通过专注于内存系统,占用完整内存的90%左右当忽略输入/输出过程时系统消耗的能源。

Tiwari等人介绍了单个CPU的功耗。他们定义了基于评估的方法指令级功耗分析方法,它提供了一种准确和实用的测量方法并描述了一种基于评估的指令级功耗分析方法,可以有效分析软件功耗。米塔尔等人。提出了一种能量模拟工具,使开发人员能够估算他们的移动应用程序的能源使用情况工作站本身。

有几项关于设备功耗的研究。 Bircher等人产生了力量完整系统的型号取决于处理器性能事件。 Greenwalt等人。测量并模拟了硬盘的功耗。硬盘状态模型提供了定量数据和洞察力,以设计高效的电源管理系统。 Stemm等人研究了两个网络接口的优化类型(即传输级别和应用级别)可以减少它们的数量能源消耗。

Li等人对作为电源管理技术的磁盘驱动器的成本和收益进行了定量分析。在功耗测量运动背后的主要思想是为了找到解决任何不良结果的建议或采取的行动。 塞尔比等应用方法来分析全球变量使用与所需努力之间的关系软件维护并检查了优化对电力使用的影响。 Fei等人采用源代码更改技术来减少伴随应用程序/操作系统连接的能源开销,并修改源代码更改和编译器优化以降低功耗。 Feng等人介绍了一个框架,用于研究32节点Beowulf集群上NAS并行基准测试的功耗 - 性能效率。

2.2基准和框架

一些研究人员集中在基准测试和检查功率测量的想法上。Asmel等人描述了一种近似软件能耗的工具,以帮助有关消费者对他们使用的软件做出有见识的决定。Gurumurthi等人推出了代表CPU,内存层次和低功耗磁盘子系统的完整系统电源模拟器,并计算双方应用程序和操作系统的电源性能。

研究人员还开发了测量和测试能耗的框架。例如,Noureddine等人构建运行时能源监控框架,可轻松报告系统过程的能耗。 Wilke等人为软件能量分析和测试创建了一个通用框架。

2.3数据库相关研究

研究人员已经研究了数据库引擎设计的变化,但没有研究其能耗。例如,Shang等人调查了通过PostgreSQL数据库引擎和Hadoop数据处理框架的多个版本传递给系统管理员的通信信息量的变化。

研究人员设计了能量感知数据库管理系统的原型。陈等人。设计的ReinDB数据库引擎在存在可再生能源和不可再生能源的情况下分配数据库工作负载,以最大限度地减少不可再生能源的使用。刘等人为发送给数据库引擎的查询的执行计划创建优化器;优化器最大限度地减少了给定查询的能耗。除了这些原型之外,交易处理性能委员会还创建了测量数据库工作负载能耗的指导原则。

2.4挖掘软件库和能源消耗

离我们最近的工作是古普塔等人。研究集中于将采矿软件库(MSR)技术与电力性能相结合,并从能源意识问题的软件工程角度展示了第一项研究。作者介绍了一种在运行Windows Phone 7的移动设备上收集和分析电源数据的方法。他们的方法描述并量化功耗,检测功耗差异并预测功耗。这项工作与我们的工作是互补的,因为它专注于检查同一软件(Windows Phone 7)中不同模块(模块是程序的一部分)的功耗,并找出哪个模块功耗最高。此外,它着重于寻找某些模块的典型能量形状模式。另一方面,我们专注于同一产品的多个版本(MySQL)。另外,我们专注于理解能源消耗(或执行时间)与MySQL产品开发之间的关系。

Hindle通过研究多种版本的Firefox网络浏览器,结合MSR研究和能源消耗,展示了Web浏览器多个模块的特征能耗模式。他还研究了LOC和LOCC软件度量与能耗之间的关系。这些工作与我们的工作是互补的,因为我们专注于不同的产品(数据库而不是网络浏览器),并研究多种软件度量(LOCC,MCC和TCC,除了LOC)对能耗和执行时间的影响。

上面列举的作品说明了软件在各个IT领域消耗的功耗的重要性和重要性。

6结论和未来工作

在这项研究中,我们的目标是探索并更深入地了解能效对数据库应用程序的影响。我们进行了一个案例研究,测量了40个发行版上的两个MySQL数据库引擎在参考分析工作负载TPC-H上的能耗和执行时间。为实现这一目标,我们开发了一个框架,通过从软件产品的每个版本中提取软件度量标准来衡量数据库工作负载的能耗和执行时间。

回答RQ1-“数据库引擎的能耗和执行时间如何随产品成熟而变化(从一个版本到另一个版本)?”- 我们的研究表明,随着产品成熟,MySQL MyISAM引擎变得不那么绿色,效率也降低所有四个实验(导致能耗增加和二氧化碳排放量增加)。在MySQL InnoDB引擎的情况下,最早的主要版本是50%(四分之二)我们的实验中最环保和最快的版本,而最新的主要版本是100%中最少的绿色和高效率(四分之四)的实验。

这与Firefox网络浏览器上的实验结果不同[13,14],随着产品成熟,能耗降低。这种差异表明,根据产品及其领域的不同,能源消耗和执行时间可能会“不断变化”。

回答RQ2-“哪些软件度量反映了能耗和执行时间?”- 我们展示消耗的能量和性能主要由代码库的大小决定。代码大小LOC度量标准可用作两种数据库引擎(除InnoDB实验外)的能耗和性能的中等至强度预测。代码基数越小,数据库引擎越绿,效率越高。代码流失(LOCC)和复杂性(MCC和TCC)度量结果对能耗和性能影响较小。

这意味着消耗的能量和时间消耗的数量取决于要执行的代码量,而不是引入代码库或代码复杂度的更改量。如果我们将高能量消耗视为缺陷,我们的结果与功能缺陷的结果不同,LOCC可以比LOC更好地预测缺陷。这个结果也不同于Hindle的发现,他发现,在Firefox浏览器的情况下,LOC与功耗无关。

当代码库中存在导致性能严重下降的性能缺陷时,LOC不能用作能耗预测或时间消耗。然而,这种情况很少见,因为它们很快被用户暴露(如4.1节

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[22979],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版