1. 研究目的与意义
人工智能(AI)领域的主要目标之一是生成完全自主的智能体(agent),与他们的环境(env)进行交互以学习最佳行为,并通过反复试验来逐步提高。制作反应灵敏且能够有效学习的人工智能系统一直是一个长期的挑战,从可以感知和反应周围世界的机器人到纯粹基于软件的代理,可以与自然语言和多媒体互动。一个有经验的自主学习的原理性数学框架是强化学习(RL)。尽管RL在过去取得了一些成功,先前的方法缺乏可扩展性,并且本质上局限于相当低维的问题。这些限制的存在是因为RL算法与其他算法具有相同的复杂度:内存复杂度,计算复杂度,以及机器学习算法中的样本复杂度。我们近年来见证了深度学习的兴起,依靠强大的函数逼近和深度神经网络的表示学习性质,为我们提供了克服这些问题的新工具。
由于建筑具有面积大、能耗大和能耗复杂等特点,并且建筑自身是一个包含多种系统、设备相互连接的复杂非线性系统,因此一直被作为节能的重点。然而,建筑能耗受诸多因素影响,使得能耗预测变得相当困难。在建筑节能问题中,建筑能耗预测方法有很多,例如工程法、数学分析法、人工智能法等。其中,人工智能方法目前使用较为广泛,而强化学习方法在人工智能领域引发了广泛学者的关注,并在多个领域体现其应用价值。强化学习利用试错与环境相互交互的方法不断改进已获得的策略,主要优点在于自学习和在线学习,是目前人工智能的主要研究方向。
传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。2. 研究内容和预期目标
基于深度强化学习的建筑能耗预测方法是以深度学习、强化学习为基本技术手段,通过对建筑能耗问题进行有效建模,结合深度强化学习算法求解最优策略,以实现对建筑能耗的预测。
本设计主要是设计一种建筑能耗预测方法。
主要内容:
3. 研究的方法与步骤
(1)深入了解深度强化学习算法的框架和原理;
(2)寻找适合进行实验的建筑能耗数据集;
(3)用代码实现不同的算法模型,并在不同的数据集上进行实验;
4. 参考文献
[1] mocanu e, nguyen p h, gibescu m, kling, w. l. deep learning for estimatingbuilding energy consumption[j]. sustainable energy, grids and networks, 2016, 6(8):91-99.
[2] wong s l, wan k k w, lam t n t. artificial neural networks for energyanalysis of office buildings with daylighting[j]. applied energy, 2010, 87(2):551-557.
[3] salakhutdinov r, mnih a, hinton g. restricted boltzmann machines forcollaborative filtering[c]// acm press the 24th international conference, corvallis,2007.
5. 计划与进度安排
1.2022.1.5 --- 2022.3.15 接受毕业设计任务,查阅资料并完成开题报告;
2.2022.3.15 --- 2022.3.22选择开发工具,并配置其环境;
3.2022.3.22 --- 2022.4.5完成软件需求分析和概要设计;
