基于GAN的文本自动生成系统的设计与实现开题报告

 2021-11-05 19:29:57

1. 研究目的与意义(文献综述包含参考文献)

在主要的文献中,面对文本自动生成的相关任务其一般采用传统的lstm方法,其损失情况是基于贪心决策的,即只针对当前的局部情况来进行下一个序列token的选取,而通过查看最新的文献后,对于文本序列生成这方面的任务还可以通过强化学习的方法来完善,17年上交大提出的seqgan就很好的解决了这个问题,在这个模型中利用到了生成对抗网络模型,lstm序列决策模型,cnn卷积神经网络模型,和强化学习中的蒙特卡洛随机采样的方法。

虽然说现在的gan的变种越来越多,但是其对抗思想都是没有变化的,简单的来说,就是在生成的过程中加入了一个可以鉴别真实数据和生成数据的鉴别器,使生成器g和鉴别器d相互对抗,d的作用是努力的分辨真实数据和生成数据,g的作用是努力改进自己从而可以生成可以迷惑d的数据,当d无法再分辨出真假数据的时候,则认为此时的g已经达到了一个很优秀的效果。

生成对抗网络(gan)使用判决性模型来指导生成模型的训练作为强化学习策略,这已经在文本生成中有很好的结果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容、问题解决措施及方案

本次课题所要解决的问题便是文本序列生成中贪心决策所造成的暴露误差这样的问题,此次研究中引入了强化学习的思想来完成相应的任务。

生成对抗网络主要有两个部分组成,即判别器和生成器,其中最核心的是生成器,生成器主要通过符合高斯分布的隐藏空间的输入来生成符合人们需求的样本或序列,即从符合某种特性的隐藏空间中去不断的探索特性来满足生成伪造数据的需求,如果把隐藏空间看成代数里面的空间,那么那些模拟的特征便可以看做是超平面。

判别模型比较好理解,训练步骤也比较简单,大部分模型的判别器模型是用cnn网络来构造的,并且其输出是一个概率向量,即对每一个分类对应的判别概率,该模型是本次研究中比较核心的一个模型。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付