全文总字数:3297字
1. 研究目的与意义(文献综述)
1. 目的及意义(含国内外的研究现状分析)
1.1 研究(设计)的目的
随着近年来端到端的深度神经网络的流行,文本生成逐渐成为自然语言处理中一个热点研究领域。文本样式转换的目的是将输入的文本按照所需的样式重新措辞,同时保留其原始内容。它有各种应用场景,如情绪转换(将积极的评论转换为消极的评论)和形式修改。不同作家的作品有自己的特点,这些特点体现在词汇、句型、修辞手法等各个方面,尝试使用句类特征进行作者写作风格分类,进一步又可以发展为写作风格迁移。根据不同的输入类型,文本生成可以大致划分为三大类:文本到文本的生成,数据到文本的生成以及图像到文本的生成。每一类的文本生成技术都极具挑战性,在近年来的自然语言处理及人工智能领域的顶级会议中均有相当多的研究工作。而写作风格迁移可以运用情感分析、文本分类、依存分析等实现机器文学创作;或者应用于翻译技术,在对内容表示提出了很高的要求的场景和应用下形成高质量的翻译文本;同时也可以用于判断文章的好坏等。
2. 研究的基本内容与方案
2 研究(设计)的基本工作、目标、拟采用的技术方案及措施
2.1写作风格迁移实现的基本目标
1.数据收集:获取目标数据的三类方法:一是从一些有公开数据的网站上复制/下载,比如各大文学网站等,通过搜索引擎可以很容易找到这些网站。二是通过一些专门做数据整理打包的网站/api来下载。三是自行收集所需数据,比如用爬虫工具爬取内容等,或是直接自己人肉收集(手工复制下来)。
3. 研究计划与安排
3 进度安排
2019/1/19—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
4. 参考文献(12篇以上)
4 参考文献
[1] 刘明勇. 基于写作风格学的作者识别技术研究[d]. 浙江大学, 2013.
[2] 万晶. 中文作者识别方法研究[d]. 湖南大学, 2012.
