基于新闻信息的LSTM股票指数预测开题报告

 2023-02-08 09:02

1. 研究目的与意义

进入21世纪以来,中国经济始终保持着高速增长的前进趋势,而与经济最为紧密相关的便是股票市场的发展。目前,中国国内股票市场共有3760多只股票,总市值达到了61.6万亿元,并且占据了2019年中国gdp总量的60%以上。仅从市值来看,中国已经成为全球第二大股票市场。

股票市场作为股票发行与交易的场所,能够为股份公司创造迅速集中大量资金、实现生产规模经营的条件,也为分散的资金盈余者提供同股份公司“利益共享,风险共担”的财富增值机会。而股票市场的活动对股份公司,投资者甚至国家经济发展也会有不利的影响。股票价格的变动正是股市活动的重要表现。股票价格的形成十分复杂,既受到政治、经济、市场因素的影响,也会受到投资者行为因素的影响,因此处于频繁变动之中的股票价格扩大了股市的投机性活动,进而增大了股市的风险性。

由此,股票投资者不断尝试着对股市反馈的各种信息进行收集、整理、综合等工作,来了解并预测股票价格走势,从而做出“低风险、高收益”的投资决策。其中,股票指数即股票价格指数,正是由交易所或者金融机构编制的一种作为对多种股票价格综合变化仅供参考的指示数字。目前,国内主要指数有上证指数、深成指数、沪深300等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

研究内容:本文以沪深300指数作为研究对象,将当天收盘价与前一天收盘价比值的对数作为预测对象,即涨跌情况。主要工作有:一是选择成交量、收盘价、指数平滑异同平均线(macd)和随机指标(kdj)作为股票的技术指标,并作为变量引入lstm神经网络模型进行模拟预测。二是通过网络爬虫获取新浪财经网724小时a股专栏新闻作为文本数据,经过自然语言处理后,分别得到词信息、情感信息和情感分类结果作为特征变量,依次引入lstm神经网络进行模拟预测。三是在技术指标基础上,引入词信息、情感信息和情感分类结果进入lstm神经网络预测。最后综合几种模拟模型进行预测效果的比较。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

股票市场预测作为金融领域的研究重点,经过多年的研究发展,在预测方法和影响因素方面均取得了重大突破。

现阶段,股票预测方法主要有以下三类:首先是传统时间序列模型的预测方法,如孟坤、李丽[1]采用arma模型对上证指数进行了股票价格预测与实证分析,以及万建强、文洲[2]采用arima、arch模型在香港指数预测方面进行了对比试验。但传统时间序列预测方法存在着固有限制,难以提高预测的精度与满足预测变量的要求。之后,股票指数预测方法的研究开始转向以支持向量机与人工神经网络为主的机器学习方法。如田翔、邓飞其[3]使用支持向量机回归方法对股指进行预测研究,解决了非线性时间序列预测相关问题,并提高了模型泛化能力;如袁秀芳[4]对股票价格先建立了单一的支持向量回归机(svr)预测模型,此基础上又提出一种分别处理高低频信息的arima-svr的组合预测模型,最后结合小波分析和核函数改进成了多尺度核函数svr预测模型,充分证明了支持向量机预测的有效性;另一方面,如鲍新中等[5]、汪劲松和石薇[6]、黄宏运等[7]对bp算法进行改进,解决了神经网络容易陷入局部最小值,以及收敛速度慢等问题;又如刘斐弘[8]将bp网格、rbf网格和gabp网格三种算法应用于上证指数预测中,结果表明神经网络能较准确地预测股票价格,增强了人工神经网络预测的实用性。近年来,lecun等[9]在技术角度论证了深度网络可以忽略局部极值问题造成的影响,因而深层神经网络模型成为目前最前沿的金融预测方法。如李佳、黄之豪等[10]采用循环神经网络(rnn)、卷积神经网络(cnn)、长短期记忆神经网络(lstm)对上证指数与沪深300指数进行预测,并与其它预测方法(arma、svr、bp)进行比较研究,结果表明深层网络预测能够得到更高的预测效果,其中lstm预测效果更好并能进一步解决了长期依赖问题,故在金融经济预测领域有较高的应用价值。

早期对股票市场预测的因素研究主要考虑的是技术指标,如股票价格、成交量、指数平滑异同平均线(macd)和随机指标(kdj)等,然而股票市场受多种复杂因素影响,仅利用技术指标难以获得理想的预测效果。随着有效市场假说(emh)[11-12]指出新闻是驱动股票价格的重要因素,基于新闻因素的股票预测研究开始展开。如张梦吉、杜婉钰等[13]利用新闻短文本进行基于事件的新闻分类,进而使用循环神经网络建立个股走势预测模型;孔翔宇、毕秀春等[14]通过对财经新闻文档进行聚类得到新闻主题分布情况,与实际股票交易数据和市场间的关联程度,共同引入支持向量机算法进行预测。继而随着行为经济学的发展,学者逐渐意识到大众情感变化在股票市场的重要作用,如gilbert[15]等从live journal中提取大众焦虑指标, 根据指标的变化预测指数, 验证了大众情绪对股票市场的作用;又如bollen等[16]从twitter评论文本中提取出情感倾向作为参数,建立了对道琼斯指数的预测模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

研究计划:

2022/06-2022/07确定选题并阅读大量文献。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1] 孟坤,李丽.基于arma模型预测股票价格的实证分析[j].河北北方学院学报,2016,32(5):55-60.

[2] 万建强,文洲. arima模型与arch模型在香港股指预测方面的应用比较[j].数理统计与管理,2001,20(5):1-4.

[3] 田翔,邓飞其.精确在线支持向量回归在股指预测中的应用[j].计算机工程,2005,31(22):18-20.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。