1. 研究目的与意义、国内外研究现状(文献综述)
课题意义
随着社交网络、电子商务和移动互联网等的迅猛发展,人类社会数据的快速增长的发展,网络信息呈现爆炸式增长,信息社会已经进入了大数据时代。web2.0甚至是web3.0时代的到来,越来越多的人们更愿意在网络上发表自己的心情、对社会热点事件的看法、对产品的评价等。截至2019年6月,我国网民规模达8.54亿,较2018年底增长2598万,互联网普及率达61.2%,我国手机网民规模达8.47亿,网民使用手机上网的比例达99.1%[1]。区别于传统的结构化的数据,互联网大数据的表现形式大多为非结构化或半结构化的评论文本形式,对这些数据的挖掘和分析工作显得更加棘手。情感分析技术能够很好地满足人们对大规模数据进行观点分析的需要。
2. 研究的基本内容和问题
研究的目标及研究内容
此次研究是基于情感分析的微博舆情分析系统的研究与实现,传统的文本情感分析需要依赖复杂的的特征工程,难以适应微博评论文本简洁、多样、不断变化丰富的特点,本次研究着重在深度学习技术对情感分析模型和方法的改进,实现一个方便快捷的舆情分析系统,以求实现优良的舆情分析效果,良好的用户体验。
具体的研究目标及内容如下:
3. 研究的方法与方案
研究方法
1、数据集来源
自动化爬虫技术采集微博热点事件评论数据;此数据公开可取;
4. 研究创新点
特色创新之处
1、此次研究考虑到了微博评论中的表情符号,可以一定程度的提升舆情分析结果的准确度;
2、此次研究使用深度学习对微博评论的情感分析进行建模,对比传统方式,节约时间,更加高效;
5. 研究计划与进展
研究计划及预期进展
整个过程大约持续三到四个月
第一周:学习python,熟练网络爬虫算法的运用,抓取微博的评论数据;获取(coae2016)提供的微博情感分析公开测评数据;了解深度学习有关的知识,相关概念、专业术语等,为后期阅读文献做准备;
