基于Word2Vec的高校大学生微博情感词典的构建研究开题报告

 2022-01-21 21:27:18

1. 研究目的与意义、国内外研究现状(文献综述)

高校微博情感倾向性分析可以用于对高校用户的微博信息做深入挖掘,以此来更有效的进行微博营销、网络舆情监控、产品市场定位、政策改革等。

对于高校管理者来说,可以利用分析结果判断学生对于本校相关话题的态度,及时调整学校政策及措施;对于客户群为高校大学生的企业及教育行业的从业者来说,可以及时了解到大学生群体对某一产品的评价及建议,及时改进自身产品和服务;同时可以通过情感分析实时监测大学生群体对社会热点话题的讨论情况,及时对不当言论进行引导,鼓励大学生群里进行独立的思考。

目前大多数情感词典是由人工构建的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

本研究的目的是使用数据分析的方法研究高校微博用户表达情绪的倾向,研究设计并实施了一整套从数据抓取到分析的流程。

主要可以分为如下几点:爬虫获取微博文本数据、微博文本数据预处理、高校微博情感词典的构建、情感词典性能的测评。

本研究在综合现有情感词典的基础上,先建立了基础情感词典,利用爬虫抓取的大量高校微博语料,对语料中的词进行tf-idf值计算后构成高校微博候选词集,并结合基础情感词典筛选出种子情感词集,最终利用word2vec训练词向量模型从候选词集中挑选出了与种子词集语义最为相近的词构建了扩展情感词典,并对词典的有效性进行了实验评测和分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法:文献调研及对比实验。

技术路线:先通过文献调研了解情感词典构建的现状及构建技术和方法,然后基于python平台设计爬虫算法爬取微博数据,并进行清洗及预处理,包括文本的分词、去除链接及标签、去停用词。

之后在现有通用情感词典的基础上构建基础情感词典,基于微博语料并利用word2vec工具及相似度计算函数,构建微博扩展情感词典;最后设计实验对情感词典的有效性进行测评。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

针对以南京农业大学为例的高校大学生原创微博构建了扩展情感词典。

5. 研究计划与进展

1.10-1.15 选定研究课题,明确研究核心工作1.16-1.31 选定数据来源,获取数据,数据清洗。

2.1-2.10 收集通用情感词典2.22-2.28 对比情感词典,并构建基础词典3.1-3.20 研究现有算法及工具,构建扩展词典,进行词典改进3.21-3.25 添加其他词典,构建表情词典3.26-4.5 设计实验,词典性能评测4.6-4.17 论文撰写及修改

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版