全文总字数:4263字
1. 研究目的与意义、国内外研究现状(文献综述)
课题意义:
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容和问题
研究的目标和内容:目标:用几种机器学习技术对中文文本进行情感倾向分析。内容:在pycharm集成环境上利用python语言研究用几种机器学习技术包括支撑向量机(svm)、最大熵模型、贝叶斯、k最邻近算法(knn)对中文文本进行情感倾向分析,并实现情感词典法情感分析进行对比,结果分为积极和消极两个粒度,实现对一句话或者一段话的情感倾向预测,并对几种算法的分析结果用不同的评价指标进行对比。本次研究对象以电商平台用户对商品的评价为主,具体用了外卖平台的用户评论数据和宾馆预订平台的用户评论,从食和住两个方面的数据进行处理和训练的研究。
拟解决的关键问题:①从网站采集数据。②对数据集进行预处理(分词、去除停用词、情感标注等)。③利用卡方统计方法进行特征降维。④不同分类算法的实现。⑤用实验数据集进行模型训练和模型预测。⑥利用pyqt5实现演示界面。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与方案
研究方法:实验法:用实验数据集进行模型训练和模型预测。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究创新点
利用机器学习进行文本情感分析是一项备受关注的技术,应用前景也十分广泛。但由于中文和英文是不同的语言模型:中文需要对句子手动划分词组;英文可以通过空格自动划分词组。目前关于利用机器学习进行中文文本情感分析的实验还不是特别多,该课题利用现有的评论数据集,利用机器学习进行训练和预测文本的情感,对该领域的研究有一定的意义。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
5. 研究计划与进展
一月到二月:下载数据集,完成数据的预处理(包括分词,去除停用词,转换为词等)。
二月到三月:几种机器算法实现
三月到四月:用实验数据进行训练和测试,提高准确率
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
