全文总字数:2900字
1. 研究目的与意义(文献综述)
近十年来,随着电子商务的大力推广和快速发展,涌现出一大批电商网站,例如,京东、唯品会、蘑菇街、聚美优品等。电子商务的发展改变了我们的生活,越来越多的人愿意在网上购物,并且发表自己对于商品的看法的评论。这些网站上会产生海量的评论数据,如果可以合理的利用这些数据,我们可以获得更多有价值的回报。
电商网站的存在与发展,为我们的生活带来了极大地方便;越来越多人顺应电子商务发展的潮流,而商家想要提高自己的产品竞争,就要从不同的方面去满足消费者的需求,用户对于商品的评论就是挖掘用户需要的一个很的突破点,而分析文本评论数据就需要相关的技术支持。如今机器学习技术的不断发展,自然语言处理和深度学习慢慢地成为了最前沿的技术。数据分析和数据挖掘也是自然语言处理领域的一个热点。
本文研究的数据分析技术在很多领域都有着非常重要的作用,在电子商务领域中,数据分析技术主要应用在分析商品评论数据上。在得到消费者的评论数据反馈之后,通过对用户的评论中的情感倾向进行分析,以此挖掘出用户对这些商品的情感倾向,可以了解消费者对所购商品的喜好程度,从大量数据中分析出消费者的需求,也可以帮助商家了解商品的优点与不足,从外观、质量和使用方便等不同方面去综合考虑并进行改进,从而可以在一定程度上优化产品的性能,提高产品的质量,和其他的兄弟品牌相比,提高自己的竞争力,在一定程度上更好的满足供应商的需求,来达到留住消费者的目的。
2. 研究的基本内容与方案
研究内容
本文主要研究的内容是挖掘网络商城上的家电商品的评论数据信息,从评论数据中找寻出有价值的信息。基于语义网络的评论分析可以将数据的进行可视化展示,可以更加清楚的看到各个数据之间联系。tf-idf特征提取,可以提取出最能代表评论数据的一些关键的词,
通过这些分析,对产品的认识会更加的直观一点,快速打看到产品的优点及不足,可以给网络商品的厂商提出一些意见,比如说,找到用户的喜爱点和关注点,可以利用用户的喜爱点来进行宣传去吸引潜在的用户,对于用户吐槽的地方进行改进。
3. 研究计划与安排
第1-4周: 查阅相关文献并确定题目,接受任务书;
第5周末前: 撰写文献综述,完成开题报告;
第8周末前: 研究数据采集的python爬虫技术、撰写论文初稿,接受中期检查;
4. 参考文献(12篇以上)
[1] 李其达.基于词典的文本情感计算系统的设计与实现[d].武汉:华中科技大学,2014
[2] 阮光册,夏磊.基于关联规则的文本主题深度挖掘应用研究[j].现代图书情报技术,2016
