基于Python爬虫的网络舆情分析系统的设计与实现开题报告

 2021-08-14 03:08

1. 研究目的与意义(文献综述)

在过去,电视新闻与报纸是我们获取新闻,了解时事的主要信息来源,但是电视新闻与报纸的单向传播性使得电视台和新闻媒体很难了解新闻事件对于民众的影响及民众对于某些新闻事件的反馈。虽然电视台和出版社也能通过邮件或者相关的新闻采访等等措施实现民意获取,但是终究因为覆盖范围及样本过小很难反应出真正的民意。同时存在这些问题的还包括电影出版等等行业,越来越多的行业开始意识到民意了解的重要性。

伴随着互联网的高速发展,人们对网络的依赖度越来越高。同时因为网络的高度自由化,越来越多的人开始利用网络发表自己想法与意见,越来越多的利用网络开始交流。

因此,合适的利用网络爬虫和语义分析等技术对网络上的相关内容进行分析,快速进行相关内容的舆情分析显得非常有必要。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1基本内容以及目标

(1)基于python语言的多线程爬虫程序,主要作用是对指定的信息进行高效的抓取。

(2)基于python和mysql的数据库后台,主要作用是存取抓取的信息。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第一阶段(第1周—第3周):深入阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;

第二阶段(第4周—第10周):配置电脑,搭建电脑运行环境,初步设计算法或系统设计,分析、比较或实现等;

第三阶段(第11周—第14周):撰写论文初稿;修改论文,定稿并提交论文评审;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]. 代六玲,黄河燕与陈肇雄,中文文本分类中特征抽取方法的比较研究.中文信息学报,2004.18(1):第26-32页.

[2]. 刘涛,吴功宜与陈正,一种高效的用于文本聚类的无监督特征选择算法.计算机研究与发展,2005.42(3):第381-386页.

[3]. 徐琳宏,林鸿飞与杨志豪,基于语义理解的文本倾向性识别机制.中文信息学报,2007.21(1):第96-100页.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。