互联网热点舆情和追踪开题报告

 2022-05-02 22:17:05

1. 研究目的与意义

习近平曾在讲话中指出,网络安全和信息化对一个国家很多领域都是牵一发而动全身的,要认清我们现在面临的形势和任务,充分认识做好工作的重要性和紧迫性,因势而谋,应势而动,顺势而为。网络安全和信息化是一体之两翼、驱动之双轮,必须统一谋划、统一部署、统一推进、统一实施。信息安全从而提升到一个从未有过的重要性高度。随着互联网在全球范围内的飞速发展,网络媒体成为继报纸、广播、电视之后的第四媒体,网络成为新闻报道的主要载体之一,新闻报道就是对新近发生的事实的报道,根据新闻的性质可分为政治新闻、娱乐新闻、军事新闻等,此外,还包括广告、版权声明、导航栏等噪音信息,这些噪音内容会对基于网页内容的应用造成影响。由于互联网具有隐蔽性、渗透性和随意性等特点,加强对新闻报道的分析监测是十分重要的。

在国家方针和政策的基础上,对主流新闻媒体的新闻报道进行迭代式抓取。抓取后进行网页内容抽取,对当天所有的文章进行分析,分析出每个时间段的重点舆情,抽取出重点舆情主要的关键词,并且在接下来对网站的监控中追踪重点舆情的新闻报道,以及同一个重点舆情不断时间段报道的关键词。

通过这个课题的研究和实践,可以完整的接触到实现一个商品化软件的各个环节,深刻体会多层次的软件体系结构,从而锻炼软件开发的能力,同时也拓展了软件设计的新思路。重要的是加强对新闻报道的检测对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会应有的内涵。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

研究内容:

1、获取新浪新闻版块的新闻:通过爬虫获取新浪新闻首页中的新闻链接,新闻标题,新闻时间,新闻作者,新闻内容,新闻关键字。

2、过滤并获取重点新闻:根据新闻关键字,过滤出重点新闻。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

研究方法和步骤

1、建表。本课题使用的是oracle数据库,建立新闻链接表,新闻表,新闻类型表。

2、获取新浪新闻首页中源代码。通过url下载新浪新闻首页,获取网页的源代码。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] http://news.sina.com.cn/.2015-1-5.

[2] 赵玉勇. 基于web搜索和网页结构分析的it相关主题新闻抓取研究.中国海洋大学.2010.11[学位论文]

[3] 丁军艳.网站结构对搜索引擎抓取的影响.[学位论文]2011.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1) 2022年1月5日 2022年3月15日

接受毕业设计任务,查阅资料并完成开题报告;

(2) 2022年3月15日 2022年3月22日

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版