基于关键词共现的热点发展趋势研究开题报告

 2022-08-15 09:08

1. 研究目的与意义

微博在这短短几年时间内发展迅速,成为了人们传播信息的一种很重要的载体,仅新浪微博注册用户早已超过3亿,每日发博量超过1亿条,因此是进行热点挖掘分析、研究大量舆情信息的最佳场所。

当今社会信息量庞大,大多数人们都运用社交软件记录自己的生活,表达自己的想法,但是社交软件的泛用性与碎片化信息的量化使得人们在阅读信息的同时可能会被部分碎片信息误导,因此从海量的网络信息中心识别并挖掘热点主题,同时预测热点话题发展趋势具有实际的现实意义。

2. 研究内容和预期目标

研究内容:根据对关键词的相关搜索内容进行爬取,对其内容进行聚类算法分析,找出该关键词中仅次于此关键词的词组,并对复数类词组进行概率计算,最后统计出次要关键词出现频率,根据计算结果的概率进行分析,对主关键词的话题走向进行预测。

拟解决的关键问题:1、对微博数据进行信息采集。

2、对微博数据进行预处理

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

自从推特关闭后,微博开始在中国兴起,是一种基于互联网的社交应用平台 。全球第一个微博网站推特于2006年兴起,到2007年下半年开始得到了广泛的应用,是目前全球最具影响力的网站之一。国内微博平台的发展要晚于国外,经济社会的快速发展让电子设备的大量普及,微博应用逐渐在国内流行起来,是我国互联网用户的必备应用之一。

国外的研究人员主要是对推特平台上发布的信息进行分析。在brown的研究论文中,主要对微博用户在协作方面的功能进行了探讨,文章分析了如何通过微博平台来进行用户与用户之间的合作、交流甚至是项目方面的沟通。在hamilton的论文中,通过对用户在微博中发布的关键字进行挖掘,从而对特定的用户进行定点广告的投放,挖掘微博信息中的商业价值。微博中的信息也有助于公共事业的发展,klein rock通过对在流感爆发时期用户发布的微博消息进行研究,来帮助政府部门确定哪个地区流感病毒传播比较严重,以此加大对该地区的病毒控制力度。推特中明星和公众人物也是研究人员研究的重点之一, paul等人发表的论文中就提出了一种关于如何寻找特定话题中关键人物的算法,该算法可以根据用户发布的大量微博信息来确定该话题中的关键人物。

由于新浪微博兴起,国内对微博的研究也渐渐的成为一个热门话题。对于微博内容的研究,很多都是将重点放在对微博的传播、营销以及教育方面的研究。其中研究比较广泛的一个话题就是网络舆情。刘毅将舆情的定义为:舆情是指由个体和与之相关联的各个社会人物构成的一种关系社会联系,这些群体在对知己感兴趣和利益相关的事件发生的时候会产生相应的意见和情绪,对应的情绪表达出来就是一种舆情。媒体传播的途径有很多种,目前网络舆情传播的途径主要分为以下几种:新闻门户网站、即时通讯工具、热门论坛、博客网站以及微博平台。李心妍教授将微博中的舆情分析定义为“微舆情”,重点分析其在传播时具有的特点以及在传播的过程中会遇到的问题。根据李立毅教授的研究分析,网络舆情与网络热点相比,其应用性更强,平台在构建的过程中使用的方法和采用的技术也要根据实际情况来确定。改论文中主张的观点是对于一个话题,如果是网络热点,它不一定是网络舆情,但如果该话题是网络舆情,那么它一定是网络热点。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

第一章绪论部分。主要对论文的研究背景、意义进行介绍,同时对本文的研究内容进行了概括。

第二章相关技术介绍。介绍了本系统在设计和开发的时候涉及的相关技术知识。

第三章实验和分析。对微博的文本特点进行了详细的分析介绍,提出了进行微博热点发现时所需的步骤,包括数据采集、数据预处理以及热点话题抽取等。进行数据采集,对采集的数据包括微博数据、用户数据以及话题数据;对数据进行预处理,预处理的过程包括降噪处理、文本分词以及停用词过滤;热点话题抽取的过程则包括热度定义以及二次聚类算法k-birch的设计和实现。对系统进行了实验和分析,通过展示微博数据抓取、热点趋势分析以及性能测评,统计次要关键词在总数据中的出现频率,进行热度评估。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1]陈婷,王雪怡,曲霏,等.基于时序主题的网络舆情热点话题演化分析方法[j].华中师范大学学报(自然科学版),2016,(5).doi:10.3969/j.issn.1000-1190.2016.05.008.

[2]万红新,彭云.基于主题模型和arima算法的网络舆情热点发现研究[j].科技广场,2016,(8).doi:10.3969/j.issn.1671-4792.2016.08.004.

[3]格桑多吉,乔少杰,韩楠,等.基于single-pass的网络舆情热点发现算法[j].电子科技大学学报,2015,(4).doi:10.3969/j.issn.1001-0548.2015.04.021.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。