新浪微博人脉网络数据挖掘算法的分析与比较开题报告

 2022-01-28 21:42:09

1. 研究目的与意义、国内外研究现状(文献综述)

本课题的意义互联网正逐步演变为无处不在的计算平台和信息传播平台。

微博、在线社区网站、博客、论坛、维基等社交网络应用的出现和迅猛发展,使得人类使用互联网的方式产生了深刻变革由简单信息搜索和网页浏览转向网上社会关系的构建与维护、基于社会关系的信息创造、交流和共享。

微博正成为人类社会关系维系和信息传播的重要渠道和载体。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究目标、内容:本设计旨在对新浪微博人脉网络数据挖掘方法进行相关研究。

研究内容主要有是(1)编写爬虫软件获取新浪微博不同阶级人士的相关数据(2)收集并整理数据,便于下一步算法实现(3)研究常见挖掘算法,并基于Matlab进行仿真试验,对比分析各个算法优缺点(4)尝试对一种优秀的算法进行改进,并比较算法分析结果(5)将相关数据用图表方式表现出来拟解决的关键问题:1 编写爬虫软件获取微博数据2 测试数据集合整理与分析3 算法处理结束后对微博人脉网络的比较分析4 相关算法在人脉网络构建准确度或时间上优化问题

3. 研究的方法与方案

研究目标、内容:本设计旨在对新浪微博人脉网络数据挖掘方法进行相关研究。

研究内容主要有是(1)编写爬虫软件获取新浪微博不同阶级人士的相关数据(2)收集并整理数据,便于下一步算法实现(3)研究常见挖掘算法,并基于Matlab进行仿真试验,对比分析各个算法优缺点(4)尝试对一种优秀的算法进行改进,并比较算法分析结果(5)将相关数据用图表方式表现出来拟解决的关键问题:1 编写爬虫软件获取微博数据2 测试数据集合整理与分析3 算法处理结束后对微博人脉网络的比较分析4 相关算法在人脉网络构建准确度或时间上优化问题研究方法、技术路线、实验方案及可行性分析研究方法:1. 通过查询资料和文献了解什么是数据挖掘算法,了解前人的研究成果,并对其进行归纳分类,深入探究微博的人脉数据2. 利用Matlab仿真其中的典型算法3. 使用相关软件图形化展示算法处理结果4. 根据算法实际效果分析比较各种算法的特性技术路线、实验方案:可行性分析:1. 爬虫程序已有成熟技术,可以借鉴编写针对的爬虫软件2. 对于微博人脉网络具有重要的理论意义和应用价值,许多学者都在对其进行深入研究,目前已经提出很多种算法来刻画微博关系网图3. Matlab是世界上应用十分广泛的工程计算应用软件,它具有十分强大的计算能力和比较完善的功能,使用Matlab可以微博人脉网数据进行定量分析和研究

4. 研究创新点

自制爬虫软件对相关数据进行获取,对相关数据挖掘算法进行分类研究并进行仿真,然后对他们进行实例验证和对比,构建人脉关系网络图,若时间允许,还会对相关算法进行优化,并编写软件方便数据应用。

5. 研究计划与进展

本设计的主要研究计划及预期进展如下:2014/1/10-2014/2/10(算法研究,分类)通过查阅微博人脉网络数据挖掘的相关资料和文献,对新浪微博人脉网络数据挖掘算法有一个较为深入的了解,并对资料进行汇总整理2014/2/10-2014/3/10(爬虫数据获取)深入学习爬虫技术,通过爬虫获取新浪微博相关数据2014/3/10-2014/4/10(matlab仿真)深入学习Matlab编程,根据前期总结和自己对数据挖掘相关算法的研究,在matlab上仿真相关算法,并在此期间完成中期检查文档2014/4/10-2014/4/25(图形化展示效果)对在matlab上实现的算法进行测试和比较,并用相关软件将结果转化为图来更加形象显示人脉关系网络2014/4/26-2014/5/10(毕业论文)通过研究对比加深对微博人脉网络数据挖掘算法的了解,并完成毕业设计论文

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版