1. 研究目的与意义
目前,网络信息繁多,为在众多新闻网站中找到符合自己兴趣的新闻,往往需要花费用户大量时间,随之产生新闻聚合这一手段。新闻聚合把互联网上的信息,通过搜索引擎或人工编辑手段汇聚到一起,供受众选择。
现有新闻聚合手段有多种。百度、谷歌以搜索引擎为主要功能,提供新闻信息;以社交媒体为容器,根据读者分享文章的次数进行判断,找出受用户欢迎度高的文章,最终选出最有发展希望的样本,如buzzfeed;以挖掘数据为基础的推荐引擎,如今日头条,使用智能推荐系统算法、爬虫技术,来挖掘和分析数据。
目前的推荐算法,主要有以下几种。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究内容和预期目标
针对前述主要任务目标,本课题的主要研究内容有以下内容。
2.1 智能推荐算法
建立一个基于社交、数据挖掘,以及阅读场景的智能推荐算法,针对当前捕获的用户数据,如何得出用户关心的主题。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与步骤
3.1智能推荐算法
采用基于内容、协同过滤推荐和效用函数的原理,基于社交、数据挖掘,以及阅读场景综合数据,设计一个推荐算法,参考网上关于今日头条推荐算法的介绍,加入一些自己的想法。编程工具采用java或者python js。
3.2爬虫系统
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 参考文献
[1] [美]卫斯理 春(Wesley Chun).Python核心编程[M].人民邮电出版社,2016年05月.[2] [美]迪米特里奥斯 考奇斯-劳卡斯(Dimitrios Kouzis-Loukas).精通Python爬虫框架Scrapy[M].人民邮电出版社,2018年02月 .[3] 崔庆才.Python 3网络爬虫开发实战[M].人民邮电出版社,2018年04月.[4] [德]凯瑟琳 雅姆尔(Katharine Jarmul)、[澳]理查德 劳森.用Python写网络爬虫 第2版[M].人民邮电出版社,2018年08月.[5] [挪威]赫特兰(Magnus Lie Hetland).Python算法教程[M].人民邮电出版社,2016年01月.[6] 董伟明.Python Web开发实战[M].人民邮电出版社,2016年09月.[7] [美]米格尔·格林贝格(Miguel Grinberg).Flask Web开发 基于Python的Web应用开发实战 第2版[M].人民邮电出版社,2016年09月.[8] 刘长龙.Python高效开发实战[M].人民邮电出版社,2016年10月.[9] (美)罗布森,(美)弗里曼.Head First HTML 与 CSS(第二版)[M].人民邮电出版社,2013年09月.[10] 莫振杰.HTML CSS JavaScript基础教程[M].人民邮电出版社,2017年08月 .[11] (美)西尔伯沙茨.数据库系统概念(原书第6版)[M].机械工业出版社,2012年05月.[12] (美)拉赫登迈奇,(美)利奇.数据库索引设计与优化[M].电子工业出版社,2015年06月 .
5. 计划与进度安排
(1) 2022年1月10日 — 2022年1月30日
接受毕业设计任务,查阅资料并完成开题报告;(2) 2022年2月1日 — 2022年2月8日
选择开发工具,并配置其环境;(3) 2022年2月9日 — 2022年2月 23日
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
