基于python的数据爬取和分析程序设计与实现开题报告

 2022-01-07 09:01

全文总字数:3537字

1. 研究目的与意义(文献综述)

国内外研究现状分析

随着网络数据的爆炸式增长,互联网上的信息几乎涵盖了社会活动、文化、政治、经济、娱乐等各个方面。人们通过网站精确获取信息的速度较慢而且获取到的有效信息量较小。使用传统数据收集机制(如问卷调查法、访谈法)进行捕获和采集数据,往往会受经费和地域范围所限,而且还会因其样本容量小、可信度低等因素导致收集的数据往往与客观事实有所偏颇,有较大的局限性。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基本内容与目标

设计一个用户交互界面;在界面输入要爬取的地址,对网页进行分析和分词;把爬取的内容保存到数据库;对数据库内容进行分析,并使用图示展示出来。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;

(2)2020/3/1—2020/4/30:系统架构、程序设计与开发、系统测试与完善;

(3)2020/5/1—2020/5/25:撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]王芳.基于python的招聘网站信息爬取与数据分析[j].信息技术与网络安全,2019,38(08):42-46 57.

[2]孙瑜. 基于scrapy框架的网络爬虫系统的设计与实现[d].北京交通大学,2019.

[3]殷丽凤,张浩然.基于python网上招聘信息的爬取和分析[j].电子设计工程,2019,27(20):22-26.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。