简单搜索引擎的设计与实现开题报告

 2021-08-08 05:08

1. 研究目的与意义

网络的出现以及发展对世界发展的意义是极其重要的,它让地球村的理念变为现实,信息的传输不再受到时间和空间的限制。

在没有搜索引擎的时代,用户希望寻找某方面的信息,就必须通过各种途径或者网站之间的链接寻找,可以这样说,脱离了搜索引擎的网站,就像是信息海洋中的一个个孤岛,用户要找到这些信息必将面临巨大的搜索成本,同时付出大量的时间与精力。

搜索引擎的出现改变了上述情况,它通过程序的自动搜索并建立索引,将这些信息孤岛联系起来,形成一张巨大的信息网,并且运用分布式计算的巨大能量,能够让用户从海量的数据中摒除垃圾信息,获取想要的知识。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

搜索经历了五代的更新和发展: 第一代:分类目录时代不知道大家时候在自己的搜索引擎首页是否有设置过导航网站这个网址作为自己的首页呢?其实这个网址就是搜索引擎第一代的代表。

我们可以从这个导航网站这个网站里面看到,里面几乎都是一些分类网址,几乎在互联网上的,这个网站里面都一应俱全,从这里我们可以看出,这个网站是一个导航网站,也可以说分类目录网站,用户可以从这个分类目录里找到自己想要的东西,这就是搜索引擎第一代。

第二代:文本检索时代到了这一代,搜索引擎查询信息的方法则是通过用户所输入的查询信息提交给服务器,服务器通过查阅,返回给用户一些相关程度高的信息。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的基本内容与计划

研究内容:一、信息爬取和维护模块二、预处理模块三、建立索引模块(index)四、查询模块进度计划:序号 项目 时间 阶段成果1 背景研究 2周左右 文献综述,开题报告2 熟悉开发环境及语言 3周左右 开发计划及技术方案3 搭建开发及测试环境 1周左右 4 需求分析 1周左右 界面及数据库设计报告5 编写源代码 4周左右 6 系统测试及完善 1-2周左右

4. 研究创新点

(1)分词对于中文搜索引擎的来说至关重要,本系统采用的是比较简单的分词规则:正向最大匹配法,对中文分词进行一定的研究,保证系统的查准率和查全率(2)区分大小写,这是检索英文信息时要注意的一个点,这一功能对查询专有名词有很大的帮助,例如:Web专指万维网或环球网,而web则表示蜘蛛网.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。