1. 研究目的与意义、国内外研究现状(文献综述)
随着互联网的快速发展,越来越丰富的信息呈现在用户面前,但同时伴随的问题是用户越来越难以获得其最需要的信息。
为了解决此问题,出现了web搜索引擎。
网络搜索引擎中以基于www的搜索引擎应用范围最为广泛。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容和问题
1、关键问题1、网络机器人(robot)又被称作spider、worm或random,核心目的是为获取internet上的信息。
一般定义为一个在网络上检索文件且自动跟踪该文件的超文本结构并循环检索被参照的所有文件的软件。
机器人利用主页中的超文本链接遍历www,通过u址引用从一个html文档爬行到另一个html文档。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与方案
1、研究方法及实验方案1、通过大量的阅读文献,了解搜索引擎的基础知识和架构,熟悉现存的搜索引擎的工作原理。
2、借鉴国内外主流的搜索引擎,学习国内外优秀搜索引擎。
3、确定自己的排序算法2、技术路线 一般来说搜索引擎都由:用户接口,搜索器,索引生成器和查询处理器4个部分组成。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究创新点
更优的爬虫设计架构更贴近用户的权重设计
5. 研究计划与进展
针对搜索引擎广阔的应用前景以及分析国内外搜索引擎的发展现状,根据搜索引擎系统的工作原理设计一种基于Internet的全文搜索引擎模型,它从互联网上获取网页,建立索引数据库,并采用数据库管理作业和多线程技术以提高全文搜索的性能和效率,从技术上可以适用于任何有全文搜索需求的应用
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
