1. 研究目的与意义
i.研究背景
随着计算机互联网的发展,互联网发展早期,网站分类目录由人工整理维护,精选互联网上优秀的网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查询自己想要的网站。也有人把这中基于目录的检索福诶网站称为搜索殷勤,搜索引擎的技术是自动搜集信息资源、建立索引、提供检索服务,方面人们查找资料
ii.研究目的
2. 研究内容和预期目标
1、通过搜索引擎及其技术存储一部分数据建立一个小型的数据库,通过研究搜索引擎技术通过关键词搜索能快速准确的将相关搜索结果推到首页,并且将关键词相关内容用红色字体标注起来。
2、我们学习的目标就是抓取互联网上的html页面,分析出其结构并抽取关键信息存储到数据库中,以备搜索用。然后做出搜索程序,根据用户在搜索页面输入的关键字信息,到数据库中查找匹配内容,并根据内容与搜索关键字的相关度进行排序显示。
3、搜索引擎服务器端使用java语言实现,要用到javaweb的相关知识。存储从互联网抓取的网页的数据库使用mysql可以满足要求。完成此搜索引擎用到的技术有:java编程语言,mysql数据库,jsp,servlet,html,css,xml,dom等。
3. 研究的方法与步骤
研究方法:
研究方法及其步骤:
(1)创建网页内容搜索器crwaler
4. 参考文献
[1]蔡翠平.数据库技术sql[m].北京:北方交通大学出版社,清华大学出版社,2002.
[2]孙卫琴解密搜索引擎技术实战[m].北京:电子工业出版社,2004.
[3]sierrak,搜索引擎原理、技术与系统[m]2版.南京:东南大学出版社,2005
[4]brucee.java编程思想[m].北京:机械工业出版社,2005.
[5]李安强.jsp/servlet技术在管理信息系统中的应用[j].青海大学学报(自然科学版),2004年04
5. 计划与进度安排
1、2022.3.23 ----2022.3.27根据题目查阅资料,撰写开题报告
2、2022.3.30 ----2022.4.3收集原始资料,进行搜索课题分析
3、2022.4.6 ----2022.4.10进行数据分析,确定数据库结构
