1. 研究目的与意义、国内外研究现状(文献综述)
本课题的意义、国内外研究概况、应用前景等(列出主要参考文献)1、本课题的意义目前,对于互联网上海量的信息资源,人们主要通过搜索引擎进行搜索查询。
搜索引擎根据用户交互组件收到的请求,对网页索引数据库检索并将结果交付排序组件进行排序处理,最终以网页排序列表的形式呈现给用户,然而这样产生的排序列表仍然可能无法满足用户的需求。
本课题希望根据用户点击的网页中的数据信息,将相关性强的信息排在前面,将相关性弱的排序靠后,从而实现个性化的搜索。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容和问题
1、研究目标 根据当今网络中存在大量信息以及对搜索引擎依赖的现状,先模拟获取用户数据并将之存入数据库中,然后使用tf-idf模型对用户数据进行处理,最后使用ranking-svm算法对处理的数据进行排序,从而使搜索结果进行重新自适应排序处理。
下一次在同一ip地址的用户搜索时,将搜索结果按排序后的顺序呈现。
使得用户在搜索时得到的结果更加个性化。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与方案
1、研究方法:(1)利用google获取100条某事物的相关信息。
(2)利用tf-idf模型处理数据,实现数据向量化。
(3)利用ranking-svm方法实现数据排序。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究创新点
1、本课题是Ranking SVM算法在个性化搜索中的的应用,探究算法在搜索中对信息排序的可行性。
2、采用TF-IDF模型,实现对数据进行处理以及对关键字的抓取。
5. 研究计划与进展
2013年1月1日至1月6日:确定题目并撰写开题报告。
2013年1月8日至2月15日:了解数据挖掘,tf-idf算法,支持向量机(svm)等相关理论知识,并了解java环境下相关语法及操作的实现。
2014年2月20日至3月9日:开始编写算法,逐步实现程序。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
