基于VSM文本相似度算法的健身领域问答系统开题报告

 2022-01-21 21:24:09

1. 研究目的与意义、国内外研究现状(文献综述)

1.1意义近年来,人鱼线、马甲线、腹肌成为网络热词,引发一波波健身热潮。

但是健身属于高消费。

以南京市场为例,私人教练的价格基本在250元-400元/课,一节课基本上一小时。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

2.1研究目标设计并实现一款,可以解决用户提出的健身领域问题的,基于web搜索的问答系统。

针对用户提出的问题,返回文字结果。

最终以安卓客户端形式呈现。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

3.1研究方法(1)查阅相关资料并做好前期准备;(2)查阅中文分词算法,进行对比分析,选择最合适的算法;(3)学习python和爬虫技术并编写代码;(4)阅读相关vsm算法资料,优化算法;(5)界面和后台的搭建与编程;(6)整合各模块,调试改进和测试。

3.2技术路线需求分析->python爬虫的学习->中分分词算法选择->算法优化->算法对比->前后台编程->模块整合与测试3.3实验方案及可行性分析该问答系统最终将以网页形式呈现。

前台采用html等语言进行开发。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

(1)利用互联网日新月异,更新速度快的特点,不构建本地知识库,而是依托更丰富,更具有时效性的搜索引擎返回的结果;(2)针对现在火热的健身话题,给需要健身意见的人们提供了更方便的服务;(3)以VSM经典算法为基础,优化算法,使得查询结果更符合用户的要求。

(4)搜索引擎返回的网页多而杂,该系统可以在检索出来的网页中直接选择答案,无需用户逐个浏览页面,省时省力。

5. 研究计划与进展

(1)2018年1月:查阅资料,对比分析现有中文分词算法,选择合适的算法。

(2)2018年2月:学习Python,利用爬虫技术搜索结果;(3)2018年3月:查阅资料,在现有的VSM算法基础上改进和对比(验证);(4)2018年4月:前后台搭建,模块整合与优化,代码的调试与测试。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版