食物图片识别方法分析及模型对比研究开题报告

 2022-01-12 21:28:11

全文总字数:4285字

1. 研究目的与意义(文献综述)

阅读理解旨在构建能够回答与给定自然语言文本相关的问题的机器。作为人工智能中最困难和最具吸引力的问题之一,它要求模型同时理解问题和给定上下文。尽管在过去几年中ai取得了很大进展,但人与计算机之间仍然存在显着的性能差距。

利用深度学习完成对食谱的图片识别使其能实现机器阅读理解中的食品并进行完形填空任务,即给出食谱题目、上下文后,能够从四个待选项选出正确的答案。主要是锻炼机器能否对我们提出的问题进行精准的回答,这部分包含了对上下文以及题目的理解,然后在可选的答案范围中选出最正确的。

在自然语言处理(nlp)和信息检索(ir)的交集中,问答是一项重要的最终用户任务。 问答系统可以弥合基于ir的搜索引擎与复杂的智能助手之间的鸿沟,从而使信息检索过程更具针对性。这样的系统旨在精确地找到用户想要的信息,而不是包含答案的文档或摘录。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

1)基本内容及目标

学习并fastqa模型的核心思想和代码实现以及模型的基本架构,明确fastqa在qa系统中的应用,完成对recipeqa数据集的适配,实现fastqa模型对recipeqa数据集的应用,完成视觉完型的任务,并达到更好的结果。

2)拟采用方案及措施

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1-3周:查阅文献,熟悉fastqa模型的深度学习算法,熟悉python语言以及相关的库文件关于深度学习模型的实现,完成开题报告;

4-6周:明确该课题实现思路,并完成基本代码框架的搭建,完成论文综述报告;

7-10周:完成数据集的在加工,完成模型与数据集的适配并且训练我们的模型达到一定的效果;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] dirk weissenborn, georg wiese, and lauraseiffe. making neural qa as simple as possible but not simpler. in proceedingsof the 21st conference on computational natural language learning(conll 2017),vancouver, canada, august 3-4, 2017, pp. 271–280, 2017.

[2] semih yagcioglu, aykut erdem, erkuterdem, and nazli ikizler-cinbis. 2018. recipeqa: a challenge dataset formultimodal comprehension of cooking recipes. arxiv preprint arxiv:1809.00812

[3] weiqing min, shuqiang jiang, linhu liu,yong rui, and ramesh jain. a survey on food computing. arxiv preprintarxiv:1808.07202, 2018

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版