基于语音识别的人机交互界面开题报告

 2021-11-20 11:11

1. 研究目的与意义(文献综述)

语言是人类沟通的重要方式,我们从很小的时候就开始学习语言,语言交流陪伴我们的一生,是我们最基本、最重要的一种社会能力。语言交流陪伴我们一生,是我们最基本、最重要的一种社会能力。语言交流以其高效的表现方式提高了人与人之间的沟通效率,进而提高了社会生产效率。推而广之,这种高效的沟通方式我们可以用在人机交互上,让那些死板的电子产品变得鲜活起来。对于那些没有接受过计算机技能培训,电脑知识匮乏,不能熟练使用键盘打字的老人或儿童,智能人机助手可以方便他们用电脑进行文字、指令的输入和控制。而且对于那些缺少陪伴,无人可对话的老年人,基于语音识别的人机交互系统能与他们进行对话,减少孤独感。

大约在90年代末,国内的人机交互技术刚刚起步,有大批的学者在这方面做出了卓越的贡献。到目前为止,人机交互技术已经从当初简单笨拙的文本输入输出方式向着现在的多元化图形界面综合了计算机强大的处理能力,先进的软件等转变着。在不久的将来,还在实验室中的具有理解用户语言的用户界面也会实现。国内现在的人机交互系统的设计已经取得了不少的研究成果。在许多方面都有所进展,例如科大讯飞的讯飞开放平台作为世界第一个人机交互平台,给开发者提供了一整套基于语音识别的人机交互解决方案。用户可通过网络,在任何时间地点接入讯飞开放平台,利用它提供的语言人机交互的智能化服务,很方便的使用它的语音识别技术接口来开发自己的语音技能。在美国21世纪信息技术中,人机交互技术被列为了关键的六项技术之一,而且美国国防关键技术计划不仅把人机交互列为软件技术发展的重要内容之一,而且还专门增加了与软件技术并列的人机界面这项内容。日本也提出了fpiend21计划,它的目的就是要开发21世纪个性化的信息环境。现在在国际人机交互领域,国外很多知名的科技公司纷纷将焦点聚集在基于语音的人机交互产品上。nuanceasr赋予应用程序生命力,它凭借更高的准确性、灵活性、可靠性和易用性,可实现更高效的资源使用和特殊的客户交互。微软小冰是由微软基于情感计算框架提出建立的,结合人工智能算法、云计算以及大数据的综合应用,使用迭代升级的策略,慢慢建立了一条基于情感计算框架的完整人工智能体系。google语音搜索或按语音搜索是一种google产品,允许用户通过在移动电话或计算机上通过语音来使用google搜索,即让设备在输入有关通过说话搜索设备内容的信息时搜索数据。苹果的siri通过与语音识别厂商nuance合作让siri具备了语音识别能力,它的最大特色是在人机互动方面,具有十分生动友好的对话接口,能准确实时的满足用户的提问,常常给人意外的惊喜。

近几年,人工智能飞速发展,语音技术逐渐改变人们的生活和工作方式,借助先进的互联网和云计算资源,是人机交互更加流畅高效。从目前来看,中文语音识别率仍然存在提升空间,实现人机交互的全浸入式体验有待进一步深入探索。将语音识别技术服务于每个用户,交互的全方位、多角度、高可靠性都是需要考虑的因素。语音识别是语音信号处理的重要研究方向之一,它是一门涉及面很广的交叉学科,与计算机、通信、语音语言学、数理统计、信号处理、神经生理学、神经心理学、模式识别、声学和人工智能等学科都有密切的联系。它还涉及生理学、心理学以及人的体态语言。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

通过语音实现人机交互,主要包括3项技术,自动语音识别、自然语言理解和语音合成。自动语音识别即将语音转换为文本信息,是语音识别技术的关键。语音识别技术大多采用隐马尔可夫模型。随着深度学习的不断发展,以人工神经网络进行语音识别成为了主要研究方向。早期,在使用人工神经网络并利用反向传播算法进行训练下,语音识别技术得到了提高。此后,有研究人员将隐马尔可夫模型与高斯混合模型结合形成高斯混合模型-隐马尔可夫模型运用于语音识别。在将深度学习应用于语音识别后,其效果明显优于高斯混合模型。

本研究的基本思路是:(1)通过文献和资料查找,明确“语音识别”和“人机交互”的概念,知道语音识别的一些主流算法,如“动态时间规整算法”、“基于非参数模型的矢量量化算法”、“基于参数模型的隐马尔可夫算法”和“基于人工神经网络”等语音识别算法。(2)编写算法相关代码,完成算法设计与运行。(3)结合科大讯飞的语音识别来设计一个基于语音识别的人机交互系统。

3. 研究计划与安排

第1周—第3周搜集资料,撰写开题报告;

第4周—第5周论文开题,搭建和调试算法编程软件及仿真平台;

第6周—第12周完成算法设计及仿真,并分析实验数据,观察实验现象,撰写论文初稿;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

    1. 孙可,刘忠武,吴雨洽,郭东旭.基于python的深度学习语音识别[j].沈阳师范大学学报(自然科学版),2019,37(03):274-277.

    2. 李瑜. 基于语音识别的游戏系统设计[d].重庆大学,2013.

    3. 张亮. 说话人识别中语音增强算法的研究和系统实现[d].重庆大学,2009.

      剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。