基于深度学习的语音信号识别方法研究与实现开题报告

 2021-11-22 09:11

1. 研究目的与意义(文献综述)

随着智能设备技术的发展,信息交流是人与人沟通、人与机器交互的重要手段。传统的人机交互手段已经无法满足人们和机器之间的互动要求。而语音作为人类进行交流的最重要手段之一,是非常便捷的交流方式,可以达到和机器之间进行方便快速交流的要求。同时语音信号也是人机交互中信息的主要载体,语音信号随处可见,成为人类获取的重要信息。机器不能够直接理解人类的语言,语音信号识别技术是将人类语音转换成机器可读输入的技术,也是实现人机交互的关键技术。近年来,伴随着移动设备、智能家居设备和车载信息系统等的普及,语音识别被广泛运用于日常生活之中。此外,语音翻译技术,自动导航系统,语音助手等应用也都是语音识别技术生活中的一些应用场景体现。不同场景的语音识别技术应用会遇到不同的挑战,目前传统的语音识别技术只能够应对孤立的命令词识别场景,并且也仅能实现对特定词汇的识别。在未来语音识别技术的应用中,仅实现特定词汇的识别不足以满足实际生活需求,因此对单句语音信号的识别的研究是有必要的。深度学习技术可以较大的提升语音识别的准确率,结合深度学习技术提升对单句语音信号识别的准确率,使语音识别技术能够得到更广泛的运用。

国外进行语音识别研究的起步较早,人们对语音识别研究最早是从1952年贝尔研究所davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统开始的。1960年英国的denes等人研究成功了第一个计算机语音识别系统。大规模的语音识别研究是在进入了70年代以后,在这段时间内由于计算机技术的发展,使得语音识别从原来的硬件实践到了软件和硬件相结合的时代,在这期间语音型号线性预测编码技术(linear predictive coding,lpc)被提出,使得语音可以转化成特征参数。进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型 (hmm)的技术思路。之后cmu的sphinx系统为大词汇量连续语音识别做出了很大的贡献。到了二十一世纪,随着计算机性能的高速提升,深度学习技术开始应用在各个领域,语音识别技术也得以加速发展。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1基本内容

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1周—第3周 搜集资料,撰写开题报告;

第4周—第5周 学习数字语音处理相关知识,搜集资料,初步了解语音信号预处理和特征提取相关算法的原理以及声学模型的实现方式;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] dzmitry bahdanau,kyumghyun cho and yoshua bengio.neural machine by jointly learning to align and translate arxiv preprint aixiv:1409.0473,2015.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。