基于Android的实时语音识别系统的设计与实现开题报告

 2021-08-14 16:04:20

1. 研究目的与意义(文献综述)

随着社会的发展,计算机、通信等技术也发展迅猛。人们对计算机技术的运用也渗透到生活中的方方面面。在现实生活中,通信或信息交换是人类社会存在的必然条件,而语音是人们交流最基本、最简便的方式,让机器实现能够理解语音,进行人机交互信息也一直是我们的追求。近年来,手机市场越来越大,智能手机蓬勃发展,硬件资源和软件系统都在不断升级,计算能力逐步提高,人们的需求也日益剧增。能够让手机理解语音信号,并且实时话,对人们的生活方方面面具有重大意义。尤其是手机市场上在安卓的份额比例越来越多。在移动设备和嵌入式系统实现智能语音功能可以简化人机交互过程,优化用户体验,实现设备智能化。因此在安卓系统上实现语音实时识别成为必须研究和实现的问题。

语音识别(speech recognition)是一种让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。实时(real time)是一个机器响应的水平,用户感觉或者是机器与外部过程过程同步。

语音识别方法主要是模式匹配法。在训练阶段,用户将词汇表中的每一词依次说一遍,并且将其特征矢量作为模板存入模板库。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。语音处理系统输入信号由语音部分和非语音部分组成,其中语音部分是语音处理系统需要考虑并处理的目标信号,而包括安静无声、噪声和其他不属于语音处理系统目标的声音信号共同构成了语音信号中的非语音部分。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

针对现阶段国内的语音识别技术的发展与应用现状,本文以研制一套基于安卓的语音识别系统为目的,深入学习了语音识别原理,设计并制作一套基于安卓的语音实时识别系统。该系统通过手机内置传声器作为语音输人方式,将模拟语音信号经过处理后。送入语音识别引擎进行处理转化然后输出结果。语音信号经过数字信号处理提取语音特征,除去冗余数据,解析出语音信号。语音识别引擎可以选择采用本地匹配或云端识别的方式。云端识别语音文字能提高返回用户结果的正确率。一方面可通过网络进行在线语音识别进行应用处理。另一方面可通过本地她配,按照声学模型与语法模型并行匹配,输出本地识别结果。

如图可以将本系统划分为若干个子模块,其中特征提取模块主要是用来采集说话人的语音模拟信号并将其转换为可以进行处理的数字信号;声学解码则是用来将匹配出的向量序列而推测出候选的识别词网,而语言解码模块则是将候选的词网结构进行分析处理,选出概率较大的识别词语。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。

第6-9周:编程实现各算法,并进行仿真调试。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 韩纪庆, 张磊, 郑铁然等. 语音信号处理(第2版)[m]. 清华大学出版社.2009.

[2] 谢凌云. 实时语音识别系统的快速算法研究[d]. 中国科学院声学研究所, 2004.

[3] 华斌. 基于hmm特定人语音识别在安卓菜单导航中的应用[d]. 哈尔滨工业大学, 2013.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版