1. 研究目的与意义(文献综述包含参考文献)
文 献 综 述1.研究背景语音信号包含的音高、音强、音长、音色和语调等复杂信息,从而听话者能准确地判断说话人的意思。
因而,语音识别是一门涉及面很广的交叉学科.与声学、生理学、语言学、模式识别、计算机科学等都有密切的关系。
所以语音交互这对于人类来说最简单、最自然的交互方式对于机器来说就显得尤为困难。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
研究方向以及研究手段1、特征提取将普通的wav语音信号通过分帧加窗等操作转换为神经网络需要的二维频谱图像信号,即语谱图。
2、构建声学模型基于keras和tensorflow框架,使用这种参考了vgg的深层的卷积神经网络作为网络模型,并训练。
卷积神经网络是一种带有卷积结构的深度神经网络,卷积结构可以减少深层网络占用的内存量,其三个关键的操作,其一是局部感受野,其二是权值共享,其三是pooling层,有效的减少了网络的参数个数,缓解了模型的过拟合问题。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
