收藏本站
        《应用声学》 2020年02期
        收藏 | 投稿 | 手机打开
        二维码
        手机客户端打开本文

        SE-MCNN-CTC的中文语音识别声学模型

        张威  翟明浩  黄子龙  李巍  曹毅  
        【摘要】:为了解决传统卷积神经网络在识别中文语音时预测错误率较高、泛化性能弱的问题,首先以深度卷积神经网络(DCNN)-连接时序分类(CTC)为研究对象,深入分析了不同卷积层、池化层以及全连接层的组合对其性能的影响;其次,在上述模型的基础上,提出了多路卷积神经网络(MCNN)-连接时序分类(CTC),并联合SENet提出了深度SE-MCNN-CTC声学模型,该模型融合了MCNN与SENet的优势,既能加强卷积神经网络的深层信息的传递、避免梯度问题,又可以对提取的特征图进行自适应重标定。最终实验结果表明:SE-MCNN-CTC相较于DCNN-CTC错误率相对降低13.51%,模型最终的错误率达22.21%;算法改进后的声学模型可以有效地提升泛化性能。

        知网文化
        【相似文献】
        中国知网广告投放
         快捷付款方式  订购知网充值卡  订购热线  帮助中心
        • 400-819-9993
        • 010-62982499
        • 010-62783978


              天天中快三