黄晨鹏,刘静静,苏 雯,魏加俊,陆灵琳,倪宏涛
(浙江树人大学 信息科技学院,浙江 杭州 310015)
摘要:语音情感识别是人机交互中一个具有挑战性但又十分重要的研究内容,健壮可靠的情感识别系统在提高问题分析能力、疾病检测、测谎、个性化内容推荐等方面具有广泛应用前景.目前已有多种语音情感识别方法,但总体识别率较低,尤其是识别准确度不高.为此,文章研究注意力机制,将长短期记忆网络和注意力机制进行组合,设计一种适用于语音情感有效识别的模型,并使用IEMOCAP数据集对所提出的神经网络模型进行训练和验证.与实际观测结果相比,所提出的组合预测模型在ICMOCAP数据集上取得准确率为71.68%的识别效果,比不结合注意力机制的LSTM提高24.7%.实验结果表明基于注意力机制的深度学习方法对语音情感识别是可靠的,可大幅提升识别准确率.
关键词:深度学习;LSTM;注意力机制;语音情感识别
中图分类号:TP183;TN912.34 文献标志码:A 文章编号:1671-2714(2022)01-0019-05