123
当前位置: 网站首页 - 期刊查询 - 自然科学
 发表日期:2023年07月13日 编辑:陈维君 有位读者读过此文
基于时域音频分离网络的单通道语音分离

贺业涛1,容诣展1,吴 1,蔡颖慧2*

(1.浙江树人大学 信息科技学院,浙江 杭州 310015 2.常州大学 计算机与人工智能学院,江苏 常州 213164)

    摘要:基于深度学习的单通道语音分离方法最近取得巨大进展.目前大多数方法都通过混合音频的时频域表示来进行分离任务,这种方法具有声音信号的相位无法精确重建以及计算谱图时的长延迟等缺点.为了解决这些缺点,文章基于一种时域音频分离网络(Conv-TasNet)进行单通道语音分离任务,这是一种用于端到端时域语音分离的深度学习框架.通过对Conv-TasNet进行改进,网络模型的性能指标源失真比达到11.98 dB,相比于原始的Conv-TasNet,该网络模型具有更好的性能.

    关键词:语音分离;单通道;时域分离;深度学习

    中图分类号:TN912                                   文献标志码:A                                   文章编号:1671-2714202301-0014-06




相关专题:

相关信息:
 没有相关信息

相关评论:

  • 附件【3.pdf】已下载

      打印本页
 

版权所有浙江树人学院学报
 中国 浙江 杭州市树人街8号 邮编:310015 电话:0571-88297179
浙ICP备:05015558号-5