基于融合特征以及卷积神经网络的环境声音分类系统研究

作者:张科 苏雨 王靖宇 王霰宇 张彦华

关键词: 环境声音 特征融合 声音分类 卷积神经网络

摘要:环境声音识别系统主要基于深度神经网络以及种类繁多的听觉特征对环境声音进行分类识别。分析基于深度神经网络的环境分类任务中,哪种听觉特征更适合环境声音识别系统十分必要。选择了基于2个广泛使用的滤波器:梅尔和Gammatone滤波器组提取的3种声音特征。随后,提出了一个MFCC和GFCC融合的特征MGCC。最后采用文中提出的深度卷积神经网络来验证哪种特征更适合于环境声音的分类识别。实验结果表明,在基于神经网络的环境声音分类系统中,信号处理特征比频谱图特征的效果好,其中,MGCC特征具有比其他特征更好的性能。最后,用文中提出的MCC-CNN模型与其他环境声音分类模型在UrbanSound 8K数据集上进行了对比。实验结果表明,所提模型分类精度最好。


上一篇:下一代WLAN中一种基于分组的上行OFDMA随机接入方法
下一篇:考虑进气道不起动的高超声速飞行器鲁棒自适应控制研究

版权所有 @  西北工业大学   陕ICP备05000471号
地址:西安市友谊西路127号   邮编:710072