单通道语音降噪模型(Glance and Gaze: A Collaborative Learning Framework for Single-channel Speech Enhancement)

作者论文里贴的pesq为3.56,我用自己的pipeline跑出来pesq只有3.1,不知道是啥问题~
我是在dataloader里做的stft和幅度谱压缩,loss用的作者给出的,数据集为50小时的DNS数据集,请跑过这个模型的教教我~

你和作者用的gpu都不一样,你肯定跑不出一样的结果

小伙伴你好,我也研究这个模型,方便加个微信交流嘛,感谢,我的微信是LHN15139813601