语音质量评价中的一些问题

我的干净语音信号为未在扬声器上播放的原始音频文件,我的增强语音信号为麦克风采集的信号经过算法增强,我现在想进行评价,比如SegSNR,WSS,LLR,PESQ,我需要对两个信号怎么样做幅度调整?

在进行评价之前,需要将两个信号进行幅度归一化,使它们的能量相等。可以通过计算两个信号的均方根值(RMS)来实现。

  1. 计算原始音频文件的RMS值,记为RMS1。
  2. 计算增强后的信号的RMS值,记为RMS2。
  3. 将增强后的信号乘以RMS1/RMS2的比例因子,使其能量与原始音频文件相等。

完成幅度归一化后,可以使用SegSNR,WSS,LLR,PESQ等指标进行评价。

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632