工作中遇到的
boss的意思是 在声音录制过程中,一台设备播放了一段声音,然后另一台设备也播放了一段声音(可能同样或者不同样),计算机可不可以判断出这是一段混合的音频?
emm 我个人觉得不太可能
目前考虑过盲源分离,和说话人识别等等深度学习的方法。
计算机可以判断一段音频是混合的
这是典型的鸡尾酒会问题。
说话人识别如果这两个人是采集过的声音,通过深度学习对单声道的混合音频是可以达到有效的分离,如果说话人非训练集中采集声音,那么以现在的水平来说单声道的音频是有一定概率分离不开的。
不知道录音设备是什么?是否有麦克风阵列,两段声音之间是同等距离还是不同等距离。通过多个麦克风录制,进行盲源分离是有效的。
如果要判断音频是否有混合部分,也可以尝试asr识别,asr如果识别效果不佳,一般来说两个音频是比较混合的。