一般外呼场景都是8k采样率的录音, 假设模型都一样 ,8k和16k不同采样率训练出的模型准确率会有差距吗?

一般外呼场景都是8k采样率的录音, 假设模型都一样 ,8k和16k不同采样率训练出的模型准确率会有差距吗?

理论上模型一样的情况下,16k采样率的数据天然比8k效果会更好,训练的模型效果也会更好。
但是如果是将8k的录音上采到16k,在走同样的模型,那么就不一定会更好了。
不过一般来说更大的采样率可以搭配更深的神经网络,这和图片增大分辨率是一样的,所以提高模型参数量,效果准确率肯定是有提升的。
但是提高模型参数量的同时,也会减小模型的推理速度,有利有弊。

16K数据量更大。主要看8k能不能满足基本采样需求,但是精度肯定还是有区别的。