pyhton使用librosa提取语音信号特征之后出现的

RuntimeError: stack expects each tensor to be equal size, but got [3751, 128] at entry 0 and [2979, 128] at entry 3

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^