声纹识别,选择pytorch好还是kaldi?

请您给我建议,我是一名学习相关方向的研究生,如果有实例,能否为我说明一下。

比较推荐pytorch,因为C++比较复杂,环境配置也容易出错,对研究生科研而言,python相对简单,;
而且pytorch也可以调用kaldi

此外,pytorch也有自己的语音信号处理库torch.audio

总的来说就是,pytorch简单易上手,kaldi较复杂。
性能方面,只用过pytorch,没用过kaldi,不做评价。

两者都可以,简单点来说,pytorch比较自由一些,简单一些,可以自己增加、减少、切换一些网络层来实验识别效果,kaldi有点类似封装好的容器,你把东西扔进去给你出来一个结果,但是怎么运行这个结果就比较难以了解,特别是kaldi用的cpp实现的,代码能看得你头晕,这点就不如python的好,但如果你cpp基础够好或者你想要深入学习cpp,那么直接走kaldi就是了,以后你从事这方面的工作也基本上都是得用cpp(工业部署基本上不用python的,太慢)。
但是pytorch的好处就是第三方开源库多,基本上kaldi上面有的模型都会有pytorch的实现,而且一般比较新的语音模型现在基本上都是用的pytorch实现的,很少直接用的kaldi,论文复现也是pytorch的多。
所以建议就是学习和训练神经网络走pytorch,但是类似部署之类的走kaldi,两者都学是最好的,人工智能的终点最终还是往cpp和java上面去的