声纹识别，选择pytorch好还是kaldi？

请您给我建议，我是一名学习相关方向的研究生，如果有实例，能否为我说明一下。

比较推荐pytorch，因为C++比较复杂,环境配置也容易出错，对研究生科研而言，python相对简单，；
而且pytorch也可以调用kaldi

pytorch-kaldi pytorch-kaldi is a project for developing state-of-the-art DNN/RNN hybrid speech recognition systems. The DNN part is managed by pytorch, while feature extraction, label computation, and decoding are performed with the kaldi toolkit. - GitHub - mravanelli/pytorch-kaldi: pytorch-kaldi is a project for developing state-of-the-art DNN/RNN hybrid speech recognition systems. The DNN part is managed by pytorch, while feature extraction, label computation, and decoding are performed with the kaldi toolkit.

https://github.com/mravanelli/pytorch-kaldi

此外，pytorch也有自己的语音信号处理库torch.audio

torch.audio教程 https://pytorch.apachecn.org/#/docs/1.7/24

总的来说就是，pytorch简单易上手，kaldi较复杂。
性能方面，只用过pytorch，没用过kaldi，不做评价。

两者都可以，简单点来说，pytorch比较自由一些，简单一些，可以自己增加、减少、切换一些网络层来实验识别效果，kaldi有点类似封装好的容器，你把东西扔进去给你出来一个结果，但是怎么运行这个结果就比较难以了解，特别是kaldi用的cpp实现的，代码能看得你头晕，这点就不如python的好，但如果你cpp基础够好或者你想要深入学习cpp，那么直接走kaldi就是了，以后你从事这方面的工作也基本上都是得用cpp（工业部署基本上不用python的，太慢）。
但是pytorch的好处就是第三方开源库多，基本上kaldi上面有的模型都会有pytorch的实现，而且一般比较新的语音模型现在基本上都是用的pytorch实现的，很少直接用的kaldi，论文复现也是pytorch的多。
所以建议就是学习和训练神经网络走pytorch，但是类似部署之类的走kaldi，两者都学是最好的，人工智能的终点最终还是往cpp和java上面去的