kaldi thchs30 训练遇到问题

kaldi thchs30使用自己的数据和字典训练tdnn模型-CSDN博客 kaldi thchs30使用自己的数据和字典训练tdnn模型

https://blog.csdn.net/wyw0000/article/details/125456902

1、需要准备

lexicon.txt声学字典；
words.txt语料：lexicon.txt字典删除所有的音素即是；
phones.txt语料：lexicon.txt字典删除所有的单词即是；

这个 words.txt 和 phones.txt 始终不对，您能有 demo 看一下吗？

没有demo唉，是哪不对呢？把错误贴出来看看

可以参考一个例子，看看能否解决你的问题：https://zhuanlan.zhihu.com/p/635193512
有用望采纳

我看你的提问和回答，是自己在训练一些词汇是吧，训练的结果中words.txt和phones.txt文件与想象的不一致，那说明你的训练模型可能出现问题、建议检查下模型的参数和训练的过程是否出现了问题。自己训练的和openslr 中 thchs30 数据集有差异，那你需要比对下具体的差异在哪里，然后在进行训练模型的优化。

是按照那篇文章中的步骤进行操作遇到问题吧，这个建议私信作者，在问答这里很难问到结果

kaldi 运行thch30遇到问题
可以借鉴下
https://blog.csdn.net/hdm314/article/details/107862390

根据您的描述，您正在使用Kaldi和thchs30数据集训练tdnn模型，并且遇到了words.txt和phones.txt文件的问题。您希望了解如何正确生成这两个文件，并请求提供一个演示示例。

根据您的需求，下面是解决方案的步骤：

生成words.txt文件：您可以从lexicon.txt字典中删除所有的音素，剩下的就是words.txt文件的内容。打开lexicon.txt文件，删除每行中的音素信息，只保留单词部分即可。
生成phones.txt文件：同样地，您可以从lexicon.txt字典中删除所有的单词，剩下的就是phones.txt文件的内容。打开lexicon.txt文件，删除每行中的单词信息，只保留音素部分即可。

请注意，生成words.txt和phones.txt文件时要确保每个文件的格式符合Kaldi的要求，每个单词或音素应占据一行。

关于您请求的演示示例，很遗憾我无法直接提供在线演示。建议您参考Kaldi官方文档、教程或示例代码，这些资源通常提供了详细的步骤和示例来生成words.txt和phones.txt文件。

希望这些信息对您有帮助！如果您还有其他问题，请随时提问。