lexicon.txt声学字典;
words.txt语料:lexicon.txt字典删除所有的音素即是;
phones.txt语料:lexicon.txt字典删除所有的单词即是;
这个 words.txt 和 phones.txt 始终不对,您能有 demo 看一下吗?
没有demo唉,是哪不对呢?把错误贴出来看看
可以参考一个例子,看看能否解决你的问题:https://zhuanlan.zhihu.com/p/635193512
有用望采纳
我看你的提问和回答,是自己在训练一些词汇是吧,训练的结果中words.txt和phones.txt文件与想象的不一致,那说明你的训练模型可能出现 问题、建议检查下模型的参数和训练的过程是否出现了问题。自己训练的和openslr 中 thchs30 数据集有差异,那你需要比对下具体的差异在哪里,然后在进行训练模型的优化。
是按照那篇文章中的步骤进行操作遇到问题吧,这个建议私信作者,在问答这里很难问到结果
kaldi 运行thch30遇到问题
可以借鉴下
https://blog.csdn.net/hdm314/article/details/107862390
根据您的描述,您正在使用Kaldi和thchs30数据集训练tdnn模型,并且遇到了words.txt和phones.txt文件的问题。您希望了解如何正确生成这两个文件,并请求提供一个演示示例。
根据您的需求,下面是解决方案的步骤:
请注意,生成words.txt和phones.txt文件时要确保每个文件的格式符合Kaldi的要求,每个单词或音素应占据一行。
关于您请求的演示示例,很遗憾我无法直接提供在线演示。建议您参考Kaldi官方文档、教程或示例代码,这些资源通常提供了详细的步骤和示例来生成words.txt和phones.txt文件。
希望这些信息对您有帮助!如果您还有其他问题,请随时提问。