帮同学问的,项目已通过sphinx4-chinese模型实现了几个模型中的词汇识别。
现在急需要对sphinx4-chinese模型训练增加一些专业词汇,需要安装哪些软件?每个软件需要做什么?
求图文教程——发消息里也可。
教会了(得到模型训练结果)有大赏!
sphinx4原理太复杂,我们没那么多时间去研究。
sphinx4-chinese模型(下载链接:https://pan.baidu.com/s/1DrxoGAUVlAweYoOn0JqkOQ 提取码:1234)。
网上下的教程太乱了,而且文件不全,训练结果也不是我们想要的。
这个是网上下的教程(下载链接:https://pan.baidu.com/s/150appbfN5bC6Xc00G7U9lw 提取码:1234)。
1.既然你已经有了chinese文档,那么只需要把.tic文件按照格式添加自己的音词就可以了。
2.那个lm文档需要下载一个cmuclmtk进行转换,我这边看了演示使用文档(超级简单)。
3.把修改后的tic和lm文件替换掉chinese里的文件就可以了,其他文件不用变(里边的词非常全了,自己训练效果反而不好)。
如果你自己找不到cmuclmtk可以找我要,同时附送说明文档。
望采纳!
没人愿意做教程,我可以做这个教程
确实sphinx训练有点太复杂了,我之前也看了一下官方文档,云里雾里的最后放弃了。
如果在win10-64 下以模型为例进行完整训练(包含所需软件+软件操作步骤+cmd操作图文),测试成功同赏!
我之前有个项目也是卡这了,用了离线,但是识别一堆乱七八糟的,不是我想要的,好多特有词汇识别不对,没时间去弄。