单个的字识别没问题 可是自制词语大部分识别不了 比如“百度” 我是在官方的zh_broadcastnews_utf8.dic 中提取的 百 + 度 组合的 难道这个组合有要求么? 有的组合能识别 有的组合识别不了 有做过类似的没? 或者有什么更好的离线语音识别的方法么?
该回答引用ChatGPT
Pocketsphinx 语音识别系统需要语言模型和词典来识别语音输入。如果单独的字可以识别,而组合的词语不行,那很可能是词典的问题。词典是预先定义好的,可以用来识别的词语列表,如果想要识别的词语不在词典中,那么它将无法识别。
建议您检查一下自制词语是否在词典中,并且确保它们的拼写正确无误。您也可以尝试添加更多的词语到词典中,以提高识别准确度。
如果您希望使用更好的离线语音识别方法,您可以尝试使用 Kaldi,它是一个开源的语音识别工具,功能比 Pocketsphinx 更加强大。