最近使用讯飞转写功能,发现他的粤语分词效果太差了,经常会出现一个字当做一个词,然后返回了一个时间戳的情况。
我已经和讯飞的客服反馈这个情况了,他们说后续会有升级
但是 我最近用,所以就是用jieba 分词了一下整句, 发现效果还不错,但是肯定没有时间戳信息返回了。
所以想请问下各位,分词时间戳该怎么得到
上面是jieba结果,下面是讯飞的结果。
我自己初步的想法是根据jieba的词然后 按照字来一一匹配,使用第一个字的时间戳和最后一个字的时间戳,这样就可以得到整句话的时间戳了。
如果jieba能满足你的分词需求,我觉得实现你的初步想法就可以了。