项目中遇到一个问题,我们需要把电话录音转换成对话方式的文字,例如:一段通话,是销售和客户的对话,转成文字后希望变成,销售:。。。。客户:。。。。请诸位大神给分解分解可以如何实现
你想多了吧,还想区分角色?假如上百号人,一人说了一句,语音识别可能会做到这几个人是谁吗??? 能给你翻译成文字,然后就是你后期加工了,别想着偷懒
通过拾音通道进行角色分离,分开录音,再通过通话时间合并录音内容做比对。借用人工智能进行声纹识别 实现比较方便。