1.入门语音识别需要会用开源工具比如kaldi吗?利用python调用第三方库实现语音识别和用kaldi的区别是什么呢?哪个更好些?
2.编程语言c++和python是否都要学习?精通哪一个更好?
3.算法、数据结构、深度学习跟语音识别是什么关系?学习路径是怎么样的呢?
可以不需要自己做,用科大讯飞sdk,有例子代码。
自己做那复杂了。得从声音信号的调制,傅里叶变换学起
这是我正在尝试的方案,因为利用java,C++去开发语音识别的比较多,比如kaldi,可以利用一些别人发布的模型去使用。
缺点就是,离线识别的库太大了,如果说你不在意那几百m的空间,可以塞进客户端。
文章很短,只是记录下我的思路,前两者我都去尝试过了,实在是不可行。如果哪家大公司愿意出一个桌面级的离线识别接口,那就是大吉大利了(虽然这不可能,因为这会牵扯到他们的利益)