前端用麦克风采集音频数据,将采集的音频流传到后台,后台调用百度语音识别接口处理成文字,然后将文字返回。
参考https://blog.csdn.net/qiao_1017/article/details/102609243