你好!你的“python+keras实现语音识别”文章中说的语料库哪有下载的?谢谢!
我邮箱13405818616@163.com
1、数据集问题
数据集使用的是百度语音合成对3500个常用汉字进行合成的数据集,每个字大概8个不同发音人,之后进行数据增强。
数据增强主要是对波形、位移以及加噪等处理,可以参见大佬凌逆战:《音频数据增强及python实现》链接: 音频数据增强及python实现.
2、跑的结果
三个数据集,每个数据集有32个音频文件,一共96个,训练集85个,测试集15个,三分类样本数据平均,测试集结果1.0。
3、问题
这里的问题在于数据增强暂时只是用的音量,所以测试集与训练集可能没有什么差异,导致了这个结果,后续加噪、波形拉长等等后准确率可能会迅速下降。