你的“python+keras实现语音识别”文章中说的语料库哪有下载

你好！你的“python+keras实现语音识别”文章中说的语料库哪有下载的？谢谢！
我邮箱13405818616@163.com

这篇博客: python+keras汉字单字语音识别中的 三、汉字语音识别 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
1、数据集问题
数据集使用的是百度语音合成对3500个常用汉字进行合成的数据集，每个字大概8个不同发音人，之后进行数据增强。
数据增强主要是对波形、位移以及加噪等处理，可以参见大佬凌逆战：《音频数据增强及python实现》链接: 音频数据增强及python实现.
2、跑的结果
三个数据集，每个数据集有32个音频文件，一共96个，训练集85个，测试集15个，三分类样本数据平均，测试集结果1.0。

3、问题
这里的问题在于数据增强暂时只是用的音量，所以测试集与训练集可能没有什么差异，导致了这个结果，后续加噪、波形拉长等等后准确率可能会迅速下降。