你的“python+keras实现语音识别”文章中说的语料库哪有下载

你好!你的“python+keras实现语音识别”文章中说的语料库哪有下载的?谢谢!
我邮箱13405818616@163.com

  • 这篇博客: python+keras汉字单字语音识别中的 三、汉字语音识别 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  • 1、数据集问题
    数据集使用的是百度语音合成对3500个常用汉字进行合成的数据集,每个字大概8个不同发音人,之后进行数据增强。
    数据增强主要是对波形、位移以及加噪等处理,可以参见大佬凌逆战:《音频数据增强及python实现》链接: 音频数据增强及python实现.

    2、跑的结果
    三个数据集,每个数据集有32个音频文件,一共96个,训练集85个,测试集15个,三分类样本数据平均,测试集结果1.0。
    在这里插入图片描述
    在这里插入图片描述
    3、问题
    这里的问题在于数据增强暂时只是用的音量,所以测试集与训练集可能没有什么差异,导致了这个结果,后续加噪、波形拉长等等后准确率可能会迅速下降。