关于声纹神经网络如何优化

我在做一个音乐声纹的尝试,先把歌曲做人声分离,然后人声段检测出来做了数据分割,然后做了数据集做歌手识别的训练。我这边音乐歌曲还挺多。 现在遇到的问题是。测试样本准确率上不去,一般还有什么办法么,我训练样本5千个的时候,测试样本准确率停留在0.2左右,后来我把训练样本增加到两万了,测试准确率提升到了0.6,但是我现在把训练样本增加到了6万,测试准确率还是停留在0.6 左右 我用的这个项目的网络模型 https://github.com/yeyupiaoling/VoiceprintRecognition-Tensorflow 下一步应该怎么提升在测试样本上的准确率呢。除了增加样本之外(主要一直在增加样本,没什么变化)

修改超参,调整batchsize、隐藏层神经网络数、添加dropout层等,具体可以私聊

# 对角余弦值
    dist = np.dot(feature1, feature2) / (np.linalg.norm(feature1) * np.linalg.norm(feature2))
    if dist > 0.7:
        print("%s 和 %s 为同一个人,相似度为:%f" % (person1, person2, dist))
    else:
        print("%s 和 %s 不是同一个人,相似度为:%f" % (person1, person2, dist))

修改对角余弦值dist可以提高准确率