关于声纹神经网络如何优化

我在做一个音乐声纹的尝试，先把歌曲做人声分离，然后人声段检测出来做了数据分割，然后做了数据集做歌手识别的训练。我这边音乐歌曲还挺多。现在遇到的问题是。测试样本准确率上不去，一般还有什么办法么，我训练样本5千个的时候，测试样本准确率停留在0.2左右，后来我把训练样本增加到两万了，测试准确率提升到了0.6，但是我现在把训练样本增加到了6万，测试准确率还是停留在0.6 左右我用的这个项目的网络模型 https://github.com/yeyupiaoling/VoiceprintRecognition-Tensorflow 下一步应该怎么提升在测试样本上的准确率呢。除了增加样本之外（主要一直在增加样本，没什么变化）

修改超参，调整batchsize、隐藏层神经网络数、添加dropout层等，具体可以私聊

# 对角余弦值
    dist = np.dot(feature1, feature2) / (np.linalg.norm(feature1) * np.linalg.norm(feature2))
    if dist > 0.7:
        print("%s 和 %s 为同一个人，相似度为：%f" % (person1, person2, dist))
    else:
        print("%s 和 %s 不是同一个人，相似度为：%f" % (person1, person2, dist))

修改对角余弦值dist可以提高准确率