CTC的尖峰效应,是不是可以理解为:目标函数约束前面的神经网络,将一个词的多帧信息,集中到了'尖峰'这一帧?
在输出中如果输出错误会有较大的罚分,将不确定的结果不指定到具体的帧,输出blank,确定的结果输出,迭代过程中正确的结果就越突出,准确率越高。