这个错误是什么问题,梯度爆炸么?

这个问题是什么错误,是梯度爆炸的问题,还是有脏数据的问题,我在网上没有搜到相关错误。
这个是我在使用Learning to learn by gradient decent by gradient decent当中的LSTM优化器方法与贝叶斯神经网络结合的过程中出现的错误。

img

方差 scale 中每个量都需要大于 0,而你里面出现了 0,建议给所有这些量都加一个极小量(例如 1e-6)避免这个问题。