参照书写的一个简单的SGD正向传播2层神经网络,读入mnist数据格式为1002828,激活函数为sigmoid,中间层输入展开为784(28*28),输出层为10(对应0-9数字),但最后的结果学习无法进行,交叉熵误差一直波动没法稳定下降,以下附上我的代码:
sigmoid换成ReLU试试...读入mnist的格式是啥玩意?我怎么看不懂 他不是张图片吗 不稳定下降是指有多不稳定