在模型训练过程中发现输出值全部为正,无法产生负值。训练集中目标值有约一半为负值,loss function 为 torch.nn.MSEloss(),模型使用pytorch包实现。
模型为少数几个GoogLeNet的核心模块Inception Module组成,前期使用了大量的relu激活函数,但是最后的输出层为torch.nn.Linear(),无激活函数。
不知道时什么原因。
但是最后的输出层为torch.nn.Linear()
佳节个tanh激活函数吧,tanh适合所有的场景
经过调试,发现是其他训练(超)参数和数据的问题,例如在数据集中正值的绝对值整体上比负值的要大,最后一层为linear是可以产生负权重的。