请问各位大佬,可以详细解答一下这个问题嘛?提前谢谢大家
lambda应该是超参数(hyper-paramater)而不是参数,损失函数的系数在整个训练中应该保持不变,然后去学习w(权重),让误差最小,如果损失函数的参数还在变,怎么去学。