假如CNN网络生成两个预测,分别为P1(H*W*n),P2(H*W*n),同时gt 是 P1* P2 ,那么理论上可以设计一个损失函数 L1 = | P1*P2 - gt_p1*gt_p2 |吗,那个损失函数是怎么反向传播的?
反向传播取决于你的参数优化算法,比如sgd/adam/gd等等。P1(H*W*n),P2(H*W*n),如果两个网络不共享参数,相当于神经元隐层增加一倍。