这是input的size为[3,5]的情况
这是运行结果
然后把刚才的input拆开,拆成3个size为[1,5]的tensor
第二种情况的结果很好理解,请问第一种情况的运行结果是怎么产生的?
mark一下,以前只调用不理解,发现关于不同形状的tensor计算交叉熵的意义和实现过程完全不懂,楼主有答案了吗