关于keras molel.train_on_batch()返回的loss问题

比如我将一个batch5个批次共100个二分类样本输入模型,使用交叉熵作为损失函数,optimizer是Adam
那么请问调用train_on_batch()是对每个样本计算loss然后更新模型(更新100次)然后返回最后一次更新之后的loss值吗?
或者是将100个样本的loss值求和之后更新模型呢?这种更新方法返回的loss值又是什么呢?

我也表示疑惑,是求和还是平均的