关于keras molel.train_on_batch()返回的loss问题

比如我将一个batch5个批次共100个二分类样本输入模型，使用交叉熵作为损失函数，optimizer是Adam
那么请问调用train_on_batch()是对每个样本计算loss然后更新模型（更新100次）然后返回最后一次更新之后的loss值吗？
或者是将100个样本的loss值求和之后更新模型呢？这种更新方法返回的loss值又是什么呢？

我也表示疑惑，是求和还是平均的