关于神经网络训练与测试过程中的BN层参数？

为什么一般我们在训练网络的时候设置model.train()，不固定BN层参数，但是在测试过程使用model.eval()固定BN层参数。那么在训练过程中BN层参数是怎么变化的？为什么一些代码在训练时也设置model.eval()固定BN层参数？

1. 关于BN的理论网上一大堆。

2. BN是个可学习的参数，所以训练学习，前向计算固定，和weight一样。

3. 训练阶段使用eval固定BN，和去除BN无区别。当然在蒸馏的时候，大模型固定，小模型不固定。