背景:基于PyTorch的模型,想固定主分支参数,只训练子分支,结果发现在不同epoch相同的测试数据经过主分支输出的结果不同。 原因:未固定主分支BN层中的running_mean和running_var。 解决方法:将需要固定的BN层状态设置为eval。 问题示例: 环境:torch:1.7.0 ...