模型中如果有2个模块A和B,消融实验中去掉A模块后发现准确率下降6个百分点,去掉B模块后准确率下降4个点,可是如果AB同时去掉发现准确率只下降3个点,同时去掉不应该下降的更多吗?请问大家这是怎么回事,是我消融实验设计有问题吗?
因为A和B存在一定的冗余性
你具体有实物实验结果吗?