模型分类的类别数量对模型有什么影响?

最近在做油罐的罐体识别,图片包括正样本1500,负样本1500.
在实验中发现,当负样本分开标记为易拉罐、阻车桩、烟囱等时,比都标记为“负样本” 在mAP_0.5,mAP_0.5:0.95,precision ,recall四项均有下降。

mAP_0.5mAP_0.5:0.95precisionrecall
分开0.86790.61520.90240.8237
不分开0.93680.68590.93890.8905

有哪位做过类似的实验,是不是分类数越多,模型效果越差?