模型分类的类别数量对模型有什么影响？

最近在做油罐的罐体识别，图片包括正样本1500，负样本1500.
在实验中发现，当负样本分开标记为易拉罐、阻车桩、烟囱等时，比都标记为“负样本” 在mAP_0.5，mAP_0.5:0.95，precision ，recall四项均有下降。

	mAP_0.5	mAP_0.5:0.95	precision	recall
分开	0.8679	0.6152	0.9024	0.8237
不分开	0.9368	0.6859	0.9389	0.8905

有哪位做过类似的实验，是不是分类数越多，模型效果越差？