请问目标检测2D和3D在同样情况下精度谁高?

本人在读研究生,现在写论文遇到了一个问题,我目前做的是手术器材的识别,需要将20种不同的手术器材放置在一个器材桌上,然后分别用2D和3D的方法进行目标检测。
我刚进入深度学习领域,不太了解2D和3D之间的一些适用范围。我先把我这个工作的条件放在下面:

RGBD相机,可以直接生成点云,有xyzrgb以及contrast几个channel
器材桌背景绿色,并且相机位置固定
器材种类20个类,并且可能出现有开口,重叠等情况
数据来源是通过渲染CAD模型得到的合成数据
大致是这样的

img

我想请问这种情况下2D和3D哪个更适用一点呢?有没有推荐的算法?精度优先。