图像检测 判断物体间关系

想要问问各位如何实现这样的一个图像检测目标
就是同时检测出行人和手提袋。然后如何能够将每个行人和该行人携带的手提袋一一对应起来并输出呢?(RGB-D 数据)
最好通过深度学习工具对行人和手提袋的关系做出判断。
有没有有关的论文呢?

你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。