只需要把每张图片都类似目标区域的地方截取出来就可以,yolo怎么做,或者其他方法也可以
下个labelimg,画框标注,https://blog.csdn.net/ECHOSON/article/details/121939535
那你得用类似目标区域的图像训练一个目标检测网络,或者你检测的物品是常见物品,可能有已经训练好的网络