目标检测中，数据集的多少该如何评价？

神经网络在进行学习的过程中，数据量的多少指的是数据集中图片的多少还是数据集中所有标注的目标对象个数的多少？换个说法，需要检测的目标有两类，某个数据集中有20000张图像，每张图像包含两个目标（也就是每一类目标各10000个），另一个数据集中只有200张图像，每张图像内有200个目标（每张图像每一类目标都是100个），这两个数据集的区别在哪？哪个数据集更好？为什么？

一般来说，数据量的多少是指图片的多少。如果要区别哪一种好，那么也只能说场景不同需求不同。如果本来是目标比较稀少的场景，肯定是前一种情况要好；如果本来场景中目标非常密集，那么第二种情况效果应该要好。所以具体选择哪种数据集，和你测试场景图像的数据分布有关。