数据集如果只要其中的某两类?

现有一个包含2w多张的数据集,13个类别。但是我只想要其中的两个类别。
现在的一个问题是,比如某一类的train中有5000张图片,但只有400张正样本图片。train_txt中的负样本占比约90%。
这样训练会不会存在正负样本不均衡,导致训练效果差的问题?
除了改json文件,我要训练全部的图片吗?

如果要做样本均衡,可以将原来的正样本加大权重多复制一些,或者镜像,旋转,放大缩小之后在加入到样本集中,并在训练的时候关掉相关的图像预处理,也可以在不影响样本主要特征情况下用ps将正样本无关紧要的特征做修改,每次修改都可以多出一个正样本。
当然你可以不用训练全部的样本,如果分类的特征较为明显,较为简单的话,800-1000个样本足以有一个好的分类效果。