最上方为原始数据集、训练数据集、测试数据集中正负样本的数量;中间为训练集的表现;最下方为测试集的表现。可以看到在测试集中,对于负类的预测效果很差,请问是什么原因?
可能是参数没调好,过拟合了,把松驰变量参数(一般称为C参数)调节一下(先调大)试试,不行再调一下核参数,多试一下。
样本数据不平衡,正向的样本比负的多,可以用多种方式构造平衡的数据样本,都试试看
应该是遇到了类别不平衡问题,通常有三种办法可以解决:欠采样、过采样、阈值移动。建议查阅相关资料补充学习