训练集中没有异常数据,测试集中有异常数据,用支持向量机训练的模型,怎么能把异常识别出来呢

训练集中有三个类别,测试集中多出了第四个类别,已采用支持向量机方法训练模型,有什么办法能优化模型识别出异常数据呢?
我认为异常的就是第四个类别
我想:识别出第四个类别
求各位指教

谢邀,我个人的想法是这样,你训练了三个类别,如果测试集只有三个类别,那每个类别是识别概率分布会很不均匀,例如80%,10%,10%
如果是多了一种类别,那么分布概率可能是30%,40%,30%
我建议可以从这里入手,如果三种类别的预测概率小于一个阈值,就输出第四个类别
有帮助的话望采纳,谢谢!

如果不把异常数据引入训练集,感觉没啥好的处理方法
单从预测概率入手,只有假设异常特征位于支持向量交点附近,用阈值判断才比较靠谱。如果异常特征完全位于当前某一类内时,这种方法基本只能产生负面效果(不仅预测不出异常,还会误判支持向量交点附近的数据)