通过改变类别的权重会有效果吗?另外PCA降维和SVD之类的对于处理噪点有帮助吗?还请老师指点一二,谢谢!
如果有偏离正常值很远的噪点,则可以通过异常点检测算法来检测。另外也可以考虑滤波算法将数据通过一个滤波器。
如果是类别不平衡问题,那么一般需要考虑降采样,从而平衡类别的比例。改变类别的权重的本质是算法偏好的取舍:你的算法倾向于选择权重较大的类别。
PCA 降维之类的算法只是将数据从高维降低到低维空间,它并没有增加或者减少样本数据。但是如果你的噪点与正常点在低纬空间的投影重合的,那么噪点就被正常点给掩盖住了。所以PCA降维之类的算法,对于噪点问题,至少它没有坏处。