针对只有三四百例的样本,并且正样本和负样本比例不平衡,约为4:1,还能进行机器学习吗?如果进行机器学习,大概应该采用什么特殊方法呢?
比例不平衡,可以通过插值增加负样本,或者编写损失函数,给负样本预测错误更高的惩罚项
可以,这个也不算样本特别不平衡,实际上样本不平衡对于模型最终的影响,要训练过才知道。如果这个不平衡确实对结果影响剪发,那么可以特别针对于样本较少的类别进行扩增,简单一点就是单纯的复制。
不知道你这个问题是否已经解决, 如果还没有解决的话:A.当协方差值小于0 时,则两个变量线性负相关
B.当协方差值等于0 时,则两个变量线性不相关
C.当协方差值等于0 时,则两个变量线性正相关
D.当协方差值大于0 时,则两个变量线性正相关
等于0时无关。