刚开始学习机器学习,对这些度没什么把握
我的实验训练集七十万个样本,用MLP和SVM的f1 score总在0.75 0.76左右,变化非常慢,不知道是因为已经接近样本的极限,还是模型没建好,所以想知道一般f1score多少算过关
谢谢各位指教
不妨参考一下F1 score的公式
做一个简单的基准模型,假设正类在数据集中占比为a,对于数据集中的任一样本,均将其预测为正类,根据公式f1_score = a / (a - (1 - a) / 2) = 2a / (a + 1),有
正类占比 | 基准模型f1_score |
---|---|
0.3 | 0.46 |
0.4 | 0.57 |
0.5 | 0.67 |
0.6 | 0.75 |
0.7 | 0.82 |
一般根据数据集正类占比,f1_score比基准模型高即可认为模型有效
那你得看看测试集啥情况?
0.85以上吧
但也得看具体问题呀