在图像分类任务中引入了强化学习反馈,reward在训练集上有上升趋势但在验证集上没有上升趋势,只在一个区间内忽升忽降;acc也是如此甚至在验证集上有点下降,该如何解决
问题点: acc不理想
分析思路: 验证集+测试集,按照8:2进行随机划分
代码如下
#将1.训练集,2.验证集+测试集,按照8:2进行随机划分
X_train, X_validate_test, _, y_validate_test = train_test_split(line_sen_list, label_list, test_size = 0.2, random_state = 42)