多标签文本分类模型训练后在验证集上F1值为0

在经典数据集AAPD数据集上进行文本多标签分类实验,采用的是预训练模型Roberta,深度学习框架是pytorch,但是在训练集上训练完毕后,在验证集上发现所有的文本都被预测成了0标签,F1值也是低的离谱,不知道是哪里的原因,请解答

img

你好,根据你提供的信息,可能有以下几个原因:

数据集问题:可能训练集和验证集的数据分布不一致,导致模型在验证集上表现不佳。建议检查一下数据集是否存在标签分布不均衡的情况。

模型问题:可能预训练模型Roberta并不适用于你的数据集,或者模型的超参数设置不合理。建议检查一下模型的配置是否正确,是否需要调整超参数。

代码实现问题:可能代码实现存在问题,例如数据预处理、模型训练、评估等环节出现了错误。建议仔细检查代码实现是否正确。

希望以上信息能对你有所帮助。如果还有其他问题,请随时提出。

  • 这个问题的回答你可以参考下: https://ask.csdn.net/questions/7631039
  • 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:记录我的pytorch安装过程及出现的错误
  • 除此之外, 这篇博客: Pytorch实战之验证码识别中的 验证码识别与之前的几个任务不同,这是一个多标签的分类的任务,也就是是一个数据对应着几个标签,只有所用的标签都预测对时,才算真正的预测成功了。 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读: