在一个代码里对10个数据集训练测试验证,每个数据集都有一个loss图,调参的时候是根据每个数据集进行调参吗?
不应该是全部数据集加起来的loss最小吗?除非你能保证你所有的数据集数据分布基本上类似,不然你一个数据集调参到极致,可能下一个数据集就不行了