强化学习算法训练后如何用tensorboard统计环境返回的info内的数据?

强化学习算法训练后如何用tensorboard统计环境返回的info内的数据?

用rl算法训练后,需要用tensorboard统计env返回的info内的一些数据,但无法读取字典。

  • 在算法.py文件的 writer = SummaryWriter() 语句后使用:writer.add_scalar("xxx", env.info.get("key"), args.epoch) 或info[“key”]

  • 出现报错:NotImplementedError: Got , but numpy array, torch tensor, or caffe2 blob name are expected.

  • 检查发现在env中打印字典内数据是可以的,但在算法文件内打印出来全都是None。

已解决,是算法代码的问题,在另一个文件里修改