while True:
# 画图
if arg_dict['train_render']:
env.render()
# 根据e-贪心策略获取动作
action = agent.sample_action(state)
# 执行动作,获得下一个状态、奖励和是否结束当前回合的标志,并更新环境
result = env.step(action)
print(env.step(action))
next_state, reward, done, _ = env.step(action)
错误为最后一行
输出为(36, -1, False, False, {'prob': 1.0})
ValueError: too many values to unpack (expected 4)
result那行是自己想找一下对应的量有几个,请问大家知不知道怎么改?俺刚接触Python。
如你所描述,最后一行返回了(36, -1, False, False, {'prob': 1.0}),里面有5个元素,所以需要5个变量来接收,但是你只写了4个,所以报错了。等号左边再加个变量。比如:
next_state, reward, done, temp, _ = env.step(action)
有帮助的话,请点采纳该答案~