ValueError: too many values to unpack (expected 4)


 while True:
            # 画图
            if arg_dict['train_render']:
                env.render()
            # 根据e-贪心策略获取动作
            action = agent.sample_action(state)
            # 执行动作，获得下一个状态、奖励和是否结束当前回合的标志，并更新环境
            result = env.step(action)
            print(env.step(action))
            next_state, reward, done, _ = env.step(action)

错误为最后一行
输出为(36, -1, False, False, {'prob': 1.0})
ValueError: too many values to unpack (expected 4)
result那行是自己想找一下对应的量有几个，请问大家知不知道怎么改？俺刚接触Python。

如你所描述，最后一行返回了(36, -1, False, False, {'prob': 1.0})，里面有5个元素，所以需要5个变量来接收，但是你只写了4个，所以报错了。等号左边再加个变量。比如：
next_state, reward, done, temp, _ = env.step(action)

有帮助的话，请点采纳该答案~

这个问题的回答你可以参考下: https://ask.csdn.net/questions/7785181
这篇博客你也可以参考下：ValueError:not enough values to unpack/ too many values to unpack