ValueError: too many values to unpack (expected 4)


 while True:
            # 画图
            if arg_dict['train_render']:
                env.render()
            # 根据e-贪心策略获取动作
            action = agent.sample_action(state)
            # 执行动作,获得下一个状态、奖励和是否结束当前回合的标志,并更新环境
            result = env.step(action)
            print(env.step(action))
            next_state, reward, done, _ = env.step(action)

错误为最后一行
输出为(36, -1, False, False, {'prob': 1.0})
ValueError: too many values to unpack (expected 4)
result那行是自己想找一下对应的量有几个,请问大家知不知道怎么改?俺刚接触Python。

如你所描述,最后一行返回了(36, -1, False, False, {'prob': 1.0}),里面有5个元素,所以需要5个变量来接收,但是你只写了4个,所以报错了。等号左边再加个变量。比如:
next_state, reward, done, temp, _ = env.step(action)

有帮助的话,请点采纳该答案~