写了一个DQN算法,训练玩MountainCar-v0,很快就可以了。
但玩Breakout-ram-v0,训练了一个小时还是玩不好。请问一个Atari的游戏需要训练多久才可以玩的很好?谢谢
一般要几百万次以上,训练时间很长,一天一夜也有可能不收敛