A3C累积奖励为什么先增大后减小?

哪位大神知道A3C程序跑的总奖励函数先增加后衰减是因为什么啊?

https://zhidao.baidu.com/question/1435459701257533699.html