强化学习和生成对抗网络在路径规划中终点什么时候输入的

强化学习和生成对抗网络在路径规划中终点是怎样体现的?是开始时输入的吗?但是代码里怎么没有体现呢,请大家帮我看一下这个代码,万分感谢!

[1]戴大东. 智能停车导航方法研究与应用[D].苏州科技大学,2020.DOI:10.27748/d.cnki.gszkj.2020.000321.

img