我找了半天ddpg的复现代码想参考,但要么是tf1要么是pytorch好不容易找到了个tf2的,拿来跑gym的pendulum还报错训练actor时没有梯度求大佬帮助
https://www.csdn.net/gather_28/MtTakgzsOTY5NjItYmxvZwO0O0OO0O0O.html
最近刚好在填这个坑,可以参考一下这里