最近看了一篇论文《A Connection Between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-BasedModels》有讲到将GAN和GCL结合起来实现逆向强化学习,想请教各位,按照这里面的思路使用PyTorch编写一个模仿学习的程序去模仿一组对gym里面的Pendulum的专家动作。最后的程序里面的关键位置要有注释与论文中的公式、算法步骤相对应。
你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,超出我们目前的服务范围,暂时无法为您解答。
问答VIP目前服务范围为 :Python、Java、MySQL、Redis、MongoDB、HBase、Zookeeper、Kafka、Linux领域专业问题解答,为您提供解决问题的思路和指导。
不提供源码代写、项目文档代写、论文代写、安装包资源发送或安装指导等服务。
本次提问扣除的有问必答次数,已经为您补发到账户,我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。