首页
编程
java
php
前端
首页
编程
java
php
前端
如何用DDPG解决离散和连续问题
想问下如果动作空间既有连续的,又有离散的,可以使用DDPG吗,该如何使用,actor网络输出该如何设置,在actor输出层对连续动作使用tanh,离散动作用softmax,这样可行吗
点击展开全文