首页
编程
java
php
前端
首页
编程
java
php
前端
gym 自定义环境中observation_space设置
如果我的状态时一串编码序列,如010010001,动作是0和1码元。观测空间应该怎么设置啊
动作空间我是这样设置的
self
.action_space = spaces.Discrete(
2
) # 动作空间为
2
,码元:
0
采样,
1
转发
点击展开全文