我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

SARSA/Q-Learning 为什么是模型无关的?

img

img

按道理,模型有关是指转移概率和即时奖励都是已知的。
然而这里,SARSA/Q-Learning 显然是可以计算出 r 和 s' 的,那为什么我们还说他是模型未知的,既然未知,我们怎么能算出 r 和 s' 呢?

近期文章

  • 黑苹果已经装上了现在找不到EFI引导配置文件了
  • 协议头中有这么几个信息 看起来应该是40位的md5加密 能知道是什么算法么
  • 银行的系统研发岗工作内容是什么?
  • 如何使用python减少重复劳动
  • 一道递归的题,有哪位可以解决一下我的bug!
  • c++解析json是否可以像JAVA一样封装成通用的方法
  • 如何实现网址的后缀加index.php,过360浏览器拦截?
  • 想问下怎么重写这个get_first()呢?
  • IDEA找不到或无法加载类
  • R语言进行列线图分析疑问
  • unity区域光一定要勾选烘焙预览才会显示出来吗?
  • 关于#运行#的问题,如何解决?
  • 急,WTCMS后台管理不显示菜单和扩展工具,请问这如何解决
  • 强化学习的策略梯度是怎么计算的?
  • 软件外包方向毕业的只能去外包公司吗
  • vscode下载-在VS官网下载炒鸡慢
  • GIS出图如何自由调色/<0用渐变蓝色,>0用渐变红表示
  • 虚拟机发udp广播,主机不能接收
  • CS起源绘制方框到错误的地方
  • oracle数据库请问前置sql和后置sql是什么意思?

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华