首页
编程
java
php
前端
首页
编程
java
php
前端
用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
(RL = reinforcement learning)
点击展开全文