想询问一个关于强化学习的问题,我可以在已经创建的场景中来完成强化学习吗?比如场景是下图这样的,我可以选择这个紫色的车来完成强化学习训练吗?比如训练使紫色的车选择最佳策略从A到B点。利用matlab工具最好,其他亦可。
如能提供对应的文献将十分感谢!