利用强化学习实现自动驾驶

想询问一个关于强化学习的问题，我可以在已经创建的场景中来完成强化学习吗？比如场景是下图这样的，我可以选择这个紫色的车来完成强化学习训练吗？比如训练使紫色的车选择最佳策略从A到B点。利用matlab工具最好，其他亦可。

如能提供对应的文献将十分感谢！

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^