基于某种深度强化学习算法实现贪吃蛇的AI

要求使用某种书本上常见的深度强化学习算法，实现训练场景大小不小于5x5，一次只有一个食物的贪吃蛇的AI，能让蛇吃满整个场景。
希望能讲清楚具体使用哪种算法，整个场景以什么样的格式提交给智能体做决策，奖励系统是什么样的。最好能基于PyTorch提供源代码

你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。