首页
编程
java
php
前端
首页
编程
java
php
前端
关于自注意力机制的梯度传递过程
请问在自注意力机制中,已知A=k'*q,且已知A的梯度,如何推导出k和q的梯度?
点击展开全文