你好在你详解自注意力机制及其在LSTM中的应用中4.(多头)自注意力机制在LSTM中的应用中请问最后一个cell输出作为q在哪篇参考文献里面的
应该没有出处,结合注意力机制原理:最后一个cell可以表示整个文本的特征,在注意力机制里就是一个给定的目标,因此可作为查询值query,然后和key计算权重系数,再和value加权求和。