添加注意力机制后的权重如何处理?

问题遇到的现象和发生背景

注意力机制添加后,如何进行重新训练?原有的权重参数是否继续可用?

问题相关代码,请勿粘贴截图
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果