神经网络加入注意力模块后,原有网络的预训练模型还能不能使用了

神经网络加入注意力模块后,原有网络的预训练模型还能不能使用了

可以用啊,只不过效果不如之前而已,但是还是会比直接随机初始化网络好

不能,结构都不一样了,权重参数传不了的

望采纳
原有预训练模型可以为你现在的模型初始化权重参数

可以使用的,只是加载原来的权重有点费劲。