在服务器上跑transgan,打算用论文里的生成器是transformer,判别器是autogan的模型,但是一直达不到论文里的指标,于是在github上问了作者。按照作者的意思是先训练autogan,然后用它的预训练模型,再把生成器换成transformer,但是这两个模型权重传播不一样,肯定不能简单地换,实验了也确实如此。现在作者一直没回复我,用transgan和autogan原来超参这两个模型都是收敛的,但是结合在一起就不收敛了。现在就是不知道作者的回复到底是啥意思?
这个你只能是继续问作者了,别人不清楚论文的前因没办法回答你