想用transgan论文中生成器transformer和autogan结合进行实验,但是模型一直不收敛,于是问了作者原因。图中是作者回复,按照他的意思就是使用autogan的预训练模型,然后把生成器换成transformer再实验,但是这两个模型权重传播肯定不一样,实验了过后也的确如此。作者现在不回复我了,所以问题就是他的意思到底是啥?
这个你只能是继续问作者了,别人不清楚论文的前因没办法回答你