在NLG中,文本对话生成中怎么使用主题一致性的分析?或者语义一致性

文本对话生成模型在训练的时候,当生成得到一句回复,如何判别生成的回复与标准回复主题是一致的?或者所表达的语义是一致的?怎么设计IDA主题模型呢?
也查阅了一些论文,使用交叉熵损失,但是具体实现还是有疑问。
有相关的论文推荐么?与之相关的一些资料
希望得到解答!