在NLG中，文本对话生成中怎么使用主题一致性的分析？或者语义一致性

文本对话生成模型在训练的时候，当生成得到一句回复，如何判别生成的回复与标准回复主题是一致的？或者所表达的语义是一致的？怎么设计IDA主题模型呢？
也查阅了一些论文，使用交叉熵损失，但是具体实现还是有疑问。
有相关的论文推荐么？与之相关的一些资料
希望得到解答！