各位大佬,利用主题词生成段落文本的时候,应该利用什么来作为评价指标,看别人的参考文献都是利用BLEU ,但BLEU需要参考句子,那我改如何获取参考句子唉,你们都是人工生成句子段落然后作为参考句子来评价的吗