使用sBert寻找相似问题时,部分问题并不相关,但是返回过来的问题集,相似度很高,请问如何识别解决?
方案来自 梦想橡皮擦 狂飙组基于 GPT 编写的 “程秘”
对于使用sBert寻找相似问题时返回的部分不相关问题,可以考虑以下几种方式进行识别和解决:
手动筛选:可以手动查看每个相似问题,并通过人工判断其是否与原问题相关,筛选出与原问题相关的问题集。
调整阈值:可以调整sBert的相似度阈值,将相似度低于一定阈值的问题排除,只保留相似度较高的问题集,从而提高相关问题的比例。
添加关键词:可以根据业务需求,添加关键词或者特定的文本规则,筛选出与原问题相关的问题。例如,可以在sBert返回的问题中,筛选出包含原问题中关键词或特定文本规则的问题。
调整模型:可以尝试使用不同的sBert模型或其他文本相似度计算方法,找到更符合业务需求的模型。
需要根据具体情况进行调整和尝试,以提高返回相关问题的准确率。