使用sBert寻找相似问题返回集过于相似

使用sBert寻找相似问题时，部分问题并不相关，但是返回过来的问题集，相似度很高，请问如何识别解决？

方案来自梦想橡皮擦狂飙组基于 GPT 编写的 “程秘”

对于使用sBert寻找相似问题时返回的部分不相关问题，可以考虑以下几种方式进行识别和解决：

手动筛选：可以手动查看每个相似问题，并通过人工判断其是否与原问题相关，筛选出与原问题相关的问题集。
调整阈值：可以调整sBert的相似度阈值，将相似度低于一定阈值的问题排除，只保留相似度较高的问题集，从而提高相关问题的比例。
添加关键词：可以根据业务需求，添加关键词或者特定的文本规则，筛选出与原问题相关的问题。例如，可以在sBert返回的问题中，筛选出包含原问题中关键词或特定文本规则的问题。
调整模型：可以尝试使用不同的sBert模型或其他文本相似度计算方法，找到更符合业务需求的模型。

需要根据具体情况进行调整和尝试，以提高返回相关问题的准确率。