Lucene Highlighter 高亮词前后的词的个数?

highlighter.setTextFragmenter(new SimpleFragmenter(15));//高亮词前后15 个字?

该回答引用ChatGPT

是的,Lucene Highlighter可以使用SimpleFragmenter来设置高亮词前后的文本片段大小(即所谓的“上下文大小”)。


在您的示例中,使用SimpleFragmenter(15)会将高亮词前后的15个字符作为文本片段进行高亮显示。也就是说,如果高亮词在文本中出现在单词边界上,那么您将获得包含15个字符的文本片段,其中包括高亮词前面的最后一个单词和高亮词后面的第一个单词。如果高亮词在单词中间,则文本片段将包含该单词的完整文本,并且在高亮词之前和之后都包含最多15个字符的上下文。


您可以根据需要自定义SimpleFragmenter的大小,以便显示足够的上下文来提供更好的上下文信息。