lucene有这个功能吗?判断重复的条件是什么?可以自己指定吗?
应该不会有吧。
虽然两条数据一样,但存的时候还是相当于两条数据,有两个不同的标识,只是里面的数据一样。luence估计也不能指定某个字段重复就不能存的功能,相当于主键那样。
只能自己写程序判断了。
建立索引之前先把索引文件删除干净,应该是不会出现这情况的。
怎么会有重复的索引呢?
理论上当然是可以的。
不过你要写个比较复杂的filter,对重复的索引的那个不同的field进行过滤。
过滤的规则,我想会根据你这个重复的索引的情况而定,可能会很复杂。
所以,常规来说,我们会对索引进行优化和整理,不允许重复的索引。
好像Lucene提供了类似的filter,DuplicateFilter 不过,不知道能否解决阁下的问题。