最近用 lucene的DuplicateFilter过滤器做去重,一开始发现有去重的效果,但是经常会去不干净,看了半天源码,发现在它是每个段过滤一次,如果索引中有多个段中都包含有相同内容,则还是会出来几条记录,这种情况应该怎么处理呢?
最近用 lucene的DuplicateFilter过滤器做去重,一开始发现有去重的效果,但是经常会去不干净,看了半天源码,发现在它是每个段过滤一次,如果索引中有多个段中都包含有相同内容,则还是会出来几条记录,这种情况应该怎么处理呢?
8 回答6.4k 阅读
1 回答4.2k 阅读✓ 已解决
3 回答2.3k 阅读✓ 已解决
2 回答3.2k 阅读
2 回答3.9k 阅读
3 回答1.7k 阅读✓ 已解决
1 回答2k 阅读✓ 已解决