构建你自己的自定义 Lucene 查询和评分器 - SegmentFault 思否

构建你自己的自定义 Lucene 查询和评分器

发布于 2014-02-10

主要观点：

有时会遇到普通 Solr 相关性无法解决的搜索问题，客户希望精确控制文档的评分，可采用构建自定义 Lucene 查询的方式。
构建自定义 Lucene 查询应是搜索相关性的“核选项”，需在尝试多种 Solr 功能和插件后仍无法解决问题时使用。
介绍了 Lucene 搜索的基本概念，包括 IndexSearcher、IndexReader、Query 等类，以及自定义 Lucene 查询的一般结构（包含 Query、Weight、Scorer 三个类）。
详细阐述了自定义 BackwardsTermQuery 的实现，包括创建 Query、Weight 和 Scorer 类，以及各部分的功能和实现细节。
强调了单元测试的重要性，给出了相关示例。

关键信息：

自定义 Lucene 查询的步骤：创建自定义 Query 类（继承自 Query）、自定义 Weight 类（继承自 Weight）、自定义 Scorer 类（继承自 Scorer），它们相互包裹，Query 创建 Weight，Weight 创建 Scorer。
BackwardsTermQuery 的实现细节，如构造函数中创建反向和正向的 TermQuery，重写 createWeight()、equals()、hashCode()等方法，在 Weight 中实现 getValueForNormalization()和 normalize()方法，在 Scorer 中实现 docID()、nextDoc()、advance()和 score()方法。
单元测试的重要性及示例代码位置。

重要细节：

IndexSearcher 用于执行搜索，通过 IndexReader 访问倒排索引，Query 定义搜索方式和评分规则。
Similarity 类定义计算规范的规则和公式。
Weight 用于跟踪 IndexSearcher 级别的统计信息，Scorer 负责识别匹配项并提供评分。
DocIdSetIterator 是索引中文档集的游标，Scorer 实现了该接口用于迭代匹配项。
在自定义查询中，要注意满足 Lucene 的期望，如正确重写相关方法，以确保查询的正确性和性能。

Build Your Own Custom Lucene Query and Scorer

https://dzone.com/articles/build-your-own-custom-lucene

阅读 25

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。