Lucene是现在最为流行的全文检索工具集(框架),Lucene使用Java语言开发,现在为Apache开源项目之一。
文章介绍了全文检索的基础概念和工作原理,主要包括以下几点内容:
倒排索引的基本概念
索引创建过程:文档集合、分词与自然语言处理、构建多级索引链形成索引库,索引库的相关属性:文档频率、词频两个维度。
用户查询过程:分词与自然语言处理、构建语法树、相关性排序(向量空间模型算法)。
lucene 官网:http://lucene.apache.org/
Lucene是现在最为流行的全文检索工具集(框架),Lucene使用Java语言开发,现在为Apache开源项目之一。
文章介绍了全文检索的基础概念和工作原理,主要包括以下几点内容:
倒排索引的基本概念
索引创建过程:文档集合、分词与自然语言处理、构建多级索引链形成索引库,索引库的相关属性:文档频率、词频两个维度。
用户查询过程:分词与自然语言处理、构建语法树、相关性排序(向量空间模型算法)。
lucene 官网:http://lucene.apache.org/
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。