Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。
例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?
请大家给点建议我,无论是不是最终答案。
Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。
例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?
请大家给点建议我,无论是不是最终答案。
2 回答1.3k 阅读✓ 已解决
1 回答993 阅读✓ 已解决
2 回答849 阅读✓ 已解决
1 回答1k 阅读✓ 已解决
2 回答906 阅读
1 回答891 阅读
1 回答820 阅读
Lucene默认不支持中文分词,你又想按照“日内瓦”或者“协议”的方式搜索,那是没办法的,全文搜索的索引方式就是这样。
针对Zend_Search_Lucene,网上有人已经实现了简单中文分词了,如果你对分词语义精度要求不高就可以直接用了。自己google下“Zend_Search_Lucene CN_Lucene_Analyzer”