Zend_Search_Lucene 中文搜索问题

Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。

例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?

请大家给点建议我,无论是不是最终答案。

阅读 3.3k
1 个回答

Lucene默认不支持中文分词,你又想按照“日内瓦”或者“协议”的方式搜索,那是没办法的,全文搜索的索引方式就是这样。

针对Zend_Search_Lucene,网上有人已经实现了简单中文分词了,如果你对分词语义精度要求不高就可以直接用了。自己google下“Zend_Search_Lucene CN_Lucene_Analyzer”

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题