开源中文搜索引擎XunSearch:http://www.cloud-sun.com/view/product【性能劲爆】XunSearch 单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。【简单易用】前端是使用脚本语言 PHP 编写的开发工具包。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。【功能丰富】除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能。XunSearch作者同时是中文分词SCWS(提供有PECL扩展和完整中文词典)的作者马明练hightman。 segmentfault.com 站内搜索用的就是XunSearch。 或者只使用SCWS进行分词,然后使用MySQL或者SQLite内置的全文检索进行搜索. 更加简单粗暴的是,提示用户用空格隔开分词,服务器端用LIKE进行模糊查询,比如: SELECT * FROM articles WHERE content LIKE '%word1%' OR content LIKE '%word2%'; 数据量不大的情况下,可以使用LIKE和OR实现模糊搜索,可以限制关键词个数,比如最多3个.
开源中文搜索引擎XunSearch:
http://www.cloud-sun.com/view/product
【性能劲爆】XunSearch 单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。
【简单易用】前端是使用脚本语言 PHP 编写的开发工具包。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。
【功能丰富】除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能。
XunSearch作者同时是中文分词SCWS(提供有PECL扩展和完整中文词典)的作者马明练hightman。
segmentfault.com 站内搜索用的就是XunSearch。
或者只使用SCWS进行分词,然后使用MySQL或者SQLite内置的全文检索进行搜索.
更加简单粗暴的是,提示用户用空格隔开分词,服务器端用LIKE进行模糊查询,比如:
数据量不大的情况下,可以使用LIKE和OR实现模糊搜索,可以限制关键词个数,比如最多3个.