集团内部网络各分公司主页网站越多越多,各种语言,各种数据库开发的眼花缭乱。想做一个内网的搜索引擎,类似Google,用来索引内部多个网站,在一个界面进行统一搜索。
搜索引擎开发一窍不通,从未接触过,实在不想从头到尾啃书本写一个。求大家推荐相关开源项目,万分感谢。
集团内部网络各分公司主页网站越多越多,各种语言,各种数据库开发的眼花缭乱。想做一个内网的搜索引擎,类似Google,用来索引内部多个网站,在一个界面进行统一搜索。
搜索引擎开发一窍不通,从未接触过,实在不想从头到尾啃书本写一个。求大家推荐相关开源项目,万分感谢。
ElasticSearch,就像上面说的实时,分布式,简单,易用,好扩展。可以像操作数据库一样操作它,另外,更方便的是,你不仅仅可以使用java client,还可以使用他的api,摆脱语言限制
Apache Solr
Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。
Solr 是一个高性能,采用 Java5 开发,基于 Lucene 的全文搜索服务器。文档通过Http利用XML 加到一个搜索集合中。查询该集合也是通过 http 收到一个 XML/JSON 响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大 Data Schema 来定义字段,类型和设置文本分析,提供基于 Web 的管理界面等。