求推荐,有没有开源的搜索引擎构架

集团内部网络各分公司主页网站越多越多,各种语言,各种数据库开发的眼花缭乱。想做一个内网的搜索引擎,类似Google,用来索引内部多个网站,在一个界面进行统一搜索。

搜索引擎开发一窍不通,从未接触过,实在不想从头到尾啃书本写一个。求大家推荐相关开源项目,万分感谢。

阅读 9.2k
10 个回答

Apache Solr

Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。

Solr 是一个高性能,采用 Java5 开发,基于 Lucene 的全文搜索服务器。文档通过Http利用XML 加到一个搜索集合中。查询该集合也是通过 http 收到一个 XML/JSON 响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大 Data Schema 来定义字段,类型和设置文本分析,提供基于 Web 的管理界面等。

蜘蛛的话 需要你自己搞定吧(当然也有开源的,不过可能不理想)。。 全文索引的话 可以用 xunsearch xapian coreseek

用lucene就可以了,lucene非常好用,也很简单。 你可以看看lucene in action,java程序员看这本书很快,几天就可以开始动工了!

apache solr

如果是内网,抓取应该不用了吧

直接对分公司网站数据库做索引

我推荐sphinx,还有lucene、solr都是不错的选择

ElasticSearch 实时,分布式,简单,易用,好扩展。

国内的有个不错的

xun-search;

ElasticSearch,就像上面说的实时,分布式,简单,易用,好扩展。可以像操作数据库一样操作它,另外,更方便的是,你不仅仅可以使用java client,还可以使用他的api,摆脱语言限制

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏