2013年度最佳Lucene搜索平台:Solr还是ElasticSearch?

我运行一个工作委员会(PostJobFree.com),里面有大约1M个简历。 平均恢复大小约为4000字节。 PostJobFree使用ASP.NET / C#/ SQL Server 2008 R2和MS SQL全文搜索。

从阅读各种文章我相信切换到Apache Lucene搜索将使搜索更快,更具可扩展性。 但我从来没有尝试过。

问题1 :在大约1M的文档标记处转换MS SQL全文搜索到Apache Lucene是否正确的选择,或者我不会注意到显着的搜索速度增加了吗? 我预计数据库中可搜索文档的数量每月增长10%左右。

问题2 :什么是最好的Lucene平台:Solr或ElasticSearch?

这是我到目前为止发现的:

1. Google搜索趋势 http://www.google.com/trends/explore#q=elasticsearch%20search%2C%20solr%20search%2C%20sphinx%20search%2C%20%22sql%20server%22%20%22full -text%20search%22&cmpt = q截至目前(2013年4月)

  • Solr似乎是目前最受欢迎的搜索平台,但Solr的受欢迎程度在去年(2012年4月 - 2013年4月)没有增长。
  • ElasticSearch从2010年底开始迅速增长,但仍然只有流行的Solr约40%。
  • 狮身人面像搜索在2006-2009年间越来越受欢迎,并从2009年开始下降。现在它与ElasticSearch一样受欢迎。
  • SQL Server全文搜索处于长期下降状态。
  • 这些趋势是否与这些搜索平台的质量相关?

    2.过去的StackOverflow问题

    StackOverflow在2010年2月发布了搜索平台比较问题:ElasticSearch,Sphinx,Lucene,Solr,Xapian。 哪种适合哪种用法?

    其创建者Shay Banon的“ElasticSearch”回答是当时的最爱。

    2012年晚些时候提出了类似的问题:Solr与ElasticSearch

    最受欢迎的答案是再次支持ElasticSearch。

    3.其他

    Nick Zadrosny(负责运行Solr托管服务websolr.com和ElasticSearch托管服务bonsai.io)在2012年4月是ElasticSearch的支持者:https://news.ycombinator.com/item?id=3833735

    这是尼克今天(2013年4月)的答案:

    与Solr相比,Elasticsearch的确更容易入门。 Elasticsearch拥有更好的API,并且对于新应用程序的设置和配置肯定更容易。 也就是说,Solr在成熟性和健壮性方面仍然具有一定的优势,当您不需要担心生产配置时,学习曲线不会太不合理。 除此之外,两者在Lucene中都有相同的基础,并提供类似的功能。 要么同样适合您的需求。

    我想知道“健壮性”究竟意味着什么,以及这种稳健性差异在未来几年会如何变化?

    4.渗滤

    ElasticSearch具有渗透功能,应该允许我实现恢复搜索警报并立即投递。 Solr有类似的东西吗?


    这是一个相当主观的/本地化的问题,我将为自己的投票做出贡献,但是自从我在这个问题中被引用后,无论如何我都会接受一个答案。

    Solr总是会有很多传统的接口和API来支持,但它是众所周知的,并且已经得到很好的证明。 Elasticsearch的新开始为开发者提供了卓越的开发体验,特别是对于初学者来说,但仍有空间让它在引擎盖下成长和成熟。

    两者之间的决定是非常主观的。 我目前的建议是这样的:如果你有疑问,从Elasticsearch开始。 您在那里学到的概念将会很好地转化为Solr,以便在稍后的情况下需要切换。

    除此之外,评估生态系统的其他部分。 如教程,文档的可用性和质量以及针对您的特定编程语言的高质量开源客户端。 或托管服务提供商,顾问和商业支持合同的可用性。

    最终,我认为Solr和Elasticsearch都在朝着相同的目标努力,争夺相同的用户基础,并将在相似的功能等级上相互衔接。


    正如Nick所说,我会说给他们一个尝试。 几分钟后,应该很清楚。

    当我在2011年发现Elasticsearch时,很明显这个项目将成为主要项目。 这就是现在发生的事情。 我在2011年夏季开始在生产中使用它。非常稳定。

    免责声明:我现在在elasticsearch.com工作,但几个月前我会给你同样的答案!

    链接地址: http://www.djcxy.com/p/41277.html

    上一篇: Best Lucene search platform in 2013: Solr or ElasticSearch?

    下一篇: Using sharding with nhibernate.search for partitioning indexes