2013-04-29 53 views
2

我運行一個工作委員會(PostJobFree.com),其中約有1M個簡歷。平均恢復大小約爲4000字節。 PostJobFree使用ASP.NET/C#/SQL Server 2008 R2和MS SQL全文搜索。2013年度最佳Lucene搜索平臺:Solr還是ElasticSearch?

從閱讀各種文章中,我相信,切換到Apache Lucene搜索將使得搜索速度更快,擴展性更強。但我從來沒有嘗試過。

問題1:是否正確選擇從大約1M文檔標記轉換到Apache Lucene的MS SQL全文搜索還是我不會注意到顯着的搜索速度增加了? 我預計我的數據庫中可搜索文檔的數量每月增長10%左右。

問題2:什麼是最好的Lucene平臺:Solr或ElasticSearch?

這是我迄今發現:

1.谷歌搜索趨勢 http://www.google.com/trends/explore#q=elasticsearch%20search%2C%20solr%20search%2C%20sphinx%20search%2C%20%22sql%20server%22%20%22full-text%20search%22&cmpt=q 截至目前(2013年4月)

  • Solr的似乎是最流行的搜索平臺,在此刻, ,但Solr受歡迎程度在去年(2012年4月 - 2013年4月)完全沒有增長。
  • ElasticSearch正在迅速增長,從2010年 月底開始,但仍然只有40%左右流行的Solr。在2006 - 2009年流行
  • Sphinx搜索增長,是在下降,從 開始的2009年。現在,它是我們所ElasticSearch流行。
  • SQL Server全文搜索長期處於衰退狀態。

做這些趨勢與這些搜索平臺的質量關聯?

2.過去的StackOverflow質疑

StackOverflow上有搜索平臺比較的問題在2010年2月:ElasticSearch, Sphinx, Lucene, Solr, Xapian. Which fits for which usage?

「ElasticSearch」答案由它的創始人吉文巴儂的喜愛當時的情況。

類似的問題是在2012年以後問:Solr vs. ElasticSearch

最普遍的回答再次贊成ElasticSearch的。

3.其他

尼克Zadrosny(誰同時運行Solr的託管服務websolr.com和ElasticSearch託管服務盆景。IO)是ElasticSearch在2012年4月的支持者: https://news.ycombinator.com/item?id=3833735

這裏是尼克的答案今天(2013年4月):

Elasticsearch也往往是多一點初學者友好相比 Solr的。 Elasticsearch擁有更好的API,並且更容易設置 併爲新應用程序進行配置。也就是說,Solr在成熟性和健壯性方面仍然具有一定的優勢,而且當您不需要擔心生產 配置時,學習曲線 不會太不合理。除此之外,兩者在Lucene中共享相同的根,並且 提供類似的功能。或者應該同樣適用於您的需求 。

我想知道「魯棒性」究竟意味着什麼,以及魯棒性差異在未來幾年會發生怎樣的變化?

4.滲流

ElasticSearch具有滲透功能,應該讓我來實現立即交貨的簡歷搜索警報。 Solr有類似的東西嗎?

回答

2

這是一個相當主觀的/本地化的問題,我會貢獻我自己的投票結束,但是我會在問題中引用我的答案。

Solr總是會有很多傳統的接口和API來支持,但它是衆所周知的,並且很好的證明。 Elasticsearch的新開始爲開發者提供了卓越的開發體驗,特別是對於初學者來說,但仍有空間讓它在引擎蓋下成長和成熟。

兩者之間的決定是非常主觀的。我目前的建議是這樣的:如果你有疑問,從Elasticsearch開始。您在那裏學到的概念將會很好地轉化爲Solr,以便在稍後的情況下需要切換。

除此之外,評估其餘的生態系統。如教程,文檔的可用性和質量以及針對您的特定編程語言的高質量開源客戶端。或託管服務提供商,顧問和商業支持合同的可用性。

最終,我認爲Solr和Elasticsearch都在朝着相同的目標努力,爭奪相同的用戶基礎,並將在相似的功能等級上相互銜接。

+1

2015年,我認爲Elasticsearch已經比Solr關閉可用性差距的速度更快地縮短了彈性差距。這些天我的意見是這樣的:如果你有特殊的理由使用Solr,那麼使用它,否則我推薦Elasticsearch。 – 2015-01-16 16:41:44

0

正如尼克說的,我會說給他們一個嘗試。 過了幾分鐘,應該很清楚。

當我在2011年發現Elasticsearch時,很明顯這個項目將成爲主要的項目。這就是現在發生的事情。我在2011年夏季開始在生產中使用它。非常穩定。

免責聲明:我現在在elasticsearch.com工作,但幾個月前我會給你同樣的答案!