我運行一個工作委員會(PostJobFree.com),其中約有1M個簡歷。平均恢復大小約爲4000字節。 PostJobFree使用ASP.NET/C#/SQL Server 2008 R2和MS SQL全文搜索。2013年度最佳Lucene搜索平臺:Solr還是ElasticSearch?
從閱讀各種文章中,我相信,切換到Apache Lucene搜索將使得搜索速度更快,擴展性更強。但我從來沒有嘗試過。
問題1:是否正確選擇從大約1M文檔標記轉換到Apache Lucene的MS SQL全文搜索還是我不會注意到顯着的搜索速度增加了? 我預計我的數據庫中可搜索文檔的數量每月增長10%左右。
問題2:什麼是最好的Lucene平臺:Solr或ElasticSearch?
這是我迄今發現:
1.谷歌搜索趨勢 http://www.google.com/trends/explore#q=elasticsearch%20search%2C%20solr%20search%2C%20sphinx%20search%2C%20%22sql%20server%22%20%22full-text%20search%22&cmpt=q 截至目前(2013年4月)
- Solr的似乎是最流行的搜索平臺,在此刻, ,但Solr受歡迎程度在去年(2012年4月 - 2013年4月)完全沒有增長。
- ElasticSearch正在迅速增長,從2010年 月底開始,但仍然只有40%左右流行的Solr。在2006 - 2009年流行
- Sphinx搜索增長,是在下降,從 開始的2009年。現在,它是我們所ElasticSearch流行。
- SQL Server全文搜索長期處於衰退狀態。
做這些趨勢與這些搜索平臺的質量關聯?
2.過去的StackOverflow質疑
StackOverflow上有搜索平臺比較的問題在2010年2月:ElasticSearch, Sphinx, Lucene, Solr, Xapian. Which fits for which usage?
「ElasticSearch」答案由它的創始人吉文巴儂的喜愛當時的情況。
類似的問題是在2012年以後問:Solr vs. ElasticSearch
最普遍的回答再次贊成ElasticSearch的。
3.其他
尼克Zadrosny(誰同時運行Solr的託管服務websolr.com和ElasticSearch託管服務盆景。IO)是ElasticSearch在2012年4月的支持者: https://news.ycombinator.com/item?id=3833735
這裏是尼克的答案今天(2013年4月):
Elasticsearch也往往是多一點初學者友好相比 Solr的。 Elasticsearch擁有更好的API,並且更容易設置 併爲新應用程序進行配置。也就是說,Solr在成熟性和健壯性方面仍然具有一定的優勢,而且當您不需要擔心生產 配置時,學習曲線 不會太不合理。除此之外,兩者在Lucene中共享相同的根,並且 提供類似的功能。或者應該同樣適用於您的需求 。
我想知道「魯棒性」究竟意味着什麼,以及魯棒性差異在未來幾年會發生怎樣的變化?
4.滲流
ElasticSearch具有滲透功能,應該讓我來實現立即交貨的簡歷搜索警報。 Solr有類似的東西嗎?
2015年,我認爲Elasticsearch已經比Solr關閉可用性差距的速度更快地縮短了彈性差距。這些天我的意見是這樣的:如果你有特殊的理由使用Solr,那麼使用它,否則我推薦Elasticsearch。 – 2015-01-16 16:41:44