2012-04-18 90 views
7

我有超過100個CSV文件,其中有10000行,我正在索引。然後查詢拼寫是類似的拼寫。雖然這樣做索引是非常緩慢的。Solr索引緩慢

我已經發現了一些好的解決辦法

  1. 主從哪裏主索引的和從被用於查詢。 How to index records in Solr faster (and not impact ColdFusion web server)? Two JVM?

  2. 使用三範圍http://www.lucidimagination.com/blog/2009/05/13/exploring-lucene-and-solrs-trierange-capabilities/

我知道這兩種解決方案是不同的,我想一些意見應該是更高的優先級?第二種解決方案適合我的問題嗎?如果我的拼寫檢查問題存在更多解決方案。

在此先感謝

+0

你能準確地描述你目前在做什麼嗎?你如何編制索引以及如何運行查詢? – jpountz 2012-04-24 10:15:21

回答

8

索引通常會使查詢變慢。如果磁盤速度很快,索引將使用100%的CPU,否則將使用100%的磁盤帶寬。無論哪種方式,查詢都會很慢。

主/從配置是此標準解決方案。從屬服務器專用於搜索查詢。他們放慢速度的唯一時間是在複製之後,創建帶有新緩存的新Searcher時。

主/從配置可能不會使索引速度更快,但它會避免查詢性能下降。一直在做索引多線程的工作,所以你可能想要一次測試多個索引任務。如果瓶頸是磁盤IO,只有當它使用一個CPU的100%時,這將無濟於事。

Trie字段非常適合範圍查詢。我懷疑他們會對索引速度產生太大影響。

最後,您可能想要調整拼寫建議選項。拼寫建議可能需要很多工作,並且您可以使用不同的,更便宜的選項獲得良好的結果。

+0

完美答案!只是爲了說清楚,因爲問題在談論兩個JVM。你需要2個不同的機器。 – fulmicoton 2012-04-24 11:40:58