我正在嘗試創建大約200萬條記錄的lucene。索引時間大約爲9個小時。 你能否建議如何提高性能?如何:增加Lucene .net索引速度
7
A
回答
0
提高Lucene索引性能的最簡單方法是調整IndexWriter的mergeFactor實例變量的值。這個值告訴Lucene將多少個文檔存儲在內存中,然後再將它們寫入磁盤,以及將多個段合併在一起的頻率。
http://search-lucene.blogspot.com/2008/08/indexing-speed-factors.html
3
我寫了一篇關於如何並行Lucene索引一個可怕的職位。它真的寫得非常糟糕,但你會發現它here(有一些示例代碼,你可能想看看)。
無論如何,主要的想法是你把你的數據分成大塊,然後在單獨的線程上工作。當每件作品完成後,你將它們全部合併成一個索引。使用上述方法,我能夠索引約4百萬條記錄。 2小時。
希望這給你一個從這裏走的想法。
1
除了寫入方面(合併因子)和計算方面(並行化)之外,這有時是由於最簡單的原因:輸入緩慢。許多人從數據庫建立Lucene索引。有時候你發現這個數據的特定查詢過於複雜而且速度很慢,無法很快返回所有(200萬?)記錄。嘗試只查詢和寫入磁盤,如果它仍然在5-9小時的順序,你已經找到了一個優化的地方(SQL)。
1
下面的文章真的幫了我,當我需要加快速度:
http://wiki.apache.org/lucene-java/ImproveIndexingSpeed
我發現,文獻建設是我們的主要瓶頸。在優化數據訪問和實施其他一些建議之後,我大大提高了索引性能。
相關問題
- 1. 增量索引lucene
- 2. 在Lucene中增加索引之後應該優化索引嗎?
- 3. 增加速度
- 4. 如何增加ClickOnce下載速度?
- 5. 如何增加NavigatorIOS轉換速度?
- 6. lucene如何索引文件?
- 7. 如何讀取Lucene索引?
- 8. 索引如何使速度更快?
- 9. 如何加快ColdFusion中.NET AD的數據檢索速度?
- 10. 使用codeigniter的速度全文搜索索引速度不如速度
- 11. 增加webservice的速度 - howto
- 12. 增加紙板速度
- 13. 增加pyserial readline速度
- 14. 如何使用Lucene FieldCache進行搜索速度提升?
- 15. 與btree索引相比,位圖索引如何加快查詢速度?
- 16. Lucene:搜索時加載索引文件?
- 17. Lucene索引
- 18. Apache lucene索引
- 19. Lucene索引MAXFieldLength
- 20. Jackrabbit Lucene索引
- 21. Zend Lucene索引
- 22. Lucene索引
- 23. Lucene .NET索引的索引瀏覽器(UI工具)
- 24. 在lucene.net中使用azure庫搜索lucene索引時速度有點慢
- 25. lucene.net索引速度下降
- 26. 如何加快併發Lucene應用程序的速度?
- 27. 加速搜索.net 4.0
- 28. 增加大文件的加載速度
- 29. Lucene索引優化
- 30. Lucene索引大小
嗨埃斯特班 謝謝你的迴應。我正在尋找類似於你所做的事情。您能否在您的博客中張貼一些代碼片段。 謝謝, Gokul – Gokul 2009-06-27 04:52:43