我知道lucene創建索引並存儲所有數據。任何一個人都可以告訴我數據如何存儲在平面文件中?或者他們使用什麼樣的算法將數據存儲在後端,以便他們可以快速檢索數據?lucene中如何存儲數據
12
A
回答
4
你可以閱讀這本書http://nlp.stanford.edu/IR-book/瞭解信息檢索系統中使用
4
你可以找到所有在file formats部分解釋了數據結構,算法和模型。
8
不知道這是你所要求的。但更一般的答案是他們使用/實現了一個Inverted Index。關於Lucene如何存儲它的具體細節,你可以在file formats(如米蘭說的)中找到。
但一般的想法是,他們存儲倒轉索引數據結構和其他輔助數據結構,以幫助快速回答查詢。例如,它爲每個文檔和每個詞的IDF存儲一個規範向量(inverse document frequency)。 Lucene也存儲實際的文檔字段,但是這在反轉索引之外。
相關問題
- 1. Lucene作爲數據存儲
- 2. Lucene如何緩存數據?
- 3. Lucene存儲的數據類型
- 4. 如何將樹數據存儲在Lucene/Solr/Elasticsearch索引或NoSQL數據庫中?
- 5. 在數據庫或Lucene索引文件中存儲字段
- 6. 將用戶數據存儲在lucene中或查詢rdbms?
- 7. 存儲在數據庫中的lucene索引使用java中的數據對象
- 8. HDR數據如何存儲?
- 9. 如何將數據存儲到數據存儲 - AppEngine
- 10. 如何在Suave userstate中存儲數據?
- 11. 如何在數據庫中存儲
- 12. 如何將數據存儲到NSMutableString中?
- 13. 如何在數據庫中存儲「\」?
- 14. 如何在android數據庫中存儲
- 15. 如何在sqlite中存儲數據表?
- 16. 如何在GAE數據存儲區中正確保存數據?
- 17. 如何使用ajax在數據存儲中存儲blobstore映像?
- 18. 如何刪除存儲在本地存儲中的數據?
- 19. 如何在谷歌雲數據存儲中存儲字符串[] []
- 20. 使用lucene存儲索引元數據或Amazon SimpleDB?
- 21. 將Lucene存儲庫與源數據同步的最佳實踐?
- 22. 使用Lucene存儲來自RSS源的數據
- 23. 如何在Lucene中存儲多個不同類型的文檔
- 24. 如何在Lucene中存儲對象關係?
- 25. 存儲器中的數據存儲 - Javascript
- 26. 如何在HTML5中將數據存儲到數據庫中
- 27. 節點:如何存儲JSON數組在谷歌數據存儲
- 28. 如何在數據庫中存儲低基數主數據
- 29. 如何將php數組數據存儲到mysql數據庫中
- 30. 如何將數據存儲在存儲在變量中的數組中?
這是一本很好的入門級書籍,但它與這個問題有點不相關,仍然是一個很好的參考。 – linjunhalida 2013-10-21 12:53:51
另外還有一本很棒的信息檢索書,它現在提供免費內容:https://ciir.cs.umass.edu/irbook/ – realjin 2016-12-26 01:35:19