2012-03-12 97 views
0

我搜索一種方法來估計索引時間,索引大小,搜索時間與lucene庫。lucene估計索引大小,搜索時間

我有一些500個文件的數量,我想估計5000文件的價值。

我在網上搜索,我沒有找到任何好方法來估計論文數量。

+0

將5000個示例文檔放在索引中並嘗試使用。不要猜測;實驗和測量。 – 2012-03-12 22:25:09

+0

當文件非常少時就可以了......但是如果我想估計2億份文件,我無法真正使用這種方法...... – 2012-03-12 22:41:41

+1

如果您有20億份文件,您是否真的想要以您的文件爲基礎資源分配上的猜測?老實說,這就是負載測試(不是負載猜測)最關鍵的地方。 – 2012-03-12 22:54:35

回答

0

答案很大程度上取決於你放入索引的內容。顯然,如果存儲全部字段內容,那麼您至少可以預期線性增長,其因子在1的數量級之內。如果您只對條件進行索引,則所需的空間會少得多,但同時估計的會變得更加困難。例如,唯一索引項的數量是非常重要的因素。這可能會開始逐漸平息,這取決於您的內容的細節。總而言之,在這種情況下,測量可能是您唯一可靠的方法。