2010-07-30 103 views
7

對不起,如果我在這裏遇到任何術語錯誤,但希望您明白我的意思。Windows Azure雲存儲 - 根目錄中大量文件的影響

我正在使用Windows Azure雲存儲來存儲大量的小文件(圖像,每個20Kb)。

當時,這些文件都存儲在根目錄中。我知道這不是一個普通的文件系統,所以也許root並不是正確的術語。

我試圖找到這個計劃的長期影響的信息,但沒有運氣,所以如果任何人可以給我一些信息,我會很感激。

基本上,如果存儲在這個根中的文件數量最終達到數十萬/數百萬,我會遇到問題嗎?

感謝,

史蒂芬

+0

這回答你的問題? – Caladain 2010-07-30 14:35:37

+0

這兩個回答都回答了我的問題。多謝你們。不知道我是否可以給你兩個綠色的勾號,但我會嘗試。 – 2010-08-02 16:39:54

回答

7

我一直在類似的情況下,我們在一個BLOB容器中存儲〜10M個小文件。通過代碼訪問單個文件很好,沒有任何性能問題。

我們遇到問題的地方在於管理代碼之外的許多文件。如果您使用的是存儲瀏覽器(VS2010或其他任何版本),我遇到的那些不支持前綴API的返回文件,您只能列出第一個5K,然後是接下來的5K等等。當你想查看容器中第125,000個文件時,你可以看到這可能是一個問題。

另一個問題是,沒有簡單的方法找出容器中有多少文件(這對於確切知道所有blob存儲的成本是多少非常重要),而無需編寫只需迭代的文件所有的斑點和數量。

這對我們來說是一個很容易解決的問題,因爲我們的blob具有連續的數字名稱,所以我們只是將它們分成了每個1k項目的文件夾。根據你有多少物品,你可以將這些文件夾的1K分組到子文件夾中。