2017-05-04 106 views
12

我想知道將documentDB移動到Azure Data Lake Storage的最佳實踐是什麼。 我應該爲集合中的每個文檔創建一個文件還是移動整個documentDB? 另外我沒有找到關於如何使用U-SQL訪問documentDB的很多信息?將DocumentDB集合移動到Azure Data Lake存儲

輸入將不勝感激。

+0

我想我需要問你爲什麼要這樣做? DocDB和ADL是用於不同目的的不同工具。這是一個永久的舉措。或者您是否只想將數據複製到ADL進行報告?如果是這樣,是否考慮過在數據湖分析服務中使用表格? –

+0

爲了簡化它,我有一些發送到ADL的日誌文件。我也有一個documentDB包含每個文件的附加信息(不要問我爲什麼,但這是它的設置)。所以每個日誌文件都有一個匹配的documentdb文件。 documentDB作爲json文件存儲在ADL中。我可以查詢json文件,但似乎我不能將它作爲documentDB存儲,並直接查詢(這會更好的索引)。 – reachify

回答

1

您目前無法使用U-SQL訪問DocumentDB(或現在稱爲CosmosDB)中的數據。有一個功能請求here。請隨時添加您的投票。

如果您移動數據,組織取決於您希望如何管理數據(刪除全部或僅刪除部分?),它是如何構建的(將相似的結構化數據保存在一起,無論是在同一個文件或同一文件夾中)以及你如何使用它(總是需要它的所有部分?或者只有部分?)以及什麼讓你獲得最佳的性能(更大的文件通常更好,但如果它們是JSON,也要確保提取過程起作用)。

相關問題