2017-04-13 119 views
1

來自wiki,數據沿襲和數據來源之間有什麼區別?

數據沿襲被定義爲一個數據生命週期,包括數據的起源以及它隨時間推移的位置。它描述了數據在不同流程中發生的情況。它有助於提供對分析管道的可視性,並將追蹤錯誤簡化爲源頭。

數據出處記錄影響感興趣數據的輸入,實體,系統和過程,實際上提供了數據及其起源的歷史記錄。

看來這兩個概念都在談論數據的來源,但我仍然對這些差異感到困惑。兩個概念都一樣嗎?如果他們不同,有人可以分享一個例子嗎?

感謝,

+1

他們很可能是同一件事。我從來沒有聽說過數據的來源。在閱讀了關於數據起源的信息之後,它似乎更多地關注追蹤對文檔的影響而不是任何單一數據,而數據沿襲更多地涉及數據倉庫,其中記錄中的特定列具有明確的源和轉換列表到達那裏,例如解釋源系統(總賬)和任何計算(此賬戶+賬戶)。 –

回答

3

根據我們的經驗,數據出處包括系統針對企業用戶的唯一的高級視圖,這樣他們就可以粗略地瀏覽,他們的數據從何而來。它由各種建模工具或簡單的自定義表格和圖表提供。 數據沿襲是一個更具體的術語,包括兩個方面 - 商業(數據)沿襲和技術(數據)沿襲。業務沿襲圖片數據在業務術語層面流動,它由像Collibra,Alation和其他許多解決方案提供。技術數據沿襲是根據實際的技術元數據創建的,並跟蹤最底層的數據流 - 實際的表格,腳本和報表。技術數據沿襲由諸如MANTA或Informatica Metadata Manager等解決方案提供。

相關問題