2010-06-22 160 views
18

客戶問我「數據倉庫」這個詞是什麼意思。什麼是數據倉庫?

我想到了ETL,數據模型的細節,與NoSQL,雲,'正常'數據庫管理系統,MDM(主數據管理)等的區別,但無法用他的幾句話來形容這個術語。 ..(其實我做了一些交談,並留下了他未亮。)

如何「數據倉庫」,在1-3(或略偏)的句子描述?

回答

15

對於非技術人員來說,最好的辦法是將其描述爲「存儲在專用計算機系統中的巨大數據量數據通常與某個特定領域相關,而整個系統被設計爲快速且針對一些特殊任務進行了優化。存儲在數據倉庫中的數據主要用於分析或決策過程。「

不知道這是否足夠:)在互聯網上有很多關於這個主題的參考,但如果有人問我一個快速定義,我會用類似於我上面寫的東西。

5

wiki

數據倉庫是一個 組織的電子存儲 數據,旨在促進報告 和分析1的存儲庫。

數據倉庫 的定義側重於數據存儲。然而, 意味着檢索和分析數據,到 提取,轉換和加載數據,而 管理數據字典也 被認爲是一個 數據倉庫系統的重要組成部分。很多 引用數據倉庫使用 這個更廣泛的上下文。因此, 擴展定義的數據 倉儲包括業務 智能工具,提取工具, 變換和加載數據到 存儲庫,和工具來管理和 檢索元數據。

4

數據倉庫試圖使不同系統看起來是同質的,而不管底層技術或存儲機制如何。

你可以進入「爲什麼」數據倉庫的,但那是一個不同的問題。

5

至少在理論上,一個數據倉庫的想法是從各種現有的系統,其通常被認爲是不切實際重寫直接整合數據的提供數據的統一視圖。因此,數據倉庫從這些現有系統收集數據,並提供(至少是幻想)所有數據在一個地方,因此可以用一種方式查詢。

的主要目的是(通常)以允許從現有系統中的數據之間的相關性。例如,你可以比較你的銷售人員與客戶的X花了多少時間(這是存儲在一個系統)倍受客戶X如何買(存儲在第二個系統)和客戶X是他們接受什麼樣多麼幸福(存儲,當然,在第三個系統中)。

從實際的角度來看,這通常意味着客戶的想法是介於定義不明確和完全瘋狂之間。成本和時間表幾乎不可能猜到,而且可靠的估計顯然是不可能的。提供他真正想要的東西幾乎肯定是不可能的,找出有用的東西需要花費足夠的時間和工作,所以你的第一步是讓你所做的事情足夠技術化,以至於他不會有一顆心當他得知成本和/或時間表時發生攻擊。

0

從實踐的角度來看:企業變化,環境發生變化,昨天的重要問題可能不是今天,很可能不會是明天。在處理CEO級別的問題時尤其如此。

如果您無法預見問題會是什麼,您唯一的選擇就是提供快速回答問題的方法。這就是數據倉庫試圖或聲稱要做的事情。數據來自何處,以及來自多少不同系統的數據並不重要。

許多數據倉庫在「快速回答任何問題」方面失敗了,因爲他們的技術要求您將可用的原始數據「內外」(製作多維數據集)以確保「快速」。定義這些立方體限制了可以回答的各種問題。

2

數據倉庫是一個數據庫,數據加載和報告系統,用於彙總來自多個來源的數據並以易於提取和報告的方式呈現數據。從實際情況來看,一個成功的數據倉庫項目的好處是:

  • 統計和財務報告 - 數據倉庫可以很容易與聚合數據的工作,並從中獲得有用的分析,尤其是當你有65537或更多行數據。

  • 數據安全 - 數據表現良好,對年輕玩家沒有陷阱。臨時報告系統可供沒有經驗的用戶使用,在報告中無意識地產生無效結果的風險較低。

  • 透明度 - 業務可以查看和識別底層系統中的數據問題。數據倉庫可以成爲推動數據質量工作的好工具。

  • 賦權 - 最終用戶報告工具應支持大部分管理信息要求,只需要一套最低限度的要求由技術專家開發定製報告。

2

KISS ......

數據倉庫是與給定組織及其活動數據的存儲庫。這些數據將允許分析和報告組織在各個相關方面的表現,如時間,結構,活動流。可以將這些維度組合起來,並通過相關層次聚合結果。

-3

簡單來說...

數據倉庫是控制包含關於「真正的項目」控制位置,股票,運動,報告,審計,任何一個真正的倉庫物品的方式在「真正的倉庫「。

我希望它更簡單。

+0

哦,不,恐怕不是。閱讀其他一些答案,瞭解術語「數據倉庫」。 – 2012-07-26 03:47:56

+0

哦,天啊..謝謝你先生。大衛。你的評論讓我閱讀所有這個頁面。比我需要重新思考數據倉庫。 – 2012-07-26 08:32:22

0

從我所知道的數據倉庫不過是一個專爲查詢和分析而設計的關係數據庫。它通常包含來自交易數據的歷史數據。

按照威廉Inmon,數據倉庫的定義是:

數據倉庫是支持管理層的決策數據的面向主題的,集成的,非易失的,隨時間變化的集合。

和上面的定義是合理的,完善的,如果我們認爲合理,可以從here

2

哇理解,我做了一些研究。這是我遇到的一個非常好的答案:

數據倉庫...是數據交易的複製版本,它是特別結構化的,用於查詢,分析和報告。在一個非常簡單的定義,術語數據倉庫是指存儲在一個有組織的方式,使他們能夠訪問和對未來的報告和文件分析檢索系統收集數據的過程

這是一個從「Data Warehouse 100 Success Secrets」通過Richard Martin

0

數據倉庫是一種關係數據庫,專爲查詢和業務分析而非事務處理而設計。它包含從事務數據導出的歷史數據。這些歷史數據被業務分析師用來詳細瞭解業務。

數據倉庫應具有以下特點:

  1. 面向主題:

數據倉庫有助於分析數據。例如,要了解公司的銷售情況,數據倉庫需要建立在銷售數據上。使用這個數據倉庫,我們可以找到去年的銷售情況。這種按主題(銷售)定義數據倉庫的能力使其成爲面向主題。

  • 集成:
  • 瞻來自不同源的數據,並把它們在一個一致的格式。這包括解決措施的單位,命名衝突等

  • 非揮發性:
  • 一旦數據進入數據倉庫,該數據不應當被更新。

  • 時變:
  • 分析業務,分析師需要大量的數據。所以,數據倉庫應該包含歷史數據。