有人能給我一個很好的,實際的數據倉庫是什麼定義?DataWarehouse - 什麼是好定義?
回答
我很驚訝,沒有一個張貼Inmon's definition:
倉庫是一個面向主題的, 整合,時變和數據的 非易失性集合 支持管理的決定 製作過程
從同一個頁面,你可以拿起Kimball的定義:
交易數據的副本 特別構建的查詢和分析
我認爲,不幸的是,數據倉庫是一個廣泛的領域。有很多標準範例很少,特別是我正在考慮Kimball的三維建模。 Inmon並不像Kimball's那樣具有特定的方法,因此一些3NF模型可能會或可能不符合他的原則。
因爲Inmon已經擴大了他的倉庫要實現的範圍,它可以包含非結構化數據。但是,非結構化數據的分析與傳統分析非常不同。
應用於SQL Server時,通常SQL Server上最大的數據倉庫是以維度建模的,因爲這非常適合於非分佈式,非大規模並行模型。像Teradata這樣的大規模並行系統通常在3NF模型上表現更好。這些仍然是基於表的系統,各種表與外鍵約束(可能不強制執行,但至少符合邏輯)相關。
當然,我們也看到了像Map/Reduce這樣的NoSQL數據處理系統,這些數據處理系統在我們已經使用了40年的規範化,非規範化或非/非規範化關係數據庫的意義上根本不是數據庫。
數據庫進行檢索優化,一般非規範化的數據,通常星型模式(但可能是雪花),並使用三維建模(事實和維度表)
我剛開始用Datawarehousing和商務大智能環視網頁,你可以找到一些相關鏈接:
我覺得這兩個鏈接可以幫助您瞭解datawarehousi的概念NG。
抱歉,即時通訊新我可以發佈只有一個鏈接^^
很抱歉,但由於垃圾郵件防範機制,新用戶可以最多一個超鏈接只發布。獲得10點聲望發佈更多超鏈接。
雖然這不是一個學術定義,但它可能是一個實際的定義。數據倉庫是數據集的集合,它將數據集合並在一個組織的廣度上。
datamart將包含特定於某些業務部分的數據集。在數據集市中,您可以找到事實數據表,可衡量的信息,以及尺寸,可衡量物品的屬性。
一個真正的數據倉庫將具有一致的維度表,可以跨數據集市共享。
一個例子...
您的公司可能建立各地的銷售數據集市。另一個關於人力資源的數據集市。如果客戶維度表在這兩個數據集中共享,則會將其視爲一致的維度。所有這三個實體一起構成一個數據倉庫。
正如其他人所說,您可以通過搜索Ralph Kimball的數據策略來找到更詳細的信息。
你應該在這裏寫下這篇文章的重要部分,至少因爲鏈接可能被破壞,現在看起來更像是評論,而不是答案。 – Regent 2014-09-08 12:21:04
- 1. 什麼是「userdata指針」的好定義?
- 2. 語義標籤的好處是什麼?
- 3. BDD的定義是什麼?
- 4. 什麼是用戶定義的異常的好名字?
- 5. 什麼是繪製自定義按鈕的更好方法?
- 6. 什麼是好的數據庫模型定義語言?
- 7. 什麼是一個自定義庫的好的JavaScript AJAX庫?
- 8. 什麼是好returnURL
- 9. 什麼是最好的Rails約定呢?
- 10. 什麼是最好的OpenGL java綁定?
- 11. 什麼是自定義調用約定?
- 12. 什麼是「INFO:TLD跳過,URI已經定義」是什麼意思?
- 13. 定義「我的變量將會是什麼」是一個好習慣嗎?
- 14. Datawarehouse與FactInternetSale和FactFinance
- 15. Struts的好處是什麼
- 16. 什麼是'mywikiLoggedOut = 12345678'cookie好?
- 17. 什麼是org.springframework.orm.hibernate3.support.BlobByteArrayType好用?
- 18. 什麼是CIDR的好處?
- 19. 什麼IDE是好的rubyonrails
- 20. 什麼是抽象的真正定義?
- 21. 什麼是Lisp Cons Cell的定義?
- 22. 什麼是A B :: * func()定義?
- 23. 什麼是JFace Action的定義ID?
- 24. 什麼是錯的方法定義
- 25. Kornshell變量定義:什麼是?FOO?
- 26. 「令牌?」的確切定義是什麼?
- 27. 定義顏色時什麼是0x30?
- 28. Perl中「鎖定」的含義是什麼?
- 29. 定義外鍵的優點是什麼
- 30. Tryhaskell.org支持的定義是什麼?
http://en.wikipedia.org/ wiki/Data_warehouse – Rusty 2010-05-21 01:35:45