data-warehouse

    0熱度

    1回答

    民間, 我有一個稱爲DIM_FILE的維度表,它保存我們從客戶那裏收到的文件的信息。每個文件都有詳細記錄,構成我的FACT表CUST_DETAIL。在主流程中,文件經歷了幾個階段,每個階段都爲其添加了一個狀態。總而言之,我有多對多的關係。圍繞星型模式尺寸建模的任何想法。客戶記錄只屬於一個文件,並且文件可以具有多個狀態。 FACT ---- CustID FileID AmountDue

    0熱度

    1回答

    我有一個類型2數據的數據庫表,我想查找自上次同步後刪除的記錄。它有date_from和date_to列,原始數據有一個ID列object_id。 date_to<>null表示它現在不存在,所以如果沒有其他記錄與object_id和date_to=null相同,則表示它已被刪除。 我相信一個天真的實施將是這樣的: select * from data_t2 a where a.date_to >

    3熱度

    2回答

    假設您有一個具有Type 2緩慢變化維度的表格。 讓我們表達這種表如下,以下列: * [Key] * [Value1] * ... * [ValueN] * [StartDate] * [ExpiryDate] 在這個例子中,讓我們假設[起始日期]爲有效日期,其中一個給定[關鍵]成爲已知值系統。所以我們的主鍵將由[StartDate]和[Key]組成。 當一組新的值到達給定的[Key

    3熱度

    6回答

    我想弄清楚什麼要調用我的數據庫表中保存INT到特定「記錄版本」的列。我目前使用「RecordOrder」,但我不喜歡那樣,因爲人們認爲更高=更新,但是我使用它的方式,更低=更新(以「1」爲當前記錄,「2 「成爲第二最新的」,「3」更老,等等)。我認爲「RecordVersion」,但我恐怕會有同樣的問題。還有其他建議嗎? 「RecordAge」? 我這樣做是因爲當我插入到表中時,而不必知道下一個版

    1熱度

    3回答

    我正在研究構建一些數據倉庫/查詢基礎架構,現在在Map/Reduce解決方案(如Hadoop)之上。 但是,所有M/R工作都只是重複RDBMS人員在過去20年中用並行SQL數據庫解決的問題。並行SQL實現擴展了跨節點的讀寫操作,就像M/R一樣,但是還包含常規數據庫(SQL,現有集成庫等)的細節。 問題是:您似乎無法找到那些在線發佈的公司的客戶。那麼,這裏有沒有人有這些解決方案的經驗,並可以給我一些

    0熱度

    2回答

    我是OLAP的新手。 我瞭解表結構和ETL過程。 我不明白何時數據應該從事實表中刪除。 假設我正在爲事件創建報告應用程序。每個事件都有完成所花費的時間,退出代碼和總字節數。有幾個維度,例如時間和地點。 假設我每天有100萬條新紀錄準備好放入我的事實表中,總共1 GB。 如果我的ETL過程只將數據添加到我的事實表中,它會無限增長。 什麼時候應該從我的事實表中刪除數據?我應該將數據分成幾個事實表(例如

    2熱度

    3回答

    過去我們用來通過存儲過程訪問數據庫。他們被認爲是管理數據的「更好的」方式。我們將數據保存在數據庫中,任何語言/平臺都可以通過JDBC/ODBC /等訪問它。然而,近年來,基於運行時反射/基於元數據的存儲檢索機制,如Hibernate/DataNucleus已經變得流行。起初我們擔心由於涉及的額外步驟(反射很昂貴)以及他們如何在我們需要的只是一個字段時檢索不必要的數據(整個對象),他們會變得很慢。

    1熱度

    1回答

    數據倉庫應用程序是否存在預期的tempDB大小。 10演出過多? 經常遇到大量查詢。 數據倉庫本身是50演出。 我正在使用SQL Server 2000

    1熱度

    1回答

    我正在開發一個數據倉庫,作爲我公司企業應用程序套件的一部分。所以我一直在學習很多關於DW概念的知識,但規則引擎似乎很難,我也找不到有關各種實現方式的很多信息。規則的重點是驗證數據質量,並在達到某些業務指標時發出警報(例如,本月的銷售額爲$ xx.xx) 我們的應用程序需要爲每個客戶端進行定製,所以我想要使規則具有通用性。有什麼方法可以實現規則引擎? 現成的工具? (我會被重新分配所以這通常不能很好

    0熱度

    2回答

    請告訴我在哪裏可以找到Ab-Initio ETL Data Ware Housing工具的視頻教程。 我在谷歌上衝浪,但我沒有找到任何材料。 在此先感謝。