data-warehouse

    1熱度

    2回答

    有沒有辦法比較兩個OLAP多維數據集之間的所有信息(聚合,直到細節級別)?例如,假設我想比較一個創建的與SQL Server 2000一起工作的多維數據集到同一個多維數據集,但是被遷移到SQL Server 2005/2008上運行 - 從技術上講,他們都應該返回所有維度/度量組合的相同信息,但我需要一種驗證的方法。 我絕對不是開發人員,但我確實有權訪問企業管理器和潛在的SAS工具等,我知道一些S

    0熱度

    1回答

    對於在數據倉庫和商務智能方面擁有更多經驗的人來說,這個問題的答案可能很明顯,但我正在尋找一些指導。 我正在構建一個使用多個JMS隊列每天處理數百萬條消息的系統。我需要了解這些隊列的活動情況,以便我可以創建類似......的報告「昨天早上11點01分,有多少消息進入隊列A,其中有'Foo'這個單詞?」 更糟糕的是,我需要每天處理幾個隊列中每天處理數百萬條消息的每天每分鐘運行此報告的大約20萬字。 當

    0熱度

    3回答

    我的一個朋友正在面試數據倉庫和業務對象角色但他被問到曼哈頓數據庫? 我已經谷歌搜索「曼哈頓數據庫」,甚至在Bing和雅虎搜索它,但沒有找到相關信息。 任何幫助將不勝感激!

    -1熱度

    3回答

    請說出AbInitio恢復文件的概念。 當Abinitio圖失敗時,我們應該回滾恢復文件,在這種情況下,我們不應該回滾恢復文件。 請提供任何AbInitio材料的鏈接。 感謝。

    0熱度

    1回答

    因此,我目前正在開發一個項目,涉及收集和存儲一些巨大的數據集(就我以前的工作而言)。數據本質上包含元信息,然後是實際值(其中值隨時間呈現趨勢)。 元信息本身是比較大的,但沒什麼大的,我可能會說它將在未來幾年增長10-50萬行的大小。這對我來說似乎是可管理的,而且一個強大的SQL Server應該足以提供對這些數據的快速訪問(如果數據索引良好,並且數據非常容易索引,並且界限非常清晰)... 但是,趨

    5熱度

    3回答

    我有一個尺寸(SiteItem)事實表中有兩個重要的事實: perUserClicks perBrowserClicks 然而,這個維度中,我有一個基於屬性列的值的組(我們稱之爲組AboveFoldItems, LeftNavItems,OnTheFlyItems等)都有更多的事實特定於該組: AboveFoldItems: eyeTime, loadTime LeftNavItems:

    2熱度

    2回答

    我正在研究數據倉庫,我試圖弄清楚如何最好地驗證數據清理(規範化)數據庫中的數據是否正確地進入我們的數據集市。我已經完成了一些搜索,但迄今爲止的結果更多地討論了確保約束已到位等問題,並且您需要在ETL過程中進行數據驗證(例如日期有效等)。這些維度非常簡單,因爲我可以輕鬆地利用主鍵或編寫一個非常簡單且可驗證的查詢來獲取數據。事實表更復雜。 有什麼想法?我們試圖使主題導出非常簡單,以便運行幾個查詢,查看

    5熱度

    3回答

    我需要存儲大量的小數據對象(每月數百萬行)。一旦他們得救,他們就不會改變。我需要: 將它們存儲安全 用它們來分析(主要是面向時間) 檢索某些原始數據偶爾 這將是很好,如果可以用的JasperReports或BIRT使用 我的第一個鏡頭是Infobright的社區 - 只是一個立柱導向,只讀存儲機制對MySQL 另一方面,人們說NoSQL方法可能會更好。 Hadoop + Hive看上去很不錯,但文

    1熱度

    1回答

    我現在正在設計新的應用程序,並給出以下問題很多想法。我從倉庫中消耗大量數據,並且這些實體有很多基於字典的值(貨幣,國家,稅收 - 無論數據) - 維度。我不能確定,但​​不會有空值。所以我在想: 在每個特殊keyID的字典中​​創建一個空值 - 即。 -1 做ETL(SSIS)做正確的東西,然後插入-1需要它 讓DAL知道-1是 不照顧特殊(力所能及的事靜態常量)代碼來檢查字典條目的NULL的含量

    1熱度

    1回答

    我正在尋找想法來填充數據集市中的事實表。可以說我有以下尺寸 醫師 患者 日期 geo_location patient_demography 測試 我用了兩個ETL工具來填充維度表 - Pentaho和Oracle Warehouse Builder。日期,患者人口統計和地理位置不會從運營商店獲取數據。所有維度表都有自己的新代理鍵。 我現在想用患者訪問的細節填充事實表。當患者在特定的日期訪問醫生時