data-warehouse

    1熱度

    1回答

    我有一個SSIS包作爲項目的一部分。當通過SSIS從我的機器運行時,處理15M記錄大約需要15分鐘。 一旦部署到服務器上的目錄並運行完畢,現在已經超過2個小時。 這個特定的軟件包正在服務器本身上移動數據(處於暫存狀態),所以沒有網絡瓶頸。 ,這裏是來自SP_WHO3一些統計數據: CPU_TIME:484482 requested_memory_kb:2469520 granted_memory_

    1熱度

    1回答

    我在嘗試運行下面的腳本時遇到了困難。錯誤訊息話題: ORDER BY子句在視圖中無效,內聯函數 insert into cc.s ( id, encid, a_name, a_des, a_type, a_value, d_create ) select id, encid, 'days_cha

    6熱度

    1回答

    我有一個DimPlace維度,其中包含地點名稱(由用戶手動輸入)以及該地點的緯度和經度(自動捕獲)。由於地點是手動輸入的,因此同一地點可能會有多次不同的名稱,另外,兩個不同的地點可能彼此非常接近。 我們希望能夠分析兩個「地點」之間的MPG,但我們希望將它們分組以製作更大的區域 - 即使用長整型拼寫的一個位置,以及不同但非常關閉的地點,在一個記錄。 我打算爲此做一個新的維度 - 就像DimPlace

    0熱度

    1回答

    我有一個快速問題管理OLAP多維數據集或數據多維數據集。 當我看到image時,我並不真正瞭解「多維數據集」中表示的數據的「位置」。我想這個是表面上的,對吧?否則,旋轉立方體將不會顯示完全不同的值。 所以,我的問題是,什麼數據存儲「在立方體?」 豈不是某事像: f(x,y,z) -> value (1) 和值是細胞內?但在這裏我只看到 f(x,y) -> surfacevalue (2a)

    0熱度

    1回答

    我們最近開始研究我們的數據倉庫。我們有技術員,銷售員,日期,分支,客戶作爲我們的維度。我們在OLTP中也有交易表,例如銷售訂單,協議,這些表在某些情況下是相互引用的。我打算將銷售訂單,協議信息放入事實表中。所以,我想在兩個事實表中引用上面提到的所有維度。但是,我的問題出現了。 銷售訂單和服務協議需要相互引用。在大多數情況下,需要在銷售訂單中引用協議信息。我可以在事實表中相互引用兩個事實表嗎? OL

    0熱度

    2回答

    這個問題與應用程序開發並不完全相關,但從體系結構的角度來看並非如此。假設一個應用程序必須在AWS上託管,這將需要來自多個外部第三方持有數據庫的通信(不是必須在AWS上,可能是他們自己的數據中心或託管) - 也許一個客戶端將使用MySQL,另一個客戶端一個MSSQL或Oracle等。 因此,保存在這些外部數據庫中的數據可能會頻繁更改,並且應用程序應始終檢索更新的數據。我能想到的一種方式是使用另一個R

    0熱度

    1回答

    我可以從Azure SQL數據庫跨數據庫查詢到Azure SQL數據倉庫,我讀過它可能在sql數據庫周圍,但可以在azure datawarehouse和sql數據庫中可能的地方。

    0熱度

    1回答

    我使用Pentaho勺開發一個ETL,我需要做一系列的查找採取提取的非規格化數據和檢索維的PKs。 其中一個維度的記錄的維京的開始和結束日期。所以,我需要使用Extract的引用日期來查找Dimension的起始日期和結束日期。 問題是,勺子似乎只提供了從維度到源的比較。這意味着Field 1和Field 2僅適用於源數據,不適用於查找表。 有沒有辦法反轉它?

    1熱度

    2回答

    什麼提供更高的性能? 編寫使用T-SQL,連接表,然後將結果插入到另一個表 使用Pentaho的勺子的表插入,然後利用數據庫查找在同一時間以「加盟」每個表的查詢,然後將結果到另一個表 的目標是採取非規範化表,通過他們的文字與5個維表加入吧,和檢索尺寸的PK,然後將結果插入到一個事實表。

    0熱度

    1回答

    我一直在研究一個SAS ETL項目,在這個項目中,我們首先從每月開始的teradata倉庫提取上個月的數據,然後再進一步處理。 這是通過每個表格的提取腳本完成的,然後將數據存儲到每月文件夾結構(yyyymm)中。以這種方式工作了好幾個月後,我們現在已經開始收到產品每日,每週等提取物的請求。 當前數據存儲文件夾結構爲: Library/Data/YYYYMM文件夾位於一個庫中。 我必須改變結構(影響