data-warehouse

1熱度

1回答

SSIS查詢在目錄作業中運行非常緩慢。 wait_type：ASYNC_NETWORK_IO

我有一個SSIS包作爲項目的一部分。當通過SSIS從我的機器運行時，處理15M記錄大約需要15分鐘。一旦部署到服務器上的目錄並運行完畢，現在已經超過2個小時。這個特定的軟件包正在服務器本身上移動數據（處於暫存狀態），所以沒有網絡瓶頸。，這裏是來自SP_WHO3一些統計數據： CPU_TIME：484482 requested_memory_kb：2469520 granted_memory_

1熱度

1回答

如何糾正此SQL腳本中的錯誤（使用Azure Datawarehouse的數據庫）

我在嘗試運行下面的腳本時遇到了困難。錯誤訊息話題： ORDER BY子句在視圖中無效，內聯函數 insert into cc.s ( id, encid, a_name, a_des, a_type, a_value, d_create ) select id, encid, 'days_cha

6熱度

1回答

數據倉庫中的geozones或Lat＆Long的維數

我有一個DimPlace維度，其中包含地點名稱（由用戶手動輸入）以及該地點的緯度和經度（自動捕獲）。由於地點是手動輸入的，因此同一地點可能會有多次不同的名稱，另外，兩個不同的地點可能彼此非常接近。我們希望能夠分析兩個「地點」之間的MPG，但我們希望將它們分組以製作更大的區域 - 即使用長整型拼寫的一個位置，以及不同但非常關閉的地點，在一個記錄。我打算爲此做一個新的維度 - 就像DimPlace

0熱度

1回答

OLAP多維數據集 - 數據多維數據集

我有一個快速問題管理OLAP多維數據集或數據多維數據集。當我看到image時，我並不真正瞭解「多維數據集」中表示的數據的「位置」。我想這個是表面上的，對吧？否則，旋轉立方體將不會顯示完全不同的值。所以，我的問題是，什麼數據存儲「在立方體？」豈不是某事像： f(x,y,z) -> value (1) 和值是細胞內？但在這裏我只看到 f(x,y) -> surfacevalue (2a)

0熱度

1回答

事實表引用另一個事實表？

我們最近開始研究我們的數據倉庫。我們有技術員，銷售員，日期，分支，客戶作爲我們的維度。我們在OLTP中也有交易表，例如銷售訂單，協議，這些表在某些情況下是相互引用的。我打算將銷售訂單，協議信息放入事實表中。所以，我想在兩個事實表中引用上面提到的所有維度。但是，我的問題出現了。銷售訂單和服務協議需要相互引用。在大多數情況下，需要在銷售訂單中引用協議信息。我可以在事實表中相互引用兩個事實表嗎？ OL

0熱度

2回答

AWS上託管的應用程序訪問多個外部數據庫

這個問題與應用程序開發並不完全相關，但從體系結構的角度來看並非如此。假設一個應用程序必須在AWS上託管，這將需要來自多個外部第三方持有數據庫的通信（不是必須在AWS上，可能是他們自己的數據中心或託管） - 也許一個客戶端將使用MySQL，另一個客戶端一個MSSQL或Oracle等。因此，保存在這些外部數據庫中的數據可能會頻繁更改，並且應用程序應始終檢索更新的數據。我能想到的一種方式是使用另一個R

0熱度

1回答

跨數據庫查詢是可能的

我可以從Azure SQL數據庫跨數據庫查詢到Azure SQL數據倉庫，我讀過它可能在sql數據庫周圍，但可以在azure datawarehouse和sql數據庫中可能的地方。

0熱度

1回答

Pentaho勺數據庫查詢，如何比較日期

我使用Pentaho勺開發一個ETL，我需要做一系列的查找採取提取的非規格化數據和檢索維的PKs。其中一個維度的記錄的維京的開始和結束日期。所以，我需要使用Extract的引用日期來查找Dimension的起始日期和結束日期。問題是，勺子似乎只提供了從維度到源的比較。這意味着Field 1和Field 2僅適用於源數據，不適用於查找表。有沒有辦法反轉它？

1熱度

2回答

SQL Server加入或Pentaho勺查找？

什麼提供更高的性能？編寫使用T-SQL，連接表，然後將結果插入到另一個表使用Pentaho的勺子的表插入，然後利用數據庫查找在同一時間以「加盟」每個表的查詢，然後將結果到另一個表的目標是採取非規範化表，通過他們的文字與5個維表加入吧，和檢索尺寸的PK，然後將結果插入到一個事實表。

0熱度

1回答

SAS數據集市文件結構建議

我一直在研究一個SAS ETL項目，在這個項目中，我們首先從每月開始的teradata倉庫提取上個月的數據，然後再進一步處理。這是通過每個表格的提取腳本完成的，然後將數據存儲到每月文件夾結構（yyyymm）中。以這種方式工作了好幾個月後，我們現在已經開始收到產品每日，每週等提取物的請求。當前數據存儲文件夾結構爲： Library/Data/YYYYMM文件夾位於一個庫中。我必須改變結構（影響