我對Microsoft商業智能開發工作室和數據挖掘查詢任務有一個有趣的問題。我有一個包(其中包含一些其他內容)兩個數據挖掘查詢任務,它從現有數據庫獲取一些行,對它們執行數據挖掘查詢並將它們追加到同一個數據庫。兩個數據庫都比較小(約30,000行,約15列)。BIDS數據挖掘性能問題
這對開發服務器來說是非常好的,但是當我嘗試將所有內容轉移到生產環境時,我遇到了一個奇怪的問題。在每個數據庫中特定的和一致的行數之後,數據挖掘查詢任務會掛起(數字爲2001年爲第一個任務,5001爲第二個任務)。任何數量的行少於這些限制,它需要幾秒鐘。任何更長的時間和任務超時(2小時後)。
需要注意的另一件事是,當我從相同的生產數據庫提取信息,但將它們插入到開發服務器上的不同表中時,一切都很順利。
我只能假設在生產數據庫中有一些設置正在搞亂某些東西,但我不知道它可能是什麼。不幸的是,我只是一名實習生,並沒有建立系統,也沒有完全訪問所有的東西,但我做了一些探索,並且在設置中找不到任何重大差異。
任何人有任何意見或建議?任何幫助是極大的讚賞。
編輯:謝謝你的答覆。我已經在Build New Query窗口下選擇了表格。但是,我不認爲實際的案例表是問題,因爲當我將輸出表更改爲不同服務器上的表時,該包執行得很好。下面是該查詢的一個精簡版使用:
SELECT FLATTENED
t.field1,
t.field2,
t.field3,
t.field4,
t.field5,
t.field6,
t.field7,
t.field8,
t.field9,
t.field10,
t.field11,
t.field12,
t.field13,
t.field14,
t.field15,
t.field16,
t.field17,
t.field18,
t.field19,
([MiningModel].[Model Output Column]) as field20,
PredictProbability([Model Output Column])
From
[MiningModel]
PREDICTION JOIN
OPENQUERY([Input Table Data Source],
'SELECT
field1,
field2,
field3,
field4,
field5,
field6,
field7,
field8,
field9,
field10,
field11,
field12,
field13,
field14,
field15,
field16,
field17,
field18,
field19,
field 20
FROM
[Input Table]
') AS t
ON
[MiningModel].[Model Input 1] = t.[field16] AND
[MiningModel].[Model Input 2] = t.[field17] AND
[MiningModel].[Model Input 3] = t.[field18] AND
[MiningModel].[Model Input 4] = t.[field19] AND
[MiningModel].[Model Output Column] = t.[field20]
你真的不能指望人們試圖回答這個不知道數據挖掘查詢是什麼。特別是,出價如何從數據庫中提取數據?這聽起來像是正在使用查詢或視圖,而不是原始表。 – 2012-08-07 21:59:14