2012-08-07 100 views
2

我對Microsoft商業智能開發工作室和數據挖掘查詢任務有一個有趣的問題。我有一個包(其中包含一些其他內容)兩個數據挖掘查詢任務,它從現有數據庫獲取一些行,對它們執行數據挖掘查詢並將它們追加到同一個數據庫。兩個數據庫都比較小(約30,000行,約15列)。BIDS數據挖掘性能問題

這對開發服務器來說是非常好的,但是當我嘗試將所有內容轉移到生產環境時,我遇到了一個奇怪的問題。在每個數據庫中特定的和一致的行數之後,數據挖掘查詢任務會掛起(數字爲2001年爲第一個任務,5001爲第二個任務)。任何數量的行少於這些限制,它需要幾秒鐘。任何更長的時間和任務超時(2小時後)。

需要注意的另一件事是,當我從相同的生產數據庫提取信息,但將它們插入到開發服務器上的不同表中時,一切都很順利。

我只能假設在生產數據庫中有一些設置正在搞亂某些東西,但我不知道它可能是什麼。不幸的是,我只是一名實習生,並沒有建立系統,也沒有完全訪問所有的東西,但我做了一些探索,並且在設置中找不到任何重大差異。

任何人有任何意見或建議?任何幫助是極大的讚賞。

編輯:謝謝你的答覆。我已經在Build New Query窗口下選擇了表格。但是,我不認爲實際的案例表是問題,因爲當我將輸出表更改爲不同服務器上的表時,該包執行得很好。下面是該查詢的一個精簡版使用:

SELECT FLATTENED 

    t.field1, 
    t.field2, 
    t.field3, 
    t.field4, 
    t.field5, 
    t.field6, 
    t.field7, 
    t.field8, 
    t.field9, 
    t.field10, 
    t.field11, 
    t.field12, 
    t.field13, 
    t.field14, 
    t.field15, 
    t.field16, 
    t.field17, 
    t.field18, 
    t.field19, 
    ([MiningModel].[Model Output Column]) as field20, 
    PredictProbability([Model Output Column]) 
From 
    [MiningModel] 
PREDICTION JOIN 
    OPENQUERY([Input Table Data Source], 
    'SELECT 
    field1, 
    field2, 
    field3, 
    field4, 
    field5, 
    field6, 
    field7, 
    field8, 
    field9, 
    field10, 
    field11, 
    field12, 
    field13, 
    field14, 
    field15, 
    field16, 
    field17, 
    field18, 
    field19, 
    field 20 
    FROM 
     [Input Table] 
    ') AS t 
ON 
    [MiningModel].[Model Input 1] = t.[field16] AND 
    [MiningModel].[Model Input 2] = t.[field17] AND 
    [MiningModel].[Model Input 3] = t.[field18] AND 
    [MiningModel].[Model Input 4] = t.[field19] AND 
    [MiningModel].[Model Output Column] = t.[field20] 
+0

你真的不能指望人們試圖回答這個不知道數據挖掘查詢是什麼。特別是,出價如何從數據庫中提取數據?這聽起來像是正在使用查詢或視圖,而不是原始表。 – 2012-08-07 21:59:14

回答

0

如果您運行探查器和捕獲錯誤,你看到Sort Warnings

你能找出任何不正確的統計數據嗎? 也許問題消失後:

UPDATE STATISTICS InputTable WITH FULLSCAN, ALL