2

在Azure數據工廠中,我試圖通過數據工廠管道調用Azure機器學習模型。我想使用Azure SQL表作爲輸入,並使用另一個Azure SQL表作爲輸出。 首先,我部署了一個機器學習(經典)Web服務。然後,我使用LinkedService(類型='AzureML',使用ML-webservice的請求URI和API鍵)和輸入輸出數據集('AzureSqlTable'類型)創建了Azure數據工廠管道。數據工廠:用於管道活動類型的AzureSQL輸入和輸出AzureMLBatchExecution

部署和配置成功。管道按計劃啓動,但保持「正在運行」而沒有任何結果。管道活動未顯示在監視器&管理:活動窗口中。

在不同的網站和教程中,我只找到使用活動類型「AzureMLBatchExecution」和BLOB輸入和輸出的JSON腳本。我想使用AzureSQL輸入和輸出,但我無法得到這個工作。

有人可以提供一個示例JSON腳本或告訴我什麼可能是錯誤的代碼在下面?

謝謝!

{ 
    "name": "Predictive_ML_Pipeline", 
    "properties": { 
     "description": "use MyAzureML model", 
     "activities": [ 
      { 
       "type": "AzureMLBatchExecution", 
       "typeProperties": {}, 
       "inputs": [ 
        { 
         "name": "AzureSQLDataset_ML_Input" 
        } 
       ], 
       "outputs": [ 
        { 
         "name": "AzureSQLDataset_ML_Output" 
        } 
       ], 
       "policy": { 
        "timeout": "02:00:00", 
        "concurrency": 3, 
        "executionPriorityOrder": "NewestFirst", 
        "retry": 1 
       }, 
       "scheduler": { 
        "frequency": "Week", 
        "interval": 1 
       }, 
       "name": "My_ML_Activity", 
       "description": "prediction analysis on ML batch input", 
       "linkedServiceName": "AzureMLLinkedService" 
      } 
     ], 
     "start": "2017-04-04T09:00:00Z", 
     "end": "2017-04-04T18:00:00Z", 
     "isPaused": false, 
     "hubName": "myml_hub", 
     "pipelineMode": "Scheduled" 
    } 
} 
+0

偉大的問題。您是否使用樣本Blob商店輸入/輸出測試了活動?恐怕我缺乏一些關於如何使用ADF鏈接服務細節訪問數據集的知識。對於正常的批量計算活動,服務需要自己的主體來直接連接。我會玩一玩,然後在下週嘗試一下。 –

+0

感謝您的回覆!我肯定會用blob在/輸出這些天測試它,我發現了很多這些例子,並將結果發佈在這裏。 –

回答

0

在微軟技術人員的幫助下,我得到了這個工作。上面提到的JSON腳本如在時間表部僅改變:

"start": "2017-04-01T08:45:00Z", 
"end": "2017-04-09T18:00:00Z", 

管道是活性只有它的開始時間和結束時間之間。由於調度程序設置爲每週,所以在一週開始時會觸發管道:該日期應該在開始日期和結束日期之內。有關調度的詳細信息,請參閱:https://docs.microsoft.com/en-us/azure/data-factory/data-factory-scheduling-and-execution

Azure的SQL輸入數據集應該是這樣的:

{ 
"name": "AzureSQLDataset_ML_Input", 
"properties": { 
    "published": false, 
    "type": "AzureSqlTable", 
    "linkedServiceName": "SRC_SQL_Azure", 
    "typeProperties": { 
     "tableName": "dbo.Azure_ML_Input" 
    }, 
    "availability": { 
     "frequency": "Week", 
     "interval": 1 
    }, 
    "external": true, 
    "policy": { 
     "externalData": { 
      "retryInterval": "00:01:00", 
      "retryTimeout": "00:10:00", 
      "maximumRetry": 3 
     } 
    } 
} 

我增加了外部和政策屬性此數據集(見上面的腳本),並在此之後,它工作。