2016-05-30 75 views
0

我正在嘗試開發一個使用R來執行連續響應變量預測的Azure ML實驗。最初的實驗比較簡單,只包含一些實驗項目,包括「創建R模型」,「訓練模型」和「分數模型」以及一些數據輸入。R得分腳本中返回的分數應該是什麼類型?

我編寫了一個培訓腳本和一個評分腳本,當我在ML Studio中運行實驗時,這兩個腳本似乎都可以正確執行。但是,當我檢查得分數據集時,得分值都是缺失的值。所以我擔心我的得分腳本可能會錯誤地返回分數。任何人都可以建議我應該返回什麼類型?它意味着是單列data.frame還是其他?

雖然我在R Studio中運行了培訓和評分腳本,但它顯示了預期的結果,但我的分數在評分腳本中未得到正確計算也是可能的。如果有人能夠以某種方式建議如何對我的評分腳本進行調試,那麼我也可以確定代碼的行爲不如預期的位置。

謝謝,保羅

回答

0
+0

謝謝您指出我在該實驗。我得出結論:Scorer腳本可以返回多列數據框。另外,在我看來,您的實驗使用的似乎是預先定義的函數,這些函數似乎沒有記錄,比如set.binary.classification.scores()和set.true.label()。是這種情況,還是我忽略了一些東西? – Paul

+0

我認爲你可能是對的,我們的文檔可能已經錯過了,或者它可能在文章中沒有立即顯示在頂層。我正在跟進。感謝您讓我們知道 – neerajkh

0

我的建議是做數據預處理你做數據輸入之前。清除缺失值和異常值。使用相關的數據預處理技術來執行這些操作。

相關問題