2015-07-10 44 views
0

我想在Spark中使用Scala實現ML管道,並且我使用Spark網站上提供的示例代碼。我正在使用SQlContext包中提供的函數將我的RDD[labeledpoints]轉換爲數據框。它給了我一個NoSuchElementException在使用scala的機器學習管道中沒有這樣的元素異常

代碼段: enter image description here

錯誤消息: enter image description here

錯誤在該行Pipeline.fit(training_df)

回答

0

Vector你有你的for循環(prob: Vector)內的類型取一個類型參數;例如Vector[Double],Vector[String]等。您只需指定您的矢量將存儲的數據類型。

作爲網站說明:您使用的單參數重載版本createDataFrame()似乎是experimental。如果您打算將其用於某個長期項目。

+0

我改變了這一行。現在,我收到一個新的錯誤。我用新的錯誤更新了我的問題。 – SRS

0

你的代碼片段中的管道當前是空的,所以沒有什麼適合的。您需要使用.setStages()指定階段。請參閱spark.ml文檔here中的示例。