2017-09-05 92 views

回答

1

SPARK-13944中解釋了保持局部線性代數ml的動機。

將線性代數作爲獨立模塊劃分出來,無需使用Spark依賴關係來簡化生產部署。我們可以調用新模塊mllib-local,它可能包含未來的本地模型。 主要問題是刪除用戶定義類型的依賴關係。

軟件包名稱將從mllib更改爲ml。例如,Vector將從org.apache.spark.mllib.linalg.Vector更改爲org.apache.spark.ml.linalg.Vector。新ML流水線中的返回矢量類型將是ML包中的一個;但是,現有的mllib代碼不會被觸及。因此,這可能會破壞API。另外,當矢量由Spark SQL從mllib矢量加載時,矢量將自動轉換爲ml包中的一個。

眼下實現接近相同,排除了一些轉換方法,

+0

謝謝你,這是明確的! – HBX

相關問題