2016-08-19 76 views

回答

2

Apache Spark持久性是關於以JSON數據格式保存和加載Spark ML管道(將其視爲Python的pickle機制或R的RDS機制)。這些JSON數據結構映射到Spark ML類。他們在其他平臺上沒有意義。

對於PMML,則可以使用JPMML-SparkML庫將Spark ML管道轉換爲PMML文檔。您可以使用JPMML-Evaluator庫執行PMML文檔(無論它們是否來自Apache Spark,Python或R)。如果您使用Apache Maven來管理和構建項目,那麼可以通過向項目的POM添加一個依賴聲明來包含JPMML-Evaluator。