Dataset<Row> dataFrame = ... ;
StringIndexerModel labelIndexer = new StringIndexer()
.setInputCol("label")
.setOutputCol("indexedLabel")
.fit(dataFrame);
VectorIndexerModel featureIndexer = new VectorIndexer()
.setInputCol("s")
.setOutputCol("indexedFeatures")
.setMaxCategories(4)
.fit(dataFrame);
IndexToString labelConverter = new IndexToString()
.setInputCol("prediction")
.setOutputCol("predictedLabel")
.setLabels(labelIndexer.labels());
什麼是StringIndexer,VectorIndexer,IndexToString和它們之間的區別是什麼?我應該如何以及何時使用它們?什麼是StringIndexer,VectorIndexer以及如何使用它們?
鏈接已損壞。 –
我發現該頁面被移動到https://github.com/MingChen0919/learning-apache-spark - 一個非常好的資源! –