我有一組要分類的分類變量,所以我使用從github package取得的k模式。我想要得到每個觀察點(點)到它所屬羣集的質心的距離。K模式計算每個點和簇質心之間的距離
這是我到目前爲止執行:
kmodes_cao = kmodes.KModes(n_clusters=6, init='Cao', verbose=1)
kmodes_cao.fit_predict(data)
# Print cluster centroids of the trained model.
print('k-modes (Cao) centroids:')
print(kmodes_cao.cluster_centroids_)
# Print training statistics
print('Final training cost: {}'.format(kmodes_cao.cost_))
print('Training iterations: {}'.format(kmodes_cao.n_iter_))
我不能使用Eucledean距離自變量是分類。計算每個點到其簇質心距離的理想方法是什麼?
看的源代碼'KModes'功能。不要重新發明輪子。 –
我看穿它,但無法找到距離的計算方式。我是使用數據挖掘的新手,所以請你指導一下? –
甚至在文檔中,'cat_dissim'參數。 –