2014-10-11 46 views
0

在我上傳數據的openrefine中,單擊文本構面然後進行聚類。它創建集羣。就像Aniket Ghodke和Ghodke Aniket一樣,它會建議合併它們。但有什麼方法可以存儲這些值。如果我將「Aniket Ghodke」和「Ghodke Aniket」合併爲「Aniket Ghodke」,那麼我可以將這些值存儲爲我的更多參考。我準備好使用Python或Java庫。但有可能。打開優化文本構面羣集

回答

0

您可以通過GREL調用大部分羣集函數,如ngram(value,4)fingerprint(value)。您可以將結果存儲在一個新列或一個方面,以查看結果。

This blog post解釋如何使用它們。