2017-06-16 99 views
0

我有Dataset[(A,B)]。我正在尋找類似unzip(Set[A,B]) => (Set[A], Set[B])的東西。我有什麼選擇?我在數據集API中找不到任何東西。我是否需要下載RDD並重新啓動?Spark數據集解壓縮函數

這是由一個連接引起的,是連接'廉價'足以做兩次連接,只是反向?由於兩套已經存在,似乎過度了。

回答

0

一個解決方案,本該應該是顯而易見的,我猜,只是做了兩個步驟 ​​