2017-03-06 91 views

回答

0

您可以使用此。假設你的記錄由公共列id鑑定:

val dfResult = df1.join(df2, Seq("id"), "leftanti") 
+0

這是一個非常酷的功能。不幸的是我正在尋找Spark 1.6 shell中的解決方案。 – Falcom

-1

如何.. dataframe1.as("d1").join(dataframe2.as("d2"), $"d1.col1" === $"d2.col1").select($"d1.*")其中col1是加入的列。這兩個dataframes需要具有相同的結構(同列)

在星火2.0,你可以做ANTI JOIN

val dfResult = df1.except(df2) 

注:

+0

那不是給我從DF1的數據,從DF2匹配的數據。 ?? 我正在尋找DF1中不存在於DF2中的數據。 – Falcom