2
我想使用一個特定的UDF
使用Spark
星火如何使用UDF與加入
這裏的計劃:
我有一個table A
(10萬行)和table B
(15百萬行)
我想用table A
和的table B
之一的UDF
比較一個元素是有可能
下面是我的代碼示例。在某些時候,我還需要說我UDF
比較必須大於0,9
更大:
DataFrame dfr = df
.select("name", "firstname", "adress1", "city1","compare(adress1,adress2)")
.join(dfa,df.col("adress1").equalTo(dfa.col("adress2"))
.and((df.col("city1").equalTo(dfa.col("city2"))
...;
這可能嗎?