1

我有列名「X」和「Y」,Y列只包含空和真實值的數據幀一列適用UDF功能,如何在其中只包含空和真正的價值

x  y 
br  null 
br  null 
bm  null 
bm  null 
br  true 
bm  true 

我需要創建創建另一列「Z」和標記null作爲1和真正爲0

x  y   z 
br  null  1 
br  null  1 
bm  null  1 
bm  null  1 
br  true  0 
bm  true  0 
+0

@MukheshJha:歡迎這樣的!而是要求一個代碼,你可以嘗試通過你自己,並提及什麼是工作,什麼是不工作的細節.... –

回答

3

你實際上並不需要的UDF應該是一個UDF。這是很簡單的使用whenotherwise條款:

from pyspark.sql.functions import when, col 

df.withColumn("z", when(col("y").isNull(), 1).otherwise(0)) 
+1

此代碼的工作,謝謝, –

+0

@MukheshJha:歡迎來到SO!而是要求一個代碼,你可以嘗試自己,並提到什麼是工作和什麼不工作的細節 –