0
我在這裏詢問了相反的問題Create a tuple out of two columns - PySpark。我現在要做的就是將位於數據幀列中的元組列表解壓縮到每行兩個不同的列表中。所以根據下面的數據框,將v_tuple列返回到v1和v2。解壓縮元組列表--PySpark
+---------------+---------------+--------------------+
| v1| v2| v_tuple|
+---------------+---------------+--------------------+
|[2.0, 1.0, 9.0]|[9.0, 7.0, 2.0]|[(2.0,9.0), (1.0,...|
|[4.0, 8.0, 9.0]|[1.0, 1.0, 2.0]|[(4.0,1.0), (8.0,...|
+---------------+---------------+--------------------+
根據我以前的專欄中,我嘗試沒有成功如下:
unzip_ = udf(
lambda l: list(zip(*l)),
ArrayType(ArrayType("_1", DoubleType()), ArrayType("_2", DoubleType())))
我使用pyspark 1.6