我是pyspark的新手,正在開發我的第一個火花項目,我面臨兩個問題。 一)無法使用 df["col1"].show()
***TypeError: 'Column' object is not callable***
二)無法與聚合值來取代值在我的火花像數據幀平均 Code:
from pyspark import SparkConf, SparkContext
from pyspa
我想加入上full_outer_join的基礎2個dataframes,並試圖在加入結果集,它告訴我匹配的記錄,從左至右數據幀單獨匹配的記錄和不匹配的記錄單從右邊數據框中 這裏是添加新列我的火花代碼: val creditLoc ="/data/accounts/credits/year=2016/month=06/day=02"
val debitLoc = "/data/accounts/d