pyspark數據框的訪問列帶點「。」

包含點的pyspark數據幀（例如「id.orig_h」）將不允許groupby uppon，除非首先被withColumnRenamed重命名。有沒有解決方法？ "`a.b`"似乎沒有解決它。pyspark數據框的訪問列帶點「。」

你可以分享你正在使用的代碼組嗎？ –

在我pyspark殼，下面的代碼片段正在努力：

from pyspark.sql.functions import * 
myCol = col("`id.orig_h`")  
result = df.groupBy(myCol).agg(...)

和

myCol = df["`id.orig_h`"] 
result = df.groupBy(myCol).agg(...)

我希望它能幫助。

2016-05-16 23:31:48

謝謝@Daniel de Paula的回答。你能確認使用''groupby（「'id.orig_h'」）''不起作用嗎？ –

@HananShteingart，對於我來說，下面的代碼有效：'df.groupBy（「\'id.orig_h \'」）。agg（...）' –

對我來說它並不是。你可以請添加更多的列從ID開始。？我使用pyspark 1.6 –

回答