2016-05-16 66 views

回答

4

在我pyspark殼,下面的代碼片段正在努力:

from pyspark.sql.functions import * 
myCol = col("`id.orig_h`")  
result = df.groupBy(myCol).agg(...) 

myCol = df["`id.orig_h`"] 
result = df.groupBy(myCol).agg(...) 

我希望它能幫助。

+0

謝謝@Daniel de Paula的回答。你能確認使用''groupby(「'id.orig_h'」)''不起作用嗎? –

+0

@HananShteingart,對於我來說,下面的代碼有效:'df.groupBy(「\'id.orig_h \'」)。agg(...)' –

+0

對我來說它並不是。你可以請添加更多的列從ID開始。 ?我使用pyspark 1.6 –