包含點的pyspark數據幀(例如「id.orig_h」)將不允許groupby
uppon,除非首先被withColumnRenamed
重命名。有沒有解決方法? "`a.b`"
似乎沒有解決它。pyspark數據框的訪問列帶點「。」
1
A
回答
4
在我pyspark殼,下面的代碼片段正在努力:
from pyspark.sql.functions import *
myCol = col("`id.orig_h`")
result = df.groupBy(myCol).agg(...)
和
myCol = df["`id.orig_h`"]
result = df.groupBy(myCol).agg(...)
我希望它能幫助。
+0
謝謝@Daniel de Paula的回答。你能確認使用''groupby(「'id.orig_h'」)''不起作用嗎? –
+0
@HananShteingart,對於我來說,下面的代碼有效:'df.groupBy(「\'id.orig_h \'」)。agg(...)' –
+0
對我來說它並不是。你可以請添加更多的列從ID開始。 ?我使用pyspark 1.6 –
相關問題
- 1. PySpark訪問計數列
- 2. Pyspark:從pyspark數據框中
- 3. 訪問列表框中的數據
- 4. Pyspark:使用數據框
- 5. 如何從pyspark數據框檢索列並將其作爲新列插入到現有pyspark數據框中?
- 6. 訪問pyspark中的數據幀的計數值
- 7. 如何在pyspark中創建列表的數據框的元組的數據框?
- 8. 數據不被填充數據框 - PySpark
- 9. PySpark:從列值中命名一個新的數據框列
- 10. Pyspark - 在火花數據框列使用reducebykey即列出
- 11. PySpark將新列添加到數據框與新列表
- 12. Pyspark - 排序數據框中列包含列表
- 13. 在MySql的列名中使用多個點訪問列數據
- 14. 字符串類型的pyspark數據框列的條形碼
- 15. PySpark數據框:根據條件同時更改兩列
- 16. 帶有2行數據的列表框
- 17. PySpark:爲數據框中的每一行獲取頂部k列
- 18. PySpark數據框 - 加入多個列的動態
- 19. 訪問陣列數據
- 20. 訪問ctypes數據陣列
- 21. 如何將pyspark數據框分爲4個數據框?
- 22. 蟒蛇,pyspark:一pyspark數據幀列的獲得和值
- 23. Pyspark:如何使用其他數據框
- 24. 從dict_values創建一個pyspark數據框
- 25. PySpark數據框中:Longformat以寬幅
- 26. 在Pyspark數據框中修剪
- 27. 如何扁平pySpark數據框?
- 28. 訪問數據框中的索引?
- 29. 訪問數據庫的VB.NET組合框
- 30. delphi的數據訪問框架
你可以分享你正在使用的代碼組嗎? –