我正在尋找一種方法來選擇我的數據框在pyspark中的列。對於第一行,我知道我可以使用df.first()
,但不確定列是否在沒有列名。在Pyspark Dataframe中選擇列
我有5列,並希望通過其中每一個循環。
+----------------+---+---+---+---+---+---+
| _1| _2| _3| _4| _5| _6| _7|
+----------------+---+---+---+---+---+---+
|1|0.0|0.0|0.0|1.0|0.0|0.0|
|2|1.0|0.0|0.0|0.0|0.0|0.0|
|3|0.0|0.0|1.0|0.0|0.0|0.0|
你是什麼意思「他們沒有列名」?請分享'df.show()'的輸出。 – desertnaut
編輯我的帖子。我現在看到我可以做到這一點,但我仍然對循環遍歷每一列感到困惑。 – Nivi