我有這樣的代碼:取N行,並傳遞給toPandas()
l = [('Alice', 1),('Jim',2),('Sandra',3)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df.withColumn('age2', df.age + 2).toPandas()
做工精細,做什麼需要的地方。假設我只想顯示前n行,然後調用toPandas()
來返回一個熊貓數據幀。我該怎麼做?我不能撥打take(n)
,因爲這不會返回數據幀,因此我無法將其傳遞給toPandas()
。
換句話說,如何從數據框中獲取前n行並在結果數據框上調用toPandas()
?不能認爲這很難,但我無法弄清楚。
我正在使用Spark 1.6.0。
看我知道這很容易:)非常感謝。 – jamiet
歡迎您! – Neo