我有Maven依賴關係spark-sql_2.1.0
和spark-hive_2.1.0
。但是,當我嘗試import org.apache.spark.sql.DataFrame
時,出現錯誤。但是導入 org.apache.spark.sql.SQLContext
是可以的,沒有錯誤。爲什麼?爲什麼我不能導入org.apache.spark.sql.DataFrame
回答
DataFrame已成爲type DataFrame = Dataset[Row]
。 Java沒有類型別名,所以它在Java中不可用。現在,您應該使用新的類型Dataset<Row>
,所以導入這兩個org.apache.spark.sql.Dataset
和org.apache.spark.sql.Row
如果我有一個DataFrame,sqlContext.read(),我該怎麼辦? –
@JasonShu只是'數據集
@JasonShu你還應該在Spark 2.x中使用SparkSession: –
import org.apache.spark.sql.DataFrame
作品scala
而不是java
因爲沒有爲java
開發庫。您可以使用dataSet
作爲Spark SQL, DataFrames and Datasets Guide解釋
您可以導入以下
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
,並把它們作爲
Dataset<Row> peopleDataFrame = spark.createDataFrame(rowRDD, schema);
或者
Dataset<Row> peopleDF = spark.createDataFrame(peopleRDD, Person.class);
或者
Dataset<Row> usersDF = spark.read().load("examples/src/main/resources/users.parquet");
這是真的。但是,如果我有一個DataFrame,例如,sqlContext.read()。我應該怎麼做? –
您可以使用'數據集
是的,它工作。但是,當涉及到sqlContext.read.json,它失敗了。 –
- 1. 爲什麼我不能導入pg.py?
- 2. 爲什麼我不能導入「models.User」?
- 3. 爲什麼我不能導入geopandas?
- 4. 爲什麼我不能導入tensorflow
- 5. 爲什麼我不能導入pygtk?
- 6. 爲什麼我不能導入sklearn
- 7. 爲什麼我不能導入android.os.StrictMode?
- 8. 爲什麼我不能導入nltk?
- 9. 爲什麼spyder不能導入tensorflow
- 10. 爲什麼不能導入文件?
- 11. 爲什麼我不能將我的C#類型導入IronPython?
- 12. 爲什麼我不需要導入sys?
- 13. 爲什麼我的SWF不能嵌入?
- 14. 爲什麼我不能淡入sencha touch?
- 15. 爲什麼我不能插入?
- 16. 爲什麼我不能點擊輸入?
- 17. 爲什麼我不能導入folium python包?
- 18. 爲什麼我不能在Python 3.5中導入pptx包
- 19. 爲什麼我不能導入這個類?
- 20. 雖然我引用了xtensibility.dll,但爲什麼不能導入EnvDTE?
- 21. 爲什麼我的ReadTheDocs項目不能導入?
- 22. 爲什麼我不能在頂部移動導入?
- 23. 爲什麼我不能在@NgModule中導入Angular 2服務?
- 24. 爲什麼eclipse不能正確導入我的項目?
- 25. 爲什麼我不能導入這個模塊
- 26. 爲什麼我不能多次導入變量?
- 27. 爲什麼我不能導入UITableViewCell子類?這是奇怪的
- 28. 爲什麼我不能在Grails中導入這個Groovy庫?
- 29. 爲什麼我不能導入Qt3D模塊?
- 30. 爲什麼我不能ExecuteNonQuery()?
你正在得到什麼類型的錯誤?這對我來說工作得很好 –
你使用哪種語言? –
@T.Gawęda我正在使用Java –