0
A
回答
0
通常,您需要創建一個代表您的模式的StructType
。 A StructType
包含一個Array[StructField]
,其中數組的每個元素對應於您的模式中的一列。 A StructField
可以是任何支持DataType
- 包括嵌套模式的另一個StructType
。
創建模式可以是簡單的:
val schema = StructType(Array(
StructField("col1", StringType),
StructField("col2", LongType)
))
如果要生成一個複雜的數據集架構 - StructTypes
一個包含嵌套 - 那麼你很可能需要創建一個遞歸函數。在spark-avro
集成庫中可以找到這樣一個函數的樣子。函數toSqlType需要Avro
模式並將其轉換爲Spark StructType
。
+0
謝謝@ david-griffin,但我後**自動模式發現/推理**。我應該如何採樣數據併合並模式? –
相關問題
- 1. 自定義模式在火花1.4.1
- 2. 火花流 - 定製接收器和數據幀推斷模式
- 3. 如何寫火花自定義數據源基於FileFormat
- 4. 火花ML編寫自定義模式,變壓器
- 5. 應用自定義函數的火花數據幀組
- 6. 在apache的火花蟒蛇K-均值自定義的距離公式推
- 7. 推斷架構VS明確地傳遞模式,而在火花數據幀
- 8. SCE - 自定義數據源
- 9. 編寫你自己的火花數據源。
- 10. 自動應用數組[列]火花
- 11. 數據源自動綁定
- 12. 火花流:執行自定義VS接收機的數目
- 13. 將動畫SWF加載到自定義Flex(火花)按鈕中
- 14. KendoUI自定義數據源讀取功能自動完成
- 15. 主動資源的自定義參數
- 16. SSAS中的自定義ROLAP數據源
- 17. 處理來自jquery-ui自動完成中的自定義源的數據
- 18. 自定義花式框插件
- 19. 火花數據幀保存到SQL表自動遞增列
- 20. 自動斷言的來源?
- 21. Flex:在自定義itemrenderer中爲火花數據網格獲取列索引
- 22. 與ML火花和數據幀的隱式推薦
- 23. DB2用戶自定義函數和自定義模式
- 24. 自定義源
- 25. log4j自定義jdbc appender,數據源
- 26. JasperReports和自定義數據源
- 27. 自定義UICollectionView數據源和委託
- 28. JasperReports:訪問自定義數據源
- 29. android exoplayer自定義數據源
- 30. MVC Kendo網格自定義數據源
http://stackoverflow.com/a/35372282/1560062 – zero323