Spark,apache flink等數據處理引擎如何將結構化,半結構化和非結構化數據集成在一起並影響計算?結構化和非結構化數據集成與大規模數據處理引擎
0
A
回答
1
像Flink或Spark這樣的通用數據處理引擎可以讓你定義自己的數據類型和功能。
如果您有非結構化或半結構化數據,您的數據類型可以反映這些屬性,例如通過使某些信息可選或使用靈活的數據結構(嵌套類型,列表,地圖等)對其進行建模。您的用戶定義函數應該知道某些信息可能並不總是存在,並且知道如何處理這些情況。
因此,處理半結構化或非結構化數據並不是免費的。它必須明確指定。事實上,這兩個系統都把重點放在用戶定義的數據和功能上,但最近增加了API來簡化結構化數據的處理(Flink:Table API,Spark:DataFrames)。
+0
我可以分別處理結構化和非結構化數據,然後在最後加入它們(輸出)! –
+0
如果這是一個問題,是的,你可以。 –
相關問題
- 1. 結構化,非結構化和半結構化數據
- 2. 從BeautifulSoup解析非結構化數據到結構化數據集
- 3. 結構化和非結構化數據如何區分?
- 4. 存儲結構化和非結構化數據
- 5. 數據庫規範化和結構
- 6. SSIS處理半結構化數據源
- 7. Redis - 處理數據結構的變化
- 8. 構造非結構化數據
- 9. Gnuplot和非結構化數據
- 10. 處理非結構化大XML文件
- 11. 非結構化文本結構化數據
- 12. 如何將此非結構化數據轉換爲結構化?
- 13. 瑞典語NLP產品搜索引擎與結構化數據
- 14. 解析非結構化數據
- 15. 非結構化數據庫設計
- 16. 可以處理半結構化數據的數據庫?
- 17. 初始化數據結構
- 18. Python優化數據結構
- 19. 優化數據庫結構
- 20. UIMA結構化數據
- 21. 谷歌結構化數據
- 22. 從結構化數據生成PDF
- 23. 使用Perl和非結構化數據令牌化
- 24. 結構化數據的模糊匹配
- 25. MySQL - 大規模的結構變化
- 26. Firebase - 瞭解非規範化數據結構
- 27. 變化數據結構數據幀
- 28. C#HttpWebRequest與XML結構化數據
- 29. Spark處理非結構化文件
- 30. 使用java將非結構化數據(文本)轉換爲結構化格式
「太寬泛」:有太多可能的答案,或者對於這種格式來說答案太好。請添加詳細信息以縮小答案集或隔離幾個段落中可以回答的問題。 – maasg