1
本書中的紅色火花在行動如下:Spark用於異步更新。
「Spark不適合用於共享數據的異步更新(例如,在線事務處理),因爲它是用批量創建的(Spark流只是在一個時間窗口中將數據應用於批量分析),專門用於這些用例的工具仍然是必需的。「
有人可以解釋是它的意思嗎?
我有興趣使用火花來執行一些ETL過程。作爲一個便箋,我打算在中間使用卡夫卡。雖然我不明白這個問題。因爲從卡夫卡獲取數據並將其寫入數據庫會有些相同的問題。這將平行完成。