我一直在閱讀很多文章,其中Apache Storm的實現被解釋爲從Apache Flume或Apache Kafka攝取數據。閱讀了幾篇文章後,我的主要問題仍未得到解答。使用Apache Kafka或Apache Flume的主要好處是什麼?爲什麼不直接從數據源中收集數據到Apache Storm?Apache Storm的數據攝入
爲了理解這一點,我研究了這些框架。糾正我,如果我錯了。
Apache Flume是關於從源收集數據並將數據推送到接收器的。在這種情況下,水槽就是Apache Storm。
Apache Kafka是關於從源收集數據並將它們存儲在消息隊列中,直到Apache Storm處理它。
Flume源有兩種類型:PollableSource和EventDrivenSources。所以它不僅僅意味着要異步接收數據。風暴噴口也可以作爲事件驅動實施,只需稍作調整即可。 Twitter的噴口實施可以是一個例子。 – Lan 2015-03-11 16:20:02