1
我正嘗試在KafkaUtils中使用新的directStream方法讀取kafka主題。 我有8個分區的卡夫卡主題。 我正在8個執行器上運行1個內核的紗線( - num-executors 8 --executor-cores 1)。 因此注意到spark會依次讀取一個執行程序中的所有主題分區 - 這顯然不是我想要的。 我想要點燃並行讀取所有分區。 我該如何做到這一點?新的directStream API按順序讀取主題的分區。爲什麼?
謝謝,提前。
對此有更多見解嗎?我使用火花獨立模式,所以我不能準確設置執行程序的數量,但是我感興趣如果我有2個主題並且核心總數設置爲2會發生什麼? –