最近我一直在Spark Streaming上進行性能測試。我在6個從站之一上運行了一個接收器,並向集羣提交了一個簡單的字數統計應用程序(實際上,我知道這種配置在實踐中並不合適,只是一個簡單的測試)。我分析了調度日誌,發現近88%任務被安排到接收器運行的節點,並且局部總是處於PROCESS_LOCAL狀態,並且CPU利用率非常高。 Spark Streaming爲什麼不在整個集羣中分佈數據並充分利用集羣?我讀過官方指南,並沒有詳細解釋,特別是在Spark Streaming中。如果任務位於CPU繁忙的節點上,它是否會將流數據複製到具有空閒CPU的另一個節點並啓動新任務?如果是這樣,我們如何解釋前一種情況?Spark Streaming中的數據區域
0
A
回答
1
當您在6個節點之一上運行流receiver
時,將在此節點上處理所有接收到的數據(即數據區域)。
默認情況下,數據不會分佈在其他節點上。如果需要進一步的處理之前的輸入流被重新分區(在集羣平衡),則可以使用
inputStream.repartition(<number of partitions>)
這進一步處理前分配跨集羣中機器的指定數量的數據的接收到的批次。
可以星火文檔
https://spark.apache.org/docs/latest/streaming-programming-guide.html#performance-tuning
相關問題
- 1. Spark Streaming中的Checkpoint數據損壞
- 2. 在Spark Streaming中讀取Hbase數據
- 3. Spark Streaming中的java.lang.LinkageError
- 4. Spark Streaming中的UnknownHostExceptionError
- 5. spark-streaming-kafka-0-10:如何限制Spark分區的數量
- 6. Spark Streaming Multiple Streaming Jobs
- 7. 使用無模式數據的Spark Streaming
- 8. Kafka - Spark Streaming - 僅從一個分區讀取數據
- 9. 從Spark Streaming將數據推送到Kafka
- 10. Spark Streaming - Kafka- createStream - RDD到數據幀
- 11. Spark Streaming - updateStateByKey和緩存數據
- 12. Spark-Streaming Kafka Direct Streaming API&Parallelism
- 13. 在Spark Streaming中的Kafka createDirectStream
- 14. Spark Streaming Flume Integration
- 15. Spark Scala Streaming CSV
- 16. Spark Streaming textFileStream COPYING
- 17. Spark Streaming MYsql
- 18. Spark Streaming Kafka backpressure
- 19. Spark Streaming JavaCustomReceiver
- 20. Spark Streaming,kafka:java.lang.StackOverflowError
- 21. Spark Streaming throwing java.net.ConnectException
- 22. Spark Streaming dropDuplicates
- 23. Streaming Kmeans Spark JAVA
- 24. apache spark Streaming error
- 25. Spark Streaming Statistics的API
- 26. 在Spark Streaming中緩存DStream
- 27. 在spark-streaming中解析json
- 28. 如何訪問Spark Streaming應用程序中的緩存數據?
- 29. Spark Streaming xml文件
- 30. 結合Spark Streaming + MLlib
我做了重新分區測試和流的延遲似乎未改良,比以前更大的閱讀更多關於並行的水平。實驗在兩臺物理服務器上託管的6個節點的虛擬集羣中完成。 –
如何啓動多個接收器?羣集中的CPU利用率是否已更改?不是它應該在所有節點之間更加平衡。 – vanekjar
重新分區後,虛擬羣集中的CPU利用率發生了變化。它似乎在所有節點之間更加平衡,但延遲並沒有得到顯着改善。我不確定是什麼原因造成的,重新分配會導致接收器運行的節點或更多網絡傳輸的負載增加? –