2016-12-26 89 views

回答

-1

基於時間戳的Spark Streaming進程文件,即只有那些在火花流開始之後被添加到特定路徑的文件被處理。 Spark流不處理在流上下文開始之前放置的文件。

簡單地說,流式處理不在舊數據上的實時數據。