2017-07-19 41 views
1

是否可以從Flink流作業觸發檢查點?來自Flink流的手動檢查點

我的用例是:我有兩個流R和S加入翻滾時間窗口。來源是卡夫卡。我使用事件時間處理和BoundedOutOfOrdernessGenerator來確保來自兩個流的事件在同一個窗口中結束。

問題是我的狀態很大,有時定期檢查點需要的時間太長。起初,我想禁用檢查點,並依賴卡夫卡膠印。但亂序意味着我已經在當前偏移量的未來窗口中獲得了一些數據。所以我需要檢查點。

如果可以在清理窗口後觸發檢查點而不是定期檢查點,則效率會更高。也許在evictAfter方法。

這是否合理,是否有可能?如果不是,我會欣賞一項工作。

+0

在Flink環境中,您可以嘗試減少檢查點間隔。你看過1.2發行說明嗎? https://ci.apache.org/projects/flink/flink-docs-release-1.2/dev/stream/checkpointing.html#state-checkpoints-in-iterative-jobs –

+0

我看不出有什麼幫助。即使我不太頻繁地使用支票,他們仍然會很大。我想在觸發運營商事件發生的最少事件時提高檢查點的效率。 – yolgun

+0

_更頻繁。縮短間隔會使檢查點更小 –

回答