1
我有一個流式管道,它使用帶時間戳標記的事件。我想要做的就是將它們批處理爲1分鐘的固定窗口,然後將窗口中的所有事件寫入單個GCS文件。我可以使用FixedWindows
,除了從文檔中,我可以看到我需要一個GroupBy
或Combine
操作來應用窗口,但對於我的用例,Windowing已經完成了我需要的所有分組。我看到這個兩個可能的解決方案,這兩個我不知道是理想在沒有GroupBy的情況下對數據使用FixedWindows
- 推動這些項目到一個單一的
GlobalWindow
和重複應用1分鐘觸發,丟棄解僱窗格。我還沒有嘗試過這一點,我不知道這是否會工作沒有一個組 在
FixedWindow
之後運行全球Combine
- 我不確定這是否仍然會考慮windows。這些是正確的選擇還是有更好的辦法?
感謝