3

我正在使用AWS-Kinesis-Firehose將數據注入S3,並在之後與雅典娜一起使用。按負載將AWS Kinesis Firehose數據分區爲s3

我想分析來自不同遊戲的事件,爲了避免雅典娜探索大量數據我想用每個遊戲的標識符來劃分s3數據,到目前爲止我沒有找到解決方案,因爲Firehose從不同的數據接收數據遊戲。

有誰知道該怎麼做?

謝謝, Javi。

+0

最好添加你到目前爲止的代碼 – anyanwu

回答

1

您可以將您的流量發送到主流水流 - 然後使用lambda功能將數據分割到多個流水流 - 每個遊戲,將保存在一個單獨的文件夾/桶數據

+0

我想過這個,但是有一個問題,我期望每天有大約2000萬事件,這意味着lambda函數每天將被觸發20M次只是爲了「分類」事件,這將是昂貴的。 – bracana

+0

我發現了cloudWatch事件,可以在一段時間間隔內幫助我,但仍然可能很昂貴 – bracana

+0

Lambda可以通過FireHose作爲批量觸發1000個事件 - 這將顯着減少觸發器 –

相關問題