2
event1 foo_id1
event1 foo_id2
event1 foo_id4
event1 foo_id6
event1 foo_id7
event1 foo_id8
event1 foo_id8
event1 foo_id1
event1 foo_id4
event2 foo_id1
event2 foo_id2
event2 foo_id3
event2 foo_id4
event2 foo_id5
event2 foo_id6
event2 foo_id8
event2 foo_id9
event2 foo_id11
以上信息在某個存儲桶(如s3://hadoop.mycompany.com/bucket1/foo1.txt
)下可用作S3中的文件。如何根據同一文件中的輸入解析出現
所有事件都有foo_ids
。對於「event2
」中的所有事件,我想知道這些foo_id
(s)在event1
中發生了多少次。
例如在上述情況下,
foo_id1=2
foo_id2=1
foo_id3=0
foo_id4=2
foo_id5=0
foo_id6=1
foo_id8=2
foo_id9=0
foo_id11=0
如何編寫配置單元腳本以預期的格式返回數據?