我想使用GNU並行來幫助我處理一些遠程文件,我不想在本地保存。GNU並行輸出到標準輸出使用 - round-robin
我的命令看起來有點像:
python list_files.py | \
parallel -j5 'aws s3 cp s3://s3-bucket/{} -' | \
parallel -j5 --round --pipe -l 5000 "python process_and_print.py"
process_and_print.py
打印輸出一些輸入線,但輸出沒有得到立即stdout的像我預期的,相反我只看到後輸出過程完了。如果我刪除了--round
參數,所有參數都按預期工作。
所有數據都保存在哪裏?我有辦法將它打印到stdout,一行一行,沒有緩衝?