我正在通過stdin
(hadoop streaming in reducer)讀取輸入。檢測python中標準輸入(stdin)中的最後一條記錄
我需要檢測最後一條記錄何時進入。我正在運行for循環stdin
數據。
我試圖讀取stdin
首先計算總記錄,然後再閱讀與業務處理,繼續進行,但只要我從stdin
讀取記錄來計算total_cnt
然後記錄從流熄滅以後當我嘗試讀取stdin
進行處理時,stdin
中沒有記錄。
total_cnt = 0
for line in stdin:
total cnt += 1
for line in stdin:
##Some Processing##
我不想存儲stdin
某處並讀取該位置的數據進行兩次(1.總記錄數和2數據處理)。
有沒有什麼辦法可以檢測到最後一張唱片從stdin
進來?
我正在使用python 2.7.11版本,需要在Hadoop reducer中實現這個方法。
見http://stackoverflow.com/a/24199042/5987 –