2015-10-20 72 views
0

我已經編寫了在生產服務器上全天候運行的flume代理。但是有一段時間我觀察到水槽劑靜靜地下降。Flume Agent failure Handlling

我需要一種機制,當這種情況發生時,至少可以向客戶機/用戶發出警報。

任何建議來處理這種情況。

回答

0

首先:我認爲最好查看日誌以查看Flume崩潰的原因。如果沒有任何內容,請參閱您是否可以將日誌記錄級別更改爲WARNINFO,因爲Flume不應該崩潰。它已經在我的箱子上運行了很長時間了。

如果您想繼續創建該監視機制:afaik Flume不支持這樣的事情,但一個簡單的bash腳本應該可以做到。這是一個例子。您必須自定義在Flume關閉時執行操作的命令。

#!/bin/bash 
process_identification_str='flume-ng' 
while "true"; do 
    ps=$(ps aux | grep "$process_identification_str" | grep -v 'grep') 
    if [ -z "$ps" ]; then 
     echo 'ALARM!' 
    fi 
    sleep 1 
done 
+0

感謝您的回覆。我想知道我們是否可以使用HDP附帶的任何工具。任何建議? – Shashi

0

見我發現了什麼:「監視在水槽仍處於進展中的工作的變化可以經常發生一些水槽組件的JMX平臺MBean服務器報告的指標,這些指標可以使用JConsole進行查詢。」

https://books.google.com.co/books?id=u1bTBgAAQBAJ&pg=PA145&lpg=PA145&dq=Monitoring+in+Flume+is+still+a+work+in+progress.+Changes+can+happen+very+often.+Several+Flume+components+report+metrics+to+the+JMX+platform+MBean+server.+These+metrics+can+be+queried+using+Jconsole.&source=bl&ots=WgCjzsZ399&sig=CUra1DUhWgx0H87HZ59FdwdW-9E&hl=es&sa=X&ved=0ahUKEwiD3dvVoJrRAhXMSSYKHWHqDzsQ6AEIGzAA

現在看來,這是不可能的本地監控該組件現在。

商祺!