2013-01-11 30 views
4

我在EC2中運行神經節,並且報告運行良好。我正在運行gmetad來監視來自管理報告實例的數據庫集羣,該實例是我們所有系統的集中式儀表板。我不希望這個實例包含在監控中。在管理員gmond.conf中,我設置了:如何從神經節報告中排除監控服務器?

mute = yes 

但是,這隻會讓web前端顯示主機已死。在管理gmetad.conf,我有DATA_SOURCE設置爲:

data_source "cluster" ec2-X-X-X-X.compute-1.amazonaws.com 

(與ec2-XXXX.compute-1.amazonaws.com作爲管理實例的EC2主機名)

我想設置mute=yes會將其從報告和gstat中刪除,但兩者仍顯示管理主機(localhost)已死機。

有沒有辦法做到這一點?

回答

6

您需要在您的gmond.conf文件中將host_dmax屬性設置爲非0值。

對我來說,靜音Ganglia主機最初出現(重啓後),但在我設置爲host_dmax後,消失。儘管mute設置爲yes,但仍不清楚爲什麼主機在重新啓動後首先出現。

cleanup_threshold屬性也可能會影響主機消失的時間。

這被覆蓋在Ganglia wiki

host_dmax值與以秒單位的整數。當設置爲零(0)時,即使遠程主機已停止報告,gmond也不會從列表中刪除主機。如果host_dmax設置爲一個正數,那麼gmond將在沒有收到它的消息後沖洗一個主機,持續host_dmax秒。順便說一下,dmax的意思是「刪除最大值」。

cleanup_threshold是gmond將清理任何主機或度量值之前的最小時間量,其中tmax> dmax又如a.a.過期的數據。

+0

非常感謝。你會推薦什麼作爲這些值的設置?我假設'host_dmax'應該相當高,這樣我才能知道合法的失敗。 –

+0

@DaveStern這取決於你的情況。建立警報設施(Nagios常用)可以快速瞭解故障。如果主機從Web界面中消失,您仍然會在其RRD數據庫中收集由gmetad收集的歷史數據。您可以將ganglia-web圖形URL中的'h'參數替換爲所需節點的主機名以繪製其數據圖形並查看發生了什麼。 – mmajis

相關問題