0
我們最近在掩蓋造成一個應用程序的影響有一定的用例或場景與ELB運行狀況檢查的問題。
任何人都可以提出一種容錯方法來處理這個問題嗎?
- 我們有一個應用程序的NodeJS在一個端口上運行 - 80
- 我們有3個實例中&目標集團是在ELB就讀。
- ELB HealthCheck被配置爲在端口80上命中根路徑,如果它獲得HTTP 200則返回成功
- 最近有一個節點在應用程序裝載上填充了100%的磁盤,並且root裝載仍有空間。
- 雖然HealthCheck按ELB成功,但服務器沒有響應任何其他服務,並且它非常不健康。這意味着有一些請求得到 成功,但其中一些失敗(這是路由到這個磁盤填充服務器)。
- 我們確實收到了來自其他監控系統的磁盤填充通知,但由於壓倒性的電子郵件&有限的資源它被錯過了。
- 是否有任何其他方法可以即興創建HealthCheck策略,只需將這些場景呈現給AutoScaling組或ELB ,以便我們可以將這些節點的目標移除並自動替換它們?