2

我在尋找有經驗監控AWS中的Oracle RDS數據庫經驗的任何人的一般建議。我正在使用的系統將涉及AWS中的幾個企業Oracle RDS數據庫(數量級爲幾十)。我的組織正在考慮爲監控兩個選項:AWS上的Oracle監控:EM Express與雲控制

  1. 設置在AWS雲控制,由住房的OMS和EC2實例存儲數據庫和啓用OEM_AGENT我們的RDS實例。
  2. 完全依賴EM Express/CloudWatch和我們可以使用的任何其他第三方軟件,而無需Cloud Control的開銷。

與選項1所關注的是它破壞了我們對移動到RDS的原因,即,以消除一些保持傳統的內部部署Oracle數據庫的管理開銷。 OEM存儲庫數據庫不能安裝在RDS中,因爲OMS需要對存儲庫進行SYS級訪問,而RDS不允許這樣做。因此,擁有云控制將需要我們希望遠離的許多類型的維護。

與選項2的問題是主要是缺乏度量報警的。 CloudWatch /增強監控爲警報提供了一些基本指標,但缺少更具體的指標和警報,例如警報日誌錯誤,表空間,長時間運行的查詢,使用的歸檔區域等。我們不介意缺乏集中化,因爲我們只是創建一個內部頁面,並鏈接到所有不同的數據庫,EM Express爲我們提供了從性能監控角度來看所需的內容。唯一值得關注的是缺乏指標提示。如果沒有其他方式來做這件事,我們也可以簡單地編寫我們自己的PL/SQL腳本來觸發警報。

不過,我很好奇,想知道別人是如何解決這個問題,甚至只是一般,已經確定什麼樣的基於AWS-甲骨文監測系統的建立與它們如何工作。

回答

0

的問題,幾乎所有的這些移動雲企業今天面對。公司轉向雲以擺脫他們的一些管理任務,然後他們發現他們無法完成他們在本地進行的所有定製。

所以,這裏是你如何可以使選項2更好。特別是對於解決您的問題

唯一要擔心的還真是提醒

  1. RDS事件進行監視的好方法缺乏度量。您可以訂閱事件並以多種方式收到通知,如羣組電子郵件,閒置頻道或第三方監控工具(如pagerduty)。

  2. 使用和λRDS活動的整合。我強烈建議看看Lambda。正如我上面提到的,除了訂閱事件,您還可以調用/觸發lambda函數來針對特定事件採取操作。我們使用Lambda來克服mysql中的slave跳過錯誤。

  3. LAMBDA的另一種使用情況是計劃作業的替代方案。像每天檢查磁盤空間,以確保增量備份過夜。

讓我知道,如果你有關於「如何實現」這些選項的具體問題。我很樂意添加更多信息。

+1

是的,RDS事件對於高級基礎架構監視非常有用,但問題仍然是內部數據庫監視,因爲RDS事件不提供任何此類事件。 – amparito

+0

@amparito沒錯。 RDS事件不是很好。爲了克服這個問題(在某種程度上),將監控腳本轉換爲lambda函數(是的,不是一件容易的事),或者讓一個經理盒(一個單獨的EC2)加載你的腳本並在所有RDS上執行它。 – vira