我在尋找有經驗監控AWS中的Oracle RDS數據庫經驗的任何人的一般建議。我正在使用的系統將涉及AWS中的幾個企業Oracle RDS數據庫(數量級爲幾十)。我的組織正在考慮爲監控兩個選項:AWS上的Oracle監控:EM Express與雲控制
- 設置在AWS雲控制,由住房的OMS和EC2實例存儲數據庫和啓用OEM_AGENT我們的RDS實例。
- 完全依賴EM Express/CloudWatch和我們可以使用的任何其他第三方軟件,而無需Cloud Control的開銷。
與選項1所關注的是它破壞了我們對移動到RDS的原因,即,以消除一些保持傳統的內部部署Oracle數據庫的管理開銷。 OEM存儲庫數據庫不能安裝在RDS中,因爲OMS需要對存儲庫進行SYS級訪問,而RDS不允許這樣做。因此,擁有云控制將需要我們希望遠離的許多類型的維護。
與選項2的問題是主要是缺乏度量報警的。 CloudWatch /增強監控爲警報提供了一些基本指標,但缺少更具體的指標和警報,例如警報日誌錯誤,表空間,長時間運行的查詢,使用的歸檔區域等。我們不介意缺乏集中化,因爲我們只是創建一個內部頁面,並鏈接到所有不同的數據庫,EM Express爲我們提供了從性能監控角度來看所需的內容。唯一值得關注的是缺乏指標提示。如果沒有其他方式來做這件事,我們也可以簡單地編寫我們自己的PL/SQL腳本來觸發警報。
不過,我很好奇,想知道別人是如何解決這個問題,甚至只是一般,已經確定什麼樣的基於AWS-甲骨文監測系統的建立與它們如何工作。
是的,RDS事件對於高級基礎架構監視非常有用,但問題仍然是內部數據庫監視,因爲RDS事件不提供任何此類事件。 – amparito
@amparito沒錯。 RDS事件不是很好。爲了克服這個問題(在某種程度上),將監控腳本轉換爲lambda函數(是的,不是一件容易的事),或者讓一個經理盒(一個單獨的EC2)加載你的腳本並在所有RDS上執行它。 – vira