這個問題與應用程序開發並不完全相關,但從體系結構的角度來看並非如此。假設一個應用程序必須在AWS上託管,這將需要來自多個外部第三方持有數據庫的通信(不是必須在AWS上,可能是他們自己的數據中心或託管) - 也許一個客戶端將使用MySQL,另一個客戶端一個MSSQL或Oracle等。AWS上託管的應用程序訪問多個外部數據庫
因此,保存在這些外部數據庫中的數據可能會頻繁更改,並且應用程序應始終檢索更新的數據。我能想到的一種方式是使用另一個RDBMS數據庫(從我們這邊)專門存儲來自外部數據庫的所有這些數據,並始終保持我們的數據庫同步。但我不確定這是否是實現這一目標的好方法。
或者是否需要使用像Redshift這樣的數據倉庫工具來存儲實時同步的所有數據,然後在我們的應用程序中使用DW數據?根據這裏的架構師,這對於實現這個目標有什麼好的解決方案,主要是通過多個外部數據庫連接和同步?
您可以連接VPC和遠程數據中心之間的連接,也可以使用Direct Connect服務實現更好的連接。 –
如果您可以提供更多關於您的用例的信息以提供更好的答案,那將是非常好的。那麼你指的是什麼樣的應用程序?瞭解您在這些外部數據庫中所擁有的大致數據量也很重要。你需要同步所有的數據還是部分?您需要多久才能將新數據提供給其他數據庫? – Ashan
@Ashan:這可能是一個將被公衆使用的移動應用程序(android/ios)。我無法找到外部數據庫的確切大小。由於從我需要檢索數據的位置將會有多個位置/客戶端數據庫,因此我認爲至少有一個TB數據在那裏。所以,如果沒有同步數據的解決方案,我沒關係 - 只是我的移動應用程序應該與許多客戶端的許多DB進行通信並實時獲取所需的信息。 我希望這會給你一個更大的圖片。 – serverstackqns