2017-08-01 63 views

回答

1

有3個最常見的數據遷移到Cassandra的選項:
1.自定義Spark工作。這需要一些編程,儘管它是最具可擴展性的解決方案,並允許您擁有任何自定義數據轉換邏輯。您可能需要數據轉換,因爲我無法想象您將擁有完全相同的RDBMS和鍵值存儲的表結構。
2.使用DataStax Enterprise軟件包中的sqoop(它包含Cassandra的自定義驅動程序)。
3.使用sqoop和Casasndra的JDBC驅動程序。雖然,我對上次Cassandra的JDBC驅動程序版本功能和穩定性沒有任何意見。我們在之前的版本中遇到了一些問題。
好的,有第四個。您可以編寫自己的數據簡單的獨立遷移工具(例如使用Java)。該工具將逐行讀取來自Postgres的數據並調用Cassandra的插入。這將會非常緩慢,雖然很簡單。
你已經提到過,數據庫非常大。但這只是意味着你必須等待更長時間直到遷移結束。這對於很多情況並不重要,確實如此。
CPU工作,而你可以做一些其他的事情。否則,當CPU放鬆時,你必須使用自己的時間。

+0

非常感謝! :) – Annie

+0

@S。 Stas 有沒有什麼辦法可以達到上述目的,例如將Postgres轉儲文件轉換成Cassandra轉儲文件或其他東西。 –

+0

好吧,從技術上講,您可以運行pg_dump並獲取sql命令列表。然後你可能需要用文本編輯器替換一些sql命令(對於Cassandra的特定版本)。不好的是,@Annie寫道,數據庫非常大。所以.sql文件會更大。所以COPY命令在這裏是更現實的輸入方式。 –