我有一個系統,每行生成100,000行,每行的大小爲1KB,並希望使用Cassandra進行數據庫。 我從Apache Kafka獲取數據,然後將其插入數據庫。 將此卷數據加載到Cassandra的最佳方式是什麼?Cassandra大容量加載數據
回答
卡夫卡連接是專爲此設計的。在此頁面上,您可以找到包含Cassandra水槽連接器的連接器列表https://www.confluent.io/product/connectors/
我從kafka獲取CSV郵件。看起來連接器使用avro格式。我真的嗎? –
不確定有關CSV郵件,但json除了avro還可以使用: http://docs.datamountaineer.com/en/latest/cassandra-sink.html#legacy-topics-plain-text-payload-with-a -json-string 老實說,寫一些像流應用程序這樣的東西可能會更容易將CSV轉換爲json或avro,然後將其寫入可以拉入Cassandra的新主題。您也可以編寫自己的CSV轉換器或嘗試使用Kafka附帶的StringConverter。不知道這將如何與Cassandra一起工作,但這些選項中的任何一個都比編寫自己的完整應用程序更容易。 – dawsaw
從CSV到JSON或AVRO的數據轉換可以在一個小的Apache CAMEL模塊中輕鬆實現。它支持Kafka連接,所以你可以從Kafka中讀取,轉換並回寫到@dawsaw提到的Kafka。您還可以根據需要對其進行縮放。 – Gautam
- 1. 加載大量數據
- 2. Cassandra:大容量傳感器數據說明
- 3. 向cassandra插入大量數據
- 4. 加載大量數據/內容時網頁滾動緩慢
- 5. Silverlight的 - 無法加載大量數據
- 6. 在後臺加載大量數據
- 7. 將大量數據加載到Postgres Hstore
- 8. Datagrid中加載大量數據的
- 9. 使用Node.js的大量數據加載
- 10. 加載大量的excel數據與EPPlus
- 11. 如何加載大量數據?
- 12. cassandra python數據加載失去連接
- 13. 什麼是Cassandra的良好批量數據加載工具
- 14. GREG服務大容量加載
- 15. HBase大容量加載jar問題
- 16. Cassandra - 批量過大
- 17. Cassandra超時cqlsh查詢大量(ish)數據量
- 18. 將大量數據加載到Oracle SQL數據庫中
- 19. 在silverlight中加載大量數據的數據網格?
- 20. 如何在數據表中加載大量的數據?
- 21. 從Android中的Sqlite數據庫加載大量的數據
- 22. datatable加載大數據c#
- 23. 在Android AutoCompleteTextView中高效加載大量數據(大約5000)
- 24. SQL Server 2008上的大容量繁重讀取加載數據的性能
- 25. SQLite數據庫最大存儲容量
- 26. 用於大容量數據庫的ORM
- 27. 在一個查詢中在cassandra中寫入大量數據
- 28. 大規模數據處理Hbase vs Cassandra
- 29. Cassandra批量InvalidQueryException - 批量太大
- 30. 從服務器下載大量數據
將數據拆分成批。最好批量大小爲1000,並將數據寫入cassandra db。 – kai