我知道Twissandra這是一個使用Cassandra的twitter克隆的示例,但我有興趣查看是否有人共享Cassandra架構不是爲了克隆Twitter,而是用於存儲通過Twitter發送的推文流媒體API?Apache Streaming API的Apache Cassandra數據架構
1
A
回答
6
這很大程度上取決於您在攝入數據後想要對數據進行什麼樣的查詢 - 我從您之前的問題「轉儲Twitter流式API推文...」中看到,您可能只是想要進行大批量處理在上面。
如果是這種情況,您只需要擔心負載平衡,確保集羣中的每個節點處理寫入負載的1/n,並且包含1/n數據 - 使用隨機分區並插入每鳴叫一行與狀態ID爲行鍵將實現這一目標。
但是,如果你想要做像「給我一個給定用戶的所有微博」的查詢,您將需要一個稍微複雜的模式,如上文所建議的架構將要求您掃描所有的數據。你可以每行插入多鳴叫,行鍵爲用戶ID,列鍵爲鳴叫ID和作爲鳴叫價值。然後,您可以使用get_slice來回答該查詢。
好(有點關係)的博客文章:http://blog.insidesystems.net/basic-time-series-with-cassandra
相關問題
- 1. apache spark Streaming error
- 2. Apache Cassandra或DataStax Cassandra?
- 3. Apache Cassandra磁盤上的數據存儲
- 4. 使用apache flink讀取和寫入cassandra的數據Java API
- 5. Apache Cassandra讀取數據給出ReadFailureException
- 6. Apache Ignite-Cassandra集成,數據重複?
- 7. java.lang.NoClassDefFoundError:org/apache/spark/streaming/kafka/KafkaUtils
- 8. Apache Ignite和Cassandra - NoClassDefFoundError
- 9. UTF8Type與ByteType的Apache Cassandra的
- 10. 更新架構的數據幀中的Apache星火
- 11. Apache Cassandra啓動問題
- 12. Apache Cassandra JDBC連接錯誤
- 13. 在Apache Cassandra中添加列
- 14. IBM InfoSphere與Apache Cassandra集成
- 15. Apache Spark Streaming失敗的集成測試
- 16. 如何在DynamoDB流中使用Apache Streaming
- 17. Spark Streaming + Hbase:NoClassDefFoundError:org/apache/hadoop/hbase/spark/HBaseContext
- 18. Apache POI Streaming API無法識別Excel(xlsx)內容
- 19. apache spark streaming - kafka - 閱讀舊信息
- 20. Apache Spark SQL從Cassandra中獲取數十億行數據?
- 21. 爲Apache Mahout使用Cassandra數據模型的示例
- 22. 檢索Apache Spark中的Cassandra分區數據
- 23. Apache Cassandra中的財務數據分析建模?
- 24. Apache Cassandra作爲ActiveMQ的消息數據存儲
- 25. Flex 4.5/Apache Flex UI框架結構
- 26. Apache Ignite適用於NoSQL架構
- 27. Apache Metamodel與Apache Drill
- 28. Apache Phoenix API for PHP
- 29. Apache Apex與Apache Flink
- 30. 的Apache Cassandra的3.10拋出:IllegalArgumentException - 爲Murmur3Partitioner
你對此有何更新嗎?你有沒有對你有用的計劃? – felipeclopes
我放棄卡桑德拉和HBase的使用,而不是用自定義模式 –