2016-12-31 74 views
-1

我有一個用例,我不得不使用Apache Spark分析實時數據。但是我仍然對選擇我的應用程序的數據存儲有困惑。分析主要包括彙總,基於KPI的身份分析和機器學習工具來預測趨勢和分析。卡桑德拉擁有良好的支持,大型​​科技公司已經在生產中使用它。但經過研究,我發現Druid比Cassandra更快並且適用於OLAP查詢,但它的結果與Count Distinct之類的查詢不一致。卡桑德拉vs德魯伊

男士任何幫助相關,將不勝感激。謝謝

回答

1

由於您的使用案例是分析實時數據,我會建議您使用Druid而不是Apache Cassandra。對於Apache Cassandra,由於其異步無主複製,您可能錯過了實時分析中的更新數據。另一方面,Druid專爲實時分析而設計。

Druid詳情:http://druid.io/druid.html
Apache Cassandra詳情:https://en.wikipedia.org/wiki/Apache_Cassandra