我是卡桑德拉的新手,所以我讀了十幾篇關於它的文章,因此我瞭解基礎知識。所有教程都會顯示1或2列以及時間範圍內的高效數據檢索。我找不到如何正確建模數據,如果你有更多的條件。具有多個條件的卡桑德拉數據模型
我有一個大的事件規範化的數據庫,具有相當多的欄目,說:
- 事件類型
- 時間
- 電子郵件
- User_age
- user_country
- USER_LANGUAGE
- 等。
我需要能夠查詢所有列。因此,在RDBMS我會質疑:
SELECT email FROM table WHERE time > X AND user_age BETWEEN X AND X AND user_language = 'nl'
等。
我知道我可以做一個單獨的表列,但是後來我還是需要的結果結合起來。也許這不是一個壞的方法,但我懷疑它,因爲沒有子查詢。
我的問題很明顯,我該如何在Cassandra中正確模擬這種數據?
非常感謝!
因此,一個潛在的解決方案是: 爲每個事件類型創建單獨的表。 我們有一個可以用作分區鍵的「merchant_id」列,我們總是查找時間範圍和merchant_id,所以在一個分區上。 我們可以只添加其餘的二級索引嗎?在eventtype表+ merchant_id +時間選擇中可能仍有數百萬行。 –