創建Cassandra的數據模型的設計,我有一個Job_Status
表3列:含有統計需要幫助,在我的要求
Job_ID (numeric)
Job_Time (datetime)
Machine_ID (numeric)
其他一些領域(如內存,CPU利用率)
在有規律間隔(例如1分鐘),條目將插入上表中,以便在每臺機器上運行作業。
我想在Cassandra中設計數據模型。
我的要求是獲得在兩臺或兩臺以上機器上同時運行的作業列表(一對)。
我已經創建表Job_Id
和Job_Time
作爲行主鍵但爲了達到預期的結果我有記錄檢索後做大量數據的解析。 當記錄數量達到50萬左右時,需要很多時間。 這個需求期望像SQL內部連接這樣的操作,但由於某些業務原因,我不能使用SQL,而且SQL數據集這樣龐大的SQL查詢也花費了很多時間,因爲我試圖用SQL Server中的空白數據來嘗試。
所以我需要在下面點你的幫助:
- 請表明,在卡桑德拉一些高效的數據模型這一要求。
- 如何在Cassandra數據庫中實現/實現SQL的連接操作?
請提出一些替代設計/算法。我被困在這個問題很長一段時間。
感謝Jim的迴應。工作刪除時間爲1年。你給我的方向看起來很有說服力,我會探索它。 – user2676044