0
我的數據很好地按分區鍵組織在Cassandra上。我想檢索Spark中的這些數據並保留相同的分區。檢索Apache Spark中的Cassandra分區數據
我的目標是避免非常大的洗牌。
PS:我用的卡珊德拉2.1和1.5星火
我的數據很好地按分區鍵組織在Cassandra上。我想檢索Spark中的這些數據並保留相同的分區。檢索Apache Spark中的Cassandra分區數據
我的目標是避免非常大的洗牌。
PS:我用的卡珊德拉2.1和1.5星火
星火卡桑德拉連接器讀取C *令牌範圍爲星火分區。這意味着任何給定的Cassandra分區鍵的所有值都將位於同一個Spark分區中。
https://academy.datastax.com/demos/how-spark-cassandra-connector-reads-data
你將不得不制定...默認情況下,這是什麼樣的火花卡桑德拉連接器一樣。 – RussS
@RussS這就是我想知道的。 – poiuytrez