0
A
回答
1
RDDs只能按鍵進行排序。非鍵/值數據無法排序。
但是,如果您確實在RDD中有一些排序的鍵/值數據,則收集將保留該順序。請注意,雖然collectAsMap()不會保留訂單。
map()返回非鍵/值數據,所以返回的RDD沒有排序。 flatMap()也是一樣。
怎麼樣mapToPair()和flatMapToPair。如果這些工作的RDD包含鍵/值數據,則沒有理由認爲輸出RDD的鍵是相同的,因此不能假定該順序被保留。我無法想象,在密鑰不變的情況下,這些方法已經實施以保持秩序。
mapValues()和flatMapValues()確實保留了輸入RDD的關鍵,因此可能會保留順序,但您必須自己調查。
至於zipWithIndex,根據這個:How Can I Obtain an Element Position in Spark's RDD?的RDD的排序是zipWithIndex作用於不保留
相關問題
- 1. 在鍵值對的RDD上應用ZipWithIndex
- 2. 排序由數組和保持秩序
- 3. SQL秩和分區
- 4. zipWithIndex與初始值RDD
- 5. 在返回RDD的函數上做flatmap
- 6. GridBagLayout不保持秩序
- 7. 無法在RDD上應用flatMap
- 8. 分組維持秩序
- 9. 做foreachRDD保持秩序閱讀一個分區的卡夫卡話題?
- 10. 矢量差異,同時保持秩序
- 11. RxJava2 map/flatMap with flatMapIterable
- 12. RDD分區
- 13. 保持跟蹤收集和新零件的舊部分
- 14. 模擬獨特的功能,保持秩序和重複的(MATLAB)
- 15. 斯卡拉集合分組,同時維持秩序
- 16. 在pyspark中收集帶有緩衝區的RDD
- 17. 保持收集訂購
- 18. Spark map和flatMap結果類型
- 19. 多RDD與分區?
- 20. zipWithIndex上MapPartitionsRDD
- 21. 如何在保持秩序的同時將幾個列表分開?
- 22. 加入的RDD上的隨機分區程序行爲
- 23. C++的std ::列表排序中保持秩序
- 24. 卡桑德拉秩序和聚集鍵
- 25. 變化秩序和保護類
- 26. Apache spark:我們如何將RDD [v]分成Map [k,RDD [v]]?
- 27. 如何在數組中插入一個值,保持秩序?
- 28. zipWithIndex
- 29. RDD分區火花Streaming
- 30. 星火多維RDD分區
我不認爲RDD的元素不斷訂購。除此之外,也許,如果你做了一個排序。 – philantrovert