0
A
回答
1
如果它是隨機的,您可以使用sample這種方法可以讓您花費DataFrame
的一小部分。但是,如果您的想法是將您的數據分爲training
和validation
,則可以使用randomSplit。
是那麼優雅的另一種選擇是將您的DataFrame
爲RDD
和使用zipWithIndex和過濾通過index
,也許是這樣的:
df.rdd.zipWithIndex().filter(lambda x: x[-1] % 20 != 0)
+0
嗨阿爾貝託會嘗試。我的目標是模擬丟失的數據,以便我可以看到分類器在數據丟失幾秒鐘後如何在流數據上執行。 – other15
相關問題
- 1. 隨機放置按鈕
- 2. Spark DataFrame - 選擇n個隨機行
- 3. 如何隨機放置UIButton和值
- 4. CSS隨機div放置和響應
- 5. 隨機放置1的C++數組
- 6. 的boost ::精神 - 從隨機放置項
- 7. 將UIButton隨機放置在視圖上
- 8. 戰艦遊戲 - 隨機放置船
- 9. 在pygame中隨機放置圖片
- 10. 隨機放置svg多邊形
- 11. Java - 對象的隨機放置
- 12. 用Actionscript隨機放置xml節點
- 13. Android RecycleView隨機放置物品
- 14. 在行之間隨機播放一列
- 15. 以隨機順序放置txt文件的行。
- 16. YouTube播放列表 - 隨機播放/隨機函數
- 17. 隨機位置
- 18. 如何使用Spark Dstreams進行簡單的隨機採樣?(pyspark使用spark 1.6.1)
- 19. 隨機位置不是隨機的[vb.net]
- 20. 在自動播放和隨機播放中設置Speakker?
- 21. 隨機播放元素
- 22. 播放隨機聲音onTouch
- 23. HTML5音頻隨機播放
- 24. PHP隨機播放功能
- 25. 使用IComparer隨機播放
- 26. mysql隨機行
- 27. 如何設置iMacros隨機運行?
- 28. CAReplicatorLayer隨機位置
- 29. 隨機動畫在Flash中的放置位置
- 30. 在Spark中放置什麼SetPageBaseType設置
每n行不*隨機*。 – Emre
那麼如果n是一個隨機數。 – other15