0
這裏的數據幀:如何刪除每個組的記錄數低於閾值?
id | sector | balance
---------------------------
1 | restaurant | 20000
2 | restaurant | 20000
3 | auto | 10000
4 | auto | 10000
5 | auto | 10000
如何找到每個sector
類型的計數和下面具體LIMIT
sector
型計數刪除記錄?
以下:
dataFrame.groupBy(columnName).count()
給了我一個值出現在該欄中的次數。
如何使用DataFrame API在Spark和Scala中執行此操作?