我有一個有7列的熊貓數據框。對於其中的一列,我想將其內容劃分爲僅取決於值的n桶。所以,如果我的專欄的值爲1, 3, 5 ... (2*n+1)
,我添加了一個新的專欄作爲1,2,3...n
。將大熊貓數據框列分成n個桶
另外,我並不想正常化,即使我在列中有100個3,我希望他們在同一個桶中。所以,如果我有1, 3, 3, 3, 5, ... (2*n+1)
,我的輸出將是1, 2, 2, 2, 3, .. n
。
有人可以請指導我如何做到這一點。
- 編輯 -
我的實際數據有超過一百萬行。所以,如果我使用排名,我會得到1到100萬的排名。我想要的是將隊伍分成桶。舉個例子,如果我有300萬行,最後會有1到150萬的行列。如果我想把它分成3個桶,那麼先得到第一桶50萬桶,下一桶50桶,等等。同樣如果我想將它分成7個桶。
問候
對不起,對我來說這是一個有點不清楚。你可以添加所需輸出的另一個樣本? – jezrael
@jezrael,當然。所以如果輸入欄是'1,5,3,9,5,3,7,10',那麼輸出欄應該有'1,3,2,5,3,2,4,6'作爲輸出 – nimbus3000