2016-02-29 166 views
0

我的數據框有一個名爲dir的列,它有幾個值,我想知道有多少值通過某個點。例如:熊貓:選擇大於值

df['dir'].value_counts().sort_index() 

它返回一個Series

0  855 
20  881 
40  2786 
70  3777 
90  3964 
100  4 
110 2115 
130 3040 
140  1 
160 1697 
180 1734 
190  3 
200  618 
210  3 
220 1451 
250  895 
270 2167 
280  1 
290 1643 
300  1 
310 1894 
330  1 
340  965 
350  1 
Name: dir, dtype: int64 

在這裏,我想知道通過500在這種情況下,值的數量,這一切都只是100,140,190210,280300330350。

我該怎麼做?

我可以逃脫df['dir'].value_counts()[df['dir'].value_counts() > 500]

回答

1
(df['dir'].value_counts() > 500).sum() 

這得到了價值數和返回他們爲一系列真值。這些parens把這件事看作一系列的東西。 .sum()將True值計爲1,將False值計爲0.