2017-07-19 48 views
2

可能有很多不重要的邊緣情況和數據噪音。我希望得到一個餅圖(基於背景虛化或任何其他開源,免費的情節庫),將允許看到這樣的數據:一個聰明的方式來擺脫Pandas或PieChart的可視化引擎中的微不足道的數據?

type size 
S 1 
V 2 
T 200 
... 
Z 3333 

減少到其核心,有顯着性(< 1%類型尺寸)噪音投入新的「其他」類型。

1)大熊貓可以自己做嗎?怎麼樣? 2)是否有一些可視化已經與這種功能集成?

回答

2

考慮大熊貓系列a與值

import pandas as pd 
import numpy as np 
from string import ascii_uppercase 

np.random.seed([3,1415]) 
types = np.random.permutation(list(ascii_uppercase)) 
r = np.arange(1, 27) 
r = r/r.sum() 
s = np.random.choice(types, 10000, p=r) 

a = pd.value_counts(s) 

a.plot.pie(colormap='jet'); 

enter image description here


現在組的所有組與表示小於3%的計數爲一組other

n = a/a.sum() 

f = n < .03 

a[~f].append(pd.Series(a[f].sum(), ['other'])).plot.pie(colormap='jet') 

enter image description here

相關問題