使用負向索引和ix（）方法切片熊貓DataFrame

當使用負向索引時，DataFrame.ix（）似乎無法分割我想要的DataFrame。使用負向索引和ix（）方法切片熊貓DataFrame

我有一個DataFrame對象，並希望切片的最後2行。

In [90]: df = pd.DataFrame(np.random.randn(10, 4)) 

    In [91]: df 
    Out[91]: 
      0   1   2   3 
    0 1.985922 0.664665 -2.800102 1.695480 
    1 0.580509 0.782473 1.032970 1.559917 
    2 0.584387 1.798743 0.095950 0.071999 
    3 1.956221 0.075530 -0.391008 1.692585 
    4 -0.644979 -1.959265 0.749394 -0.437995 
    5 -1.204964 0.653912 -1.426602 2.409855 
    6 1.178886 2.177259 -0.165106 1.145952 
    7 1.410595 -0.761426 -1.280866 0.609122 
    8 0.110534 -0.234781 -0.819976 0.252080 
    9 1.798894 0.553394 -1.358335 1.278704

一種方式做到這一點：

In [92]: df[-2:] 
    Out[92]: 
       0   1   2   3 
    8 0.110534 -0.234781 -0.819976 0.252080 
    9 1.798894 0.553394 -1.358335 1.278704

花葯的方式來做到這一點：

In [93]: df.ix[len(df)-2:, :] 
    Out[93]: 
       0   1   2   3 
    8 0.110534 -0.234781 -0.819976 0.252080 
    9 1.798894 0.553394 -1.358335 1.278704

現在我想用負索引，但有問題：

In [94]: df.ix[-2:, :] 
    Out[94]: 
       0   1   2   3 
    0 1.985922 0.664665 -2.800102 1.695480 
    1 0.580509 0.782473 1.032970 1.559917 
    2 0.584387 1.798743 0.095950 0.071999 
    3 1.956221 0.075530 -0.391008 1.692585 
    4 -0.644979 -1.959265 0.749394 -0.437995 
    5 -1.204964 0.653912 -1.426602 2.409855 
    6 1.178886 2.177259 -0.165106 1.145952 
    7 1.410595 -0.761426 -1.280866 0.609122 
    8 0.110534 -0.234781 -0.819976 0.252080 
    9 1.798894 0.553394 -1.358335 1.278704

如何在DataFrame.i中使用負向索引x（）正確嗎？謝謝。

來源

2012-12-26 Julia He

ix的主要目的是允許numpy像索引支持行和列標籤。所以我不確定你的用例是否是預期的目的。這裏有一對夫婦的我能想到的，大多是瑣碎的方式：

In [142]: df.ix[:][-2:] 
Out[142]: 
      0   1   2   3 
8 0.386882 -0.836112 -0.108250 -0.433797 
9 0.642468 -0.399255 -0.911456 -0.497720 

In [161]: df.ix[df.index[-2:],:] 
Out[161]: 
      0   1   2   3 
8 0.386882 -0.836112 -0.108250 -0.433797 
9 0.642468 -0.399255 -0.911456 -0.497720

我不認爲ix支持負的索引都沒有。這似乎只是忽略它乾脆：

In [181]: df.ix[-100:,:] 
Out[181]: 
      0   1   2   3 
0 -1.144137 -1.042034 -2.158838 0.674055 
1 -0.424184 1.237318 -1.846130 0.575357 
2 -0.844974 -0.541060 2.197364 -0.031898 
3 0.846263 1.244450 -1.570566 -0.477919 
4 -0.193445 0.171045 -0.235587 -1.185583 
5 1.361539 -1.107389 -1.321081 -0.776407 
6 0.505907 -1.364414 -2.093770 0.144016 
7 -0.888465 -0.329153 0.491264 -0.363472 
8 0.386882 -0.836112 -0.108250 -0.433797 
9 0.642468 -0.399255 -0.911456 -0.497720

編輯：從pandas documentation我們：

基於標籤的整數分度軸標籤是一個棘手的話題。它已經在科學Python社區的郵件列表和各種成員中進行了大量討論。在熊貓中，我們的一般觀點是標籤比整數位置更重要。因此，對於整數軸索引，只有基於標籤的索引可以使用標準工具（如.ix）。下面的代碼將會產生一個異常：
s = Series(range(5)) 
s[-1] 
df = DataFrame(np.random.randn(5, 4)) 
df 
df.ix[-2:] 
這深思熟慮的決定是爲了避免歧義和微妙錯誤（許多用戶報告發現錯誤時，API更改了停止做基於位置索引「回落」）。

來源

2012-12-26 04:14:32 Zelazny7

這是一個錯誤：

In [1]: df = pd.DataFrame(np.random.randn(10, 4)) 

In [2]: df 
Out[2]: 
      0   1   2   3 
0 -3.100926 -0.580586 -1.216032 0.425951 
1 -0.264271 -1.091915 -0.602675 0.099971 
2 -0.846290 1.363663 -0.382874 0.065783 
3 -0.099879 -0.679027 -0.708940 0.138728 
4 -0.302597 0.753350 -0.112674 -1.253316 
5 -0.213237 -0.467802 0.037350 0.369167 
6 0.754915 -0.569134 -0.297824 -0.600527 
7 0.644742 0.038862 0.216869 0.294149 
8 0.101684 0.784329 0.218221 0.965897 
9 -1.482837 -1.325625 1.008795 -0.150439 

In [3]: df.ix[-2:] 
Out[3]: 
      0   1   2   3 
0 -3.100926 -0.580586 -1.216032 0.425951 
1 -0.264271 -1.091915 -0.602675 0.099971 
2 -0.846290 1.363663 -0.382874 0.065783 
3 -0.099879 -0.679027 -0.708940 0.138728 
4 -0.302597 0.753350 -0.112674 -1.253316 
5 -0.213237 -0.467802 0.037350 0.369167 
6 0.754915 -0.569134 -0.297824 -0.600527 
7 0.644742 0.038862 0.216869 0.294149 
8 0.101684 0.784329 0.218221 0.965897 
9 -1.482837 -1.325625 1.008795 -0.150439

https://github.com/pydata/pandas/issues/2600

注意df[-2:]將工作：

In [4]: df[-2:] 
Out[4]: 
      0   1   2   3 
8 0.101684 0.784329 0.218221 0.965897 
9 -1.482837 -1.325625 1.008795 -0.150439

來源

2012-12-27 00:12:26

感謝您的幫助。 –

使用負向索引和ix（）方法切片熊貓DataFrame

回答

相關問題