2016-06-09 56 views
1

我一直在這個工作了幾個小時,並在這一點上放棄。我有一個科學的工具,輕微毛刺和創建數據點與無序的.csv數據庫,即pandas插件爲蟒蛇環境不排序?

Test_ID Data_Point Test_Time Step_Time etc... 

1 1439 1441.044976 1328.572329 
1 1440 1442.046983 1329.574335 
1 1121 1122.423305 1009.950658 
1 1122 1123.424295 1010.951648 

注意將數據從1440回到1121如何跳過如果備份.csv文件跟蹤你在1120之後,找到約40行的一段,失蹤。這是一個大約125k行的大數據文件。

我在冠層環境中使用python安裝了熊貓。我試圖在Data_Point上對數據庫進行排序(因爲我認爲它會是最簡單的,您可以基於測試或步驟時間來完成),從而保持行不受影響。這裏是我試過的代碼:

import pandas as pd 
import numpy 
from pylab import plt, plot, legend, show 

df = pd.read_csv("C:\ArbinData\PanCell3_Cycling_0-30.csv") 
df2 = df.sort_values('Data_Point', ascending = 0) 

for x in range(1, len(df2['Data_Point']): 
    #Do science. 

感謝您的任何幫助,我在這個問題上精力充沛。

回答

1

您錯誤地使用了sort_values。參數ascending的參數必須是布爾(True/False)而不是二進制(1/0)值。

它應該是:

df2 = df.sort_values(by=['Data_Point'], ascending=False) 

這降序排序的值。


較新的語法從v0.17.0開始支持整數1/0的使用分別描繪布爾True/False值。

df2 = df.sort_values(by=['Data_Point'], ascending=0) 

可以甚至通過元件的listascending關鍵字參數,其長度對應於傳遞到by關鍵字參數的項目數。