dask csv閱讀順序

2016-11-29 78 views 2 likes

我有一個時間系列，其值存儲在不同的csv中。每個csv都進行排序幷包含一個時間掃描的可變秒數。dask csv閱讀順序

df = dd.read_csv('/home/data/derived/ips_subnets.7days/*') 
df.head() 

      seconds    IP  subnet 
    0 1477252800 Private-10.0.0.0 10.101.15.6 
    1 1477252800 Private-10.0.0.0 10.102.223.2 
    2 1477252800 Private-10.0.0.0 10.104.15.43 
    3 1477252800 Private-10.0.0.0 10.104.5.241 
    4 1477252800 Private-10.0.0.0 10.106.15.26

現在，我怎麼設置的CSV文件應以根據變量seconds讀？

來源

2016-11-29 Donbeo

回答

默認dask.dataframe.read_csv按字母順序讀取文件，所以如果您的文件名遵循標準命名方案，如2016-05-06.csv那麼您應該沒問題。

如果你願意，你可以用dask.delayed進行定製。這裏是一個類似的example notebook。

最後您總是可以打電話df = df.set_index('seconds')，但是這比替代方案慢得多，並且需要對數據進行全面掃描。

來源

2016-12-03 14:07:50 MRocklin

相關問題

1. 爲什麼Dask沒有閱讀CSV？
2. 閱讀XML與閱讀CSV文件java
3. 按順序閱讀行，但按需閱讀
4. 屏幕閱讀器的HTML表格閱讀順序
5. CSV閱讀爲空
6. 閱讀Csv到namedtuple
7. 閱讀csv Oldb c＃
8. 閱讀分號csv
9. Dask讀取CSV，將分區設置爲CSV長度
10. mtl，閱讀器，除了＆堆疊順序
11. 如何閱讀hadoop順序文件？
12. 熊貓閱讀.csv文件
13. 的iOS閱讀csv文件
14. 閱讀CSV與unicodecsv：UnicodeDecodeError錯誤
15. 閱讀大型CSV文件
16. 閱讀csv文件c＃
17. 閱讀csv，然後列舉
18. 閱讀大型csv文件
19. 閱讀的CSV的蟒蛇
20. 閱讀CSV文件WinPython
21. 問題閱讀csv文件
22. 閱讀並同csv文件
23. 閱讀CSV每個標籤
24. Python UTF-16 CSV閱讀器
25. 列名（LINQ CSV閱讀器）
26. 閱讀的CSV結構
27. 如何閱讀.csv文件？
28. CSV閱讀器或閱讀Android的CSV文件，而無需使用庫
29. DASK：外部聯接從多個CSV文件中讀取
30. Objective-c：閱讀plist並按輸入順序排序