1
我創建一個df=dask.DataFrame.read_csv('s3://bucket/*.csv')
數據幀。當我執行一個df[df.a.isnull()].compute
操作時,我得到一組符合過濾標準的行。我想知道這些返回的行屬於哪些文件,以便我可以調查爲什麼這些記錄具有空值。該DataFrame
具有數十億行和記錄與遺漏值都在個位數。有沒有一種有效的方式來做到這一點?如何映射`dask.DataFrame`的結果的CSV
作品,謝謝! –