我有一個包含51,347行的數據集。當使用熊貓導入數據並將分隔符設置爲「|」 ,我輸了394排。使用分隔符導入時,大熊貓缺少行=「|」
import pandas as pd
df = pd.read_csv("Basin11.txt", sep='|', error_bad_lines=False,
dtype={'Start Date': str, 'Greater Than/Less Than': str,
'Parameter Code': float, 'Start Time': str, 'Start Depth': float, 'Composite Category': str,
'Composite Type': str})
print(len(df.index))
如果刪除在SEP變量,數據將不加載爲多個列,但將加載的行的適當數量。它似乎只是這個文件的一個問題。 Basin11.txt File
有誰知道我爲什麼會丟失數據?
我會想象大約394行有「自由」的文字列正在翻譯|翻譯|翻譯,而error_bad_lines = False默默地忽略那些行 – Boud
我試過刪除error_bad_lines = False,但它對長度沒有影響。除了sep ='|'之外,我們單獨刪除了每個參數,但沒有任何效果。 – Will