我正在使用csv.reader和pandas導入一個csv文件。但是,來自同一文件的行數是不同的。csv.reader和pandas的區別 - python
reviews = []
openfile = open("reviews.csv", 'rb')
r = csv.reader(openfile)
for i in r:
reviews.append(i)
openfile.close()
print len(reviews)
結果是10,000(這是正確的值)。然而,熊貓回報不同的價值。
df = pd.read_csv("reviews.csv", header=None)
df.info()
這將返回9,985
有誰知道爲什麼會出現導入數據的兩種方法之間的區別?
我只是嘗試這樣做:
reviews_df = pd.DataFrame(reviews)
reviews_df.info()
這將返回10,000。
我無法重現此問題。當我在'csv'文件上運行這段代碼時,差異只有一行,那就是'header' –
你能給我們一個小樣本輸入文件來證明這個問題嗎?這應該是可能的,如果你第一次找出*哪些*行丟失。 –
這應該是。我從來沒有見過這個問題。 – kevin