我有一個csv文件,我想用Python中的Pandas庫讀取它。讀取Pandas和/或Tableau中的CSV文件並使用不同行大小
在本表中,當我們遇到一個新項目時(例如下面例子中的項目編號爲1393或1654),我們首先有一個4列的行元數據,之後有幾百列行作爲與該項目相關的實際數據。然後再次發生下一個項目等等。
表是這樣的:
1,1393,0,0
1,1393,1,22,55,63,...
1,1393,5,32,43,163,...
.
.
.
2,1654,0,0
2,1654,8,95,96,142,...
2,1654,21,31,364,9,...
.
.
.
所以問題是:
- 某些行有不同的大小比其他
- 我們沒有頭,不能創建它的第一行有4個條目,第二個有100個條目
- 我的CSV文件很大(大約10G)!
任何有助於我在Pandas或任何其他Python庫中組織數據的建議值得高度讚賞。
PS:順便說一句,任何人都知道如何在Tableau中管理它?
要得到這個直...你有2行大小 - 4列元數據和其他所有其他都是固定大小> 100?你想用元數據做什麼?將它添加到列中或放下它? – tdelaney
您可以創建csv.reader的子類並覆蓋下一個方法,以便所有行具有相同數量的列。 –
@tdelaney是的,我想放棄它們。 – DanielWelke