問題我用以下方式以CSV 120000行:重新排序重複的聯繫人。與名單
ID Duplicate
1 65
2 67
4 12
4 53
4 101
12 4
12 53
101 ...
這份名單基本上指定了許多用戶ID的,哪些是該用戶的重複用戶。如何由該列表現在我真的不能在Excel中篩選了這一點,所以我想用這個結果來改造列表:
[1, 65]
[2, 67]
[4, 12, 53, 101]
之後我就可以寫入到一個新的CSV只刪除列表[ 0],這樣我就可以爲每個「重複的用戶塊」保留一個用戶。在Excel中,我會刪除所有剩餘的用戶ID。
但是來到這一點,我有幾個問題:
import csv
with open("contacts.csv", "rt") as f:
reader = csv.reader(f, delimiter="\t")
contacts = []
for row in reader:
if row[0] not in contacts:
contacts.append(row[0])
if row[1] not in contacts:
position = contacts.index(row[0])
contacts[position].append(row[1])
當然我得到的錯誤「AttributeError的:‘海峽’對象有沒有屬性‘追加’」聯繫人[位置]是一個串。但是,如何更改代碼,以便獲取每個重複聯繫人塊的列表?
謝謝!
爲什麼** 101 **在輸出中不遵循** 53 **? –
是第一列排序? – Gribouillis
你是對的,編輯它。是的,第一列是排序 – user2252633