我有一個xlsx文件,其數據列數超過1000列。我想首先解析數據文件(可以包含數字和字母)的每一列,然後從解析的數據中創建一個唯一的列表。使用Pandas創建唯一列表
我是一個完整的noob &已經嘗試了「for」和「do while」循環,但都沒有爲我工作。
到目前爲止,我有:
import pandas as pd
workbook = pd.read_excel('C:\Python27\Scripts\Data.xlsx')
worksheet = workbook.sheetname='Data'
for col in range(worksheet[0], worksheet[1300]):
print(col)
我想我需要追加的數據,也許寫入一個文本文件,然後創建一個從文本文件中的唯一列表 - 我可以做的第二部分,它只是讓它進入我遇到麻煩的文本文件。
感謝
對不起,當你說每隔一列你是第二列還是每一列?你也想要一些全球列表或每列列表?你有沒有看過['unique'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html#pandas.Series.unique)? – EdChum
謝謝埃德,它是每個偶數列 - 0,2,4,6,8等,或者A,C,E,G,我一直到AWK。總共有1286列,所以我想列出643個列表,然後從列表中創建一個唯一列表。我一定會使用pandas.series.unique(),但我不確定如何將643列放入一個列表中。 –