我試圖從dfA
中刪除dfB
中的項目。熊貓將列轉換爲整數不起作用
事情是dfA
是在對象類型,所以我想轉換爲int。 下面是代碼:
dfA = pd.read_excel('small_file.xlsx',header=None)
dfB = pd.read_csv('large_file.csv',header=None)
dfA = dfA.convert_objects(convert_numeric=True)
dfA[0] = pd.to_numeric(dfA[0],errors='coerce')
dfA = dfA.dropna()
# converting to int
dfA[0] = dfA[0].astype(int) # THIS line gets error
df_output = dfA[~dfA[0].isin(dfB[0])]
這裏是DFA看起來像
0
0 2293365227
1 3045897298
2 8162414592
3 9312969810
... ...
和DFB
0
0 2030000000
1 2030156119
2 2030389149
... ...
我得到這個錯誤:
ValueError: invalid literal for long() with base 10: 'Goulding'