我有一些麻煩,比較在路兩個dataframes我想:比較dataframes的某些列的交叉點大小不同
df1=pd.DataFrame({"code1": ['A', 'B', 'C', 'C','D'],
"code2": ["1", "0", "1", "1","1"],
"column1":['value1','value2','value3','value4','value5']})
code1 code2 column1
0 A 1 value1
1 B 0 value2
2 C 1 value3
3 C 1 value4
4 D 1 value5
df2 = pd.DataFrame({"code1": ['A','B','C'],
"code2": ["0", "0", "1"],
"column2":['valuex','valuey','valuez']})
code1 code2 column2
0 A 0 valuex
1 B 0 valuey
2 C 1 valuez
這是兩個數據框,我想比較。我需要做的是這樣
df1[['code1','code2']].isin(df2[['code1','code2']])
與得到結果的目的:
code1 code2 column1
0 B 0 value2
1 C 1 value3
2 C 1 value4
我想保留具有相同的「代碼1」和兩個DF1和DF2「代碼2」的行, df1的其他列。 你知道最好的辦法嗎?我想避免循環,我需要它是有效的。 非常感謝你提前
好的謝謝!如果我想保留在另一個數據框中刪除的情況呢? –
@ emilio.molina,請參閱UPDATE – MaxU
完美,非常感謝!所以'指標'是決定你保存哪部分數據幀的參數,不是嗎? –