我有一種類似於SQL搜索的任務。我有包含以下一維數組(約1百萬個元素)通過ID1
標識的「表」:匹配兩個numpy數組以找到相同的元素
ID1, z, e, PA, n
另一個「表」,其中包含由ID2
確定了以下一維數組(約1.5百萬個元素):
ID2, RA, DEC
我想匹配ID1
和ID2
找到常見的形成含有ID, z, e, PA, n, RA, DEC
另一個「表」。 ID1
中的大多數元素可以在ID2
中找到,但不是全部,否則我可以使用numpy.in1d(ID1,ID2)
來完成它。任何人都可以快速完成這項任務?
例如:
ID1, z, e, PA, n
101, 1.0, 1.2, 1.5, 1.8
104, 1.5, 1.8, 2.2, 3.1
105, 1.4, 2.0, 3.3, 2.8
ID2, RA, DEC
101, 4.5, 10.5
107, 90.1, 55.5
102, 30.5, 3.3
103, 60.1, 40.6
104, 10.8, 5.6
輸出應該
ID, z, e, PA, n, RA, DEC
101, 1.0, 1.2, 1.5, 1.8, 4.5, 10.5
104, 1.5, 1.8, 2.2, 3.1, 10.8, 5.6
添加一個可運行的樣本和預期的o/p? – Divakar
熊貓是合併/加入數據集的合適位置:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.merge.html – cel