我有兩個excel文件。兩個文件也有大約20萬行。 (I給出在實施例只是六行。)Python中的匹配
file1.xlsx
M1 M2 M3 M4
97.1859 -59.1873 0.000912 4.55
63.116 -75.958 0.003797 20.85
112.09 -22.9276 0.005008 2.26
320.7931 -63.4153 0.008382 7.45
337.8978 -72.8617 0.009965 3.88
99.2183 -56.5418 0.018141 18.17
file2.xlsx
N1 N2 N3 N4 N5 N6
0.057 4 Im 6.61 0.005008 38.85929
0.065 36 Im 9.27 0.003797 -19.4988
0.062 68 Im 8.06 0.008382 -51.8935
0.066 46 Im 8.55 0.009965 -40.5912
Im 9.1 0.000912 1.089013
0.075 32 Im 12.31 0.018141 3.946489
M3(file1中)和N5(file2中)列是相同的。
根據M3-N5列,我想匹配這兩個文件並在Python中創建第三個文件(輸出文件)。
output.xlsx
M1 M2 M3-N5 M4 N1 N2 N3 N4 N5
97.1859 -59.1873 0.000912 4.55 Im 9.1 1.089013
63.116 -75.958 0.003797 20.85 0.065 36 Im 9.27 -19.4988
112.09 -22.9276 0.005008 2.26 0.057 4 Im 6.61 38.85929
320.7931 -63.4153 0.008382 7.45 0.062 68 Im 8.06 -51.8935
337.8978 -72.8617 0.009965 3.88 0.066 46 Im 8.55 -40.5912
99.2183 -56.5418 0.018141 18.17 0.075 32 Im 12.31 3.946489
我做了一個程序叫TOPCAT但我想的Python爲做對比。不過,我已經開始使用新的Python,所以我不能寫出詳細的代碼。
我該怎麼做?我可以通過哪些代碼?
任何幫助或建議將不勝感激。
謝謝。
感謝提供輸入並輸出數據。它使你的問題非常清楚。爲了幫助你,我們也理想的需要看到你已經嘗試了什麼,以及你在哪裏被困住。不過,我的建議是不要使用Python,而只是將其導入數據庫(例如,sqlite,mysql,postgresql),並通過查詢連接兩個表來獲得輸出結果。我不知道如果你嘗試加入花車會發生什麼 - 如果你看,可能會有一個簡單的方法。 – YXD
如果你必須在Python中做到這一點,你應該看看[pandas](http://pandas.pydata.org/)庫。 – YXD