我正在使用csv
表單(movielens latest-small dataset)中的兩個數據集。以下是兩者的領域。Excel - 將兩個csv文件合併爲一個具有公共列的文件
rating.csv
user_id movie_id rating
movie.csv
movie_id movie_name
我要的是將其與以下領域
user_id movie_id movie_name rating
合併成一個單一的.csv從而使公用列movie_id
映射與相應的movie_name
。
這可以使用Excel來完成嗎?如果不是,我該怎麼做?
我只是需要它作爲我的推薦器引擎的數據集,所以任何簡單的解決方案都是值得歡迎的,因爲最終結果就是最重要的。但是由於我在java中有一些經驗,所以對我來說很容易理解和實現。
如果有某種方式使用Excel,那麼這將是最好的。我嘗試在網上搜索,發現一些VLOOKUP
方法,但無法清楚地得到它。
此外,我嘗試了一些在線合併工具,但他們只是附加一張紙,一張接着一張沒有映射列。所以我也沒有問題使用在線工具。
因爲是代表你的問題是有點「過於寬泛」 - 你可以請更新你的問題,以表明*你是如何做到這一點合併例如在Excel中使用公式;與VBA;與其他語言/框架? –
那麼你的推薦引擎是用Java編寫的嗎?如果您要使用.Net,則可以使用LINQ運行將它們結合使用的查詢,並在內存中使用該數據集。雖然我不確定Java的等價物。 –
是的,它在java中。但是奇怪的是,使用Excel或在線工具無法做到這一點。我認爲這是一個不需要任何腳本的例行操作。可以結合兩個csv如此複雜嗎? – techvigil