2011-05-05 172 views
5

我正在創建一個實現內容過濾算法的簡單推薦系統。我需要用電影元數據來測試系統,但這非常困難。我知道IMDB,請問我如何獲取電影的標題,movieid,流派,關鍵字,情節,演員,國家,發佈日期,語言等元數據,並將其存儲爲我的應用程序使用的xml文件?有誰知道解決方案?謝謝。如何使用java從IMDB獲取電影元數據?

+0

參見http://stackoverflow.com/questions/1966503/does-imdb-提供-AN-API。 – 2014-03-21 17:34:07

回答

6

首先檢查他們的同意或授權 http://www.imdb.com/help/show_leaf?usedatasoftware

他們的數據可以在這裏找到 http://www.imdb.com/interfaces

+2

提及許可證+1。人們經常忘記這一點(通常是自願的)。 – 2011-05-05 13:58:32

+0

您是否知道通過XML/JSON而不是命令行與「接口」進行通信的方式? – sparkle 2012-11-30 23:37:45

+0

考慮到IMDB明確規定任何數據只能從FTP站點提供的純文本數據中獲取,我敢肯定,通過XML/JSON與他們的網站進行通信是非法的。 但是,這並不意味着它是不可能的。請參閱http://stackoverflow.com/questions/1966503/does-imdb-provide-an-api。 – 2014-03-21 17:32:15

0

可能你可以使用b elow輕量級免費的RESTful webservice。如果您需要,此服務將提供電影信息的xml/json響應。

http://www.freesoftapps.com/services/imdb/?title=shawshank%20redemption

你可以找到關於此link

新澤西Java客戶端代碼的詳細信息:

Client client = Client.create(); 
WebResource resource = client.resource(urlString); 
ClientResponse response = resource.accept("application/json").get(ClientResponse.class); 
String json = response.getEntity(String.class);