2011-12-17 51 views
1

我有一個獨特的問題,我需要拉特定屬性爲每個被每5分鐘出場的比賽中,兩個主要的問題我已經是:從網站措詞棒球成績表

  1. 分句數據以交互方式顯示它,即MLB.com,ESPN,CBS Sports。
  2. 找到一個可能會顯示實時更新並以文本格式更新的盒子分數的源代碼。

我已經做了大量的谷歌搜索,以及尋找可能的解決方案來刮取MLB和CBS Sports的數據。我沒有這樣的運氣,現在有點困難,因爲我沒有任何新的數據可以玩,但是我一直在尋找可能的解決方案,並且沒有得到任何解決方案。

據我所知,沒有一個開放的數據庫,我可以查詢包含實時更新分數,否則我可以捎帶或獲得類似的系統。

+0

如果有一個服務,存儲的數據我敢肯定,他們會收取$$$的。至於抓取網站,並不是一種真正的通用方式,至少我知道,只能打一個網址並知道要提取什麼數據。您需要下載html並使用正則表達式或其他方法來查找數據。另外,如果網站的變化甚微,您必須修復並重建。 – user1231231412 2011-12-17 02:33:23

回答

1

查看另一個網站上的這個論壇問題。看起來有幾個可以讓你獲得csv的數據。不知道它有多少可以自動化。

http://ask.metafilter.com/120399/MLB-API

另一個是http://www.baseball-reference.com/我不知道如果他們這樣做成績表,但他們對所有的玩家,遊戲等統計數據,他們可能有一些你可以用爲好。

最後,你可以檢查出http://www.strat-o-matic.com/他們可能有東西或願意爲你創建一個API。

0

如果你在雅虎注意到,他們從STATS LLC得到他們的統計。我不知道它的成本,但你應該檢查他們的real-time數據傳輸服務。

0

刮MLB遊戲服務器。它在遊戲中實時更新。如果你想要boxscore,刮boxscore.xml(例如)