我有一個獨特的問題,我需要拉特定屬性爲每個被每5分鐘出場的比賽中,兩個主要的問題我已經是:從網站措詞棒球成績表
- 分句數據以交互方式顯示它,即MLB.com,ESPN,CBS Sports。
- 找到一個可能會顯示實時更新並以文本格式更新的盒子分數的源代碼。
我已經做了大量的谷歌搜索,以及尋找可能的解決方案來刮取MLB和CBS Sports的數據。我沒有這樣的運氣,現在有點困難,因爲我沒有任何新的數據可以玩,但是我一直在尋找可能的解決方案,並且沒有得到任何解決方案。
據我所知,沒有一個開放的數據庫,我可以查詢包含實時更新分數,否則我可以捎帶或獲得類似的系統。
如果有一個服務,存儲的數據我敢肯定,他們會收取$$$的。至於抓取網站,並不是一種真正的通用方式,至少我知道,只能打一個網址並知道要提取什麼數據。您需要下載html並使用正則表達式或其他方法來查找數據。另外,如果網站的變化甚微,您必須修復並重建。 – user1231231412 2011-12-17 02:33:23