2010-05-20 63 views
1

我想作爲一個新手程序員知道什麼好處是使用谷歌搜索API或最新的buzz API來收集數據內容而不是屏幕抓取;顯然除法律方面外。搜索API與屏幕抓取

回答

1

API比屏幕布局更不可能改變。

+0

謝謝您的回覆。當你說改變時,你是什麼意思? 從我讀過的內容中我將需要獲得一個帳戶;然後創建一些訪問API的腳本,由於Google Buzz API文檔沒有多大幫助,我仍然不清楚該如何操作,並創建查詢將其發佈到API。我回來的結果是我通常在手動搜索屏幕上看到的結果嗎?所以我能夠讓腳本定期運行這些查詢? – vbNewbie 2010-05-20 18:52:08

+0

他意味着Google Buzz的頁面佈局(只是一個示例)可以被修改,以便您的scraper不起作用。 但是,API通常是保持機智的,因爲它們被程序員用來與服務交互,並且它們不會破壞所有先前存在的應用程序。 – 2010-05-20 18:58:13

+0

謝謝精度。是否只能使用java代碼訪問google API,以及如何訪問例如Google Buzz API。如果這是網站地址http://code.google.com/apis/buzz/我如何從代碼訪問此網站,並且我沒有網站 – vbNewbie 2010-05-20 19:07:14

1

屏幕抓取的一大缺點是屏幕可以改變和打破你的刮板。因此,您最終必須不斷調整代碼以匹配他們的代碼,並且由於您不提前知道更改,因此會導致停機/中斷。
此外,你可能違反了他們的服務條款,他們不會喜歡它。如果您爲您的服務付費客戶,您可以很快找到自己處於困境和困境之中。 另外,如果您模擬了很多用戶,則會在服務器上產生意料之外的拖動。因此,使用發佈的/允許的API對於您和爲網站提供源材料的網站會更加高效。

+0

因此,如果我的理解正確,訪問谷歌API只涉及有一個谷歌帳戶,這些天他們驗證通過發送代碼到手機。 API服務是否返回與正常搜索相同數量的結果? 1000? – vbNewbie 2010-05-20 18:56:14