2011-02-16 42 views
0

我正在編寫一個應用程序,並且需要能夠從被某人推送的已知網頁抓取圖像。 啾啾的鏈路是plixi.com鏈路....Iphone cocoa touch - 如何從網頁中獲取未知網址的圖像

例如.... 啾啾: http://plixi.com/p/77873522

是網頁與圖像的用戶上載,圖像的網址顯示是... http://c0013649.cdn1.cloudfiles.rackspacecloud.com/x2_4a44172

很明顯,我們不知道圖像的網址是什麼,並且需要從原始頁面(http://plixi.com/p/77873522)中提取。 因此,不知何故需要連接到網頁,並掃描它的網址可能包含「cloudfiles.rackspacecloud」?然而,也許不是因爲有幾張圖片(如右上角的縮略圖中包含此圖片) 雖然我們知道圖像總是最大的,或者是在頁面的某個框架中?

有一件事可能或不可能幫助的是,圖像將始終來自同一個plixi帳戶。

我們將如何去掃描頁面的內容以獲得這樣的網址並獲取特定圖像?

回答

0

你必須保存整個頁面並用你自己的解析器解析它(例如使用正則表達式)。這種方法對於簡單的任務很快,但通常很糟糕。如果您需要從網頁中獲取大量不同的信息,您最好使用理解DOM的解析器。

看看這個問題parsing HTML on the iPhone 這是你的任務所需要的。 您可以使用Firefox Firebug擴展爲您的圖像尋找XPATH

0

如果不知道iphone開發的任何細節,大多數其他人會用DOM解析器挑選頁面的HTML,在父元素中查找任何識別標記有問題的照片,並用它來確定網站輸出的頁面的位置。然後稍後使用這些相同的識別標記在網站的任何其他頁面上定位圖像。

Firebug聲稱查找該照片的XPath是//*[@id="photo"]。也許這也適用於其他圖片頁面。