2012-07-10 80 views
0

我抓住從一個網站的頁面數據(其中生成,並且我沒有控制權)的頁面,我最關心的是該部分的頭部像如下Android - HTML解析與JavaScript - 什麼是有效的方法?

<script type="text/javascript"> 
Item.id  = '11457'; 
Item.comments = [{"score":9,"comment_id":291622,"comment":"For RDM this offers the most haste for the feet, beating the haste+3 from dusk+1.","date_posted":"2011-09-22 08:37:19","char_id":724996,"deleted":0,"type":"item","user_char_id":91314,"avatar":"724996_N9Bdg4hpuP.jpg","user_id":54878,"char_name":"Moogleking","server_name":"Shiva","rating":null,"ident_id":96474,"reports":null,"dismiss":null}, ...] 

和其他雜項。信息由它們的跨度ID標識。

我只是想知道在Android編程中收集數據的正確/有效的方法是什麼?是解析DOM中的HTML?它堅持到WebView/JavaScript界面​​嗎?

+0

你想從android應用程序刮一些HTML頁面? – 2012-07-10 18:30:31

+0

爲什麼不簡單地使用正則表達式匹配? – Amit 2012-07-10 18:42:12

回答

0

http://htmlcleaner.sourceforge.net/

它分析的是有一個XML格式(HTML,XML,XSLT)的一切,是開源的,速度快,非常輕巧。它可能沒有文檔,但對網絡的支持非常詳細。

從我的經驗加載WebView非常緩慢,所以我不會建議這樣的事情。

+0

我會毫不猶豫地看看。我的一位朋友還建議[此項目](http://loopj.com/android-async-http/)作爲資源。 – Kigen 2012-07-11 19:53:54

+0

這對於HTML方法來說效率更高,因爲它具有「get」和「post」的特殊方法,並且它在異步線程中執行。另一方面,htmlcleaner支持get和post調用,但它對每個XML類型文件(包括HTML)都起着基本的魅力作用。它也支持非常有用的XPath語法。 – 10s 2012-07-11 20:12:05