2012-03-23 67 views
0

我想閱讀Android手機上的網頁,並在下面有代碼示例。但通過此代碼,我可以獲取網頁上的所有項目。但我只想在網頁上獲得文章。我不想讓他們與Html標籤。我怎樣才能在網頁上收到文章?在沒有html標籤的情況下閱讀Android手機上的網頁

import java.net.*; 
import java.io.*; 

public class URLReader { 
    public static void main(String[] args) throws Exception { 

     URL oracle = new URL("http://www.oracle.com/"); 
     BufferedReader in = new BufferedReader(
     new InputStreamReader(oracle.openStream())); 

     String inputLine; 
     while ((inputLine = in.readLine()) != null) 
      System.out.println(inputLine); 
     in.close(); 
    } 
} 

回答

0

除非你要查詢的文章的網站只包含文本內容(也許在一個RSS feed的形式),你能做的最好的是獲得完整的HTML和文本,然後嘗試剝離出HTML標籤。這是相當不可靠的,因爲很少有完整的證明解決方案來解析字符串中的HTML。

試試這個:Remove HTML tags from a String

相關問題