1
我嘗試讀取從多個網站RSS源,但在陌生的路上一些這方面暴露你的服務(RSS),這樣的樣本:閱讀內屬性/標籤RSS項目
<item>
<title>"2012 Minutos a Nadar" em Guimarães</title>
<link>http://www.rtp.pt/noticias/index.php?article=534537&tm=3&layout=123&visual=61</link>
<description>
<![CDATA[
<img src="http://img0.rtp.pt/icm/thumb/phpThumb.php?src=/noticias/images/40/4031dece9b6d9384a6a021244cb0a36d&w=620&sx=0&sy=10&sw=560&sh=307&q=75&w=115"/>
Esta noite as piscinas municipais de Guimarães não vão encerrar. Vão ser 2012 minutos a nadar
sem paragens nem interrupções. Começou às 9 e meia da manhã e segue até ao final de domingo
Um encontro desportivo no âmbito da Capital Europeia da Cultura. A ideia passa pela festa da natação com cada um a nadar o que puder num máximo de 200 metros. As inscrições estão permanentemente a decorrer.
]]>
</description>
<guid>http://www.rtp.pt/noticias/index.php?article=534537&tm=3&layout=123&visual=61</guid>
<author>[email protected]</author>
<category>Desporto</category>
<category>Cultura</category>
<category>País</category>
<pubDate>Sat, 10 Mar 2012 16:42:02</pubDate>
</item>
這是我有可能得到descritpiton標籤上的'img'?!或者從descrition標籤中排除這個屬性!?!?
或者此示例中:
<description><![CDATA[<p></p>]]>O militar norte-americano suspeito de ter matado 16 civis afegãos no domingo será julgado pela justiça militar dos Estados Unidos, anunciou esta segunda-feira o Pentágono./description>
它可能刪除HTML標記從描述 '
'?在此先感謝
解析此問題的最佳方法是什麼?像字符串一樣閱讀本節!謝謝 – mastervv 2012-03-13 17:30:40
有幾種方法。如果我不關心準確性,只關心獲取圖像URL,我可能會選擇正則表達式。或者,您可以將其封裝在一些HTML中,然後嘗試將其解析爲HTML DOM,然後掃描圖像。 – 2012-03-13 23:49:05