我只是想把那些標籤拿出來。 Hrpicot.XML有這個方法嗎?如何從使用Hpricot的XML文本中刪除<![CDATA[ ]]>標籤?
4
A
回答
6
使用element.inner_text代替#inner_html並刪除他們爲你
2
doc.search("*") do |element|
element.swap element.content if element.kind_of? Hpricot::CData
end
1
doc = Hpricot::XML(open('http://www.cnn.com/.element/ssi/www/auto/2.0/video/xml/most_popular.xml'))
(doc/:cnn_video/:video).each do |status|
['tease_txt'].each do |el|
puts "#{status.at(el).inner_text}"
end
end
輸出示例(貌似垃圾,但這不是垃圾郵件!):
新裏諾空氣碰撞視頻顯示影響
青少年捕獲800磅重的鱷魚
恢復職業發佈'別問'廢止
名令人毛骨悚然裙偷窺者
巴士大小的衛星撞擊地球THI ...
「DWTS」投命中舞廳首次
在什麼造成的海洋世界教練的死亡?
是什麼導致特洛伊戴維斯寬大否認?
相關問題
- 1. 如何使用Hpricot使用<br />標籤從網頁中提取文本?
- 2. 刪除<![CDATA [標籤從xml webserivce響應
- 3. Howto刪除CDATA元素中的HTML <a>標籤
- 4. <![CDATA[]>在XML標記
- 5. 如何刪除``<![CDATA [`和結束`//]]>?
- 6. 如何刪除XML :: Simple輸出中的<opt>標籤?
- 7. 如何刪除XElement的CDATA標籤?
- 8. 如何從<content:encoded>標籤中的XML獲取2個CDATA值?
- 9. 如何從文本中移除<a>標籤?
- 10. 如何使用jSoup從<%@ include view =「MirrorPage」%>中刪除文本
- 11. 刪除<腳本類型=「JavaScript的」> ABCD</script>標籤
- 12. 從rss(xml)源刪除CDATA標記
- 13. 在DataPower中從XML中刪除CDATA
- 14. 如何從響應中刪除「<?xml ...>」標記?
- 15. 如何使用時刪除HTML標籤的<bean:寫/>
- 16. 如何從HTML表格中刪除<tbody>標籤?
- 17. 如何使用java從SOAP響應中刪除(<)和([CDATA [[))?
- 18. 如何使用as3刪除xml標籤
- 19. Gmail刪除標籤例如<audio>
- 20. 在TestLink XML文件中從CDATA中刪除HTML標記
- 21. 如何刪除<i>標籤使用javascript
- 22. 如何使用JSoup刪除尾隨<br />標籤?
- 23. 爲什麼這個裏面的XML標籤數據<![CDATA[]]>
- 24. 如何刪除文本內容中的固定XML標籤?
- 25. PHP - 從字符串中刪除HTML標籤除了<img>
- 26. 刪除<a>標籤在othre標籤的日中間
- 27. 如何刪除標籤<input type =「file」>中的屬性「
- 28. Python:從文本中刪除<Table></Table>之間的文本
- 29. WebService從我的XmlDocument中刪除<xml>標記
- 30. 刪除<dict> ...</dict>從*的.plist文件iPhone腳本
你可能會想一個#inner_text.strip擺脫(幾乎可以肯定)多餘的空白。 – Simon 2013-01-28 16:07:57