3.0.5之前,BeautifulSoup用於將文本區域的內容作爲HTML處理。它現在將其視爲文本。我正在解析的文檔在textarea標籤內部有HTML,我正在嘗試處理它。 我已經試過: for textarea in soup.findAll('textarea'):
contents = BeautifulSoup.BeautifulSoup(textarea.contents)
這是我的例子: 我有機管局網站,其中包含以下內容: <body>
Jim Nebraska zipcode 65437
Tony lives in California his zipcode is 98708
</body>
我想是能夠搜索郵政編碼的網頁上 <body>
Jim Nebraska zipcode <a href="/65437.htm">65437</a>
Tony
我解析在PHP中使用DOMDocument類HTML文檔,我希望得到一個div元素的nodeValue,但它給我空, <div id="summary">
Hi, my name is <span>ABC</span>
<br/>
address is here at stackoverflow...
<span>....
....
</div>