2010-07-05 108 views
0

我正在處理一個小項目,並遇到一個小問題。我所需的腳本需要獲取網站並在源HTML文件中查找特定值。值是這樣的:幫助HTML解析並將請求發送到Web服務器

id='elementID'> 

<fieldset> 
    <input type='hidden' name='hash' value='e46c945fe32a3' /> 
</fieldset> 

現在,我一直在嘗試使用ElementTree庫來解析HTML文檔發現價值,但我一直不是很成功。我對Python非常陌生,所以我不知道下一步該怎麼做。

我一直在使用httplib和urllib/urllib2連接到網站並POST我的登錄細節和類似的東西,但我真的不知道如何從頁面獲取該值。我想我可以發送一個名爲'哈希'的輸入請求,但我不知道該怎麼做。

回答

2

您可能會考慮查看BeautifulSoup庫 - 它的設計很快且易於使用。

+0

謝謝,這可能正是我需要的,但我不知道如何真正把它使用。你能給我一些關於如何實際使用BeautifulSoup來搜索HTML文檔的提示嗎? – 2010-07-05 00:34:03

+0

查看文檔的快速入門部分:http://www.crummy.com/software/BeautifulSoup/documentation.html#Quick Start – Amber 2010-07-05 00:46:09

相關問題