2012-03-29 149 views
-1

你如何使用Python和的HTMLParser模塊提取錨標記屬性(即href的值)。錨標記HREF提取

例如我有HTML代碼,我需要解析它並使用文本找到錨標記的值。

+1

你嘗試過什麼嗎?你的代碼在哪裏失敗?的 – hochl 2012-03-29 10:56:13

+1

可能重複[我怎樣才能從HTML代碼的href鏈接](http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code) – Marcin 2012-03-29 12:24:31

回答

1

This question Stack Overflow上展示瞭如何提取與HTMLParser的鏈接。

但更方便的方法是使用BeautifulSoupthis question顯示了一種方法來做到這一點。如果您希望更高級地抓取HTML內容,請查看BeautifulSoup的文檔。