我的網站,如http://site.com
如何查找並從網頁中提取鏈接?
我想取主頁,只提取匹配的正則表達式的鏈接,例如.*somepage.*
的HTML代碼鏈接的格式可以是:
<a href="http://site.com/my-somepage">url</a>
<a href="/my-somepage.html">url</a>
<a href="my-somepage.htm">url</a>
我需要輸出格式:
http://site.com/my-somepage
http://site.com/my-somepage.html
http://site.com/my-somepage.htm
輸出url必須包含域名總是。
什麼是快速Python解決方案?
那你試試,沒有工作? StackOverflow不是一種代碼編寫服務,但如果您首先解決問題,我們會爲您提供幫助。 – 2013-03-19 04:15:54
查看一個HTML解析模塊,比如BeautifulSoup。 (會發佈一個鏈接,但我在我的手機上,對不起) – TerryA 2013-03-19 04:24:20