我想找到一對<一個>標籤鏈接到指定網站發現錨文本的時候有標籤有
下面的文字是我使用查找內容重新串:
r'''(<a([^<>]*)href=("|')(http://)?(www\.)?%s([^'"]*)("|')([^<>]*)>([^<]*))</a>''' % our_url
其結果將是這樣的:
r'''(<a([^<>]*)href=("|')(http://)?(www\.)?stackoverflow.com([^'"]*)("|')([^<>]*)>([^<]*))</a>'''
這是偉大的大多數鏈接,但它與在它的標籤的鏈接錯誤。
([^<]*))</a>'''
到:我試圖改變正則表達式的最後部分
(.*))</a>'''
但是,剛剛得到的鏈接,這是我不希望以後的頁面上的所有內容。我有什麼建議可以解決這個問題嗎?
非常感謝您的幫助:) – Teifion 2009-03-02 17:45:18