我真的無法弄清楚如何做到這一點,我可以做相當簡單的正則表達式,但更復雜的表達式真的讓我感到困惑。什麼是REGEX在C#中的html文檔中匹配這種模式?
在特定HTML文檔中出現以下內容:
<span id="label">
<span>
<a href="http://variableLink">Joe Bloggs</a>
now using
</span>
<span>
'
<a href="/variableLink/">Important Data</a>
'
</span>
<span>
on
<a href="/variableLink">Important data 2</a>
</span>
</span>
我需要提取兩個「重要數據」點,並可能花好幾個小時的工作了正則表達式來做到這一點(我使用的.NET。 C#3.5中的正則表達式庫)
我幫不了你,我很害怕,但如果你需要在.NET正則表達式的幫助,儘量快報http://www.ultrapico.com/Expresso.htm它是免費的,真的很不錯的測試正則表達式。 – 2009-05-27 11:24:20
您必須使用regexp,還是可以使用HTML解析庫,如HTML Agility Pack(http://www.codeplex.com/htmlagilitypack)? – 2009-05-27 11:25:43
我可以使用任何東西,不一定是正則表達式。 – 2009-05-27 11:37:42