2011-04-25 84 views
1

我在HTML代碼中有多個p標籤。C#中的正則表達式分組#

<p class=MsoNormal><b style='mso-bidi-font-weight:normal'><span 
style='font-size:7.0pt'>PA<span style='mso-spacerun:yes'> </span>ARALIĞI</span></b><span 
style='font-size:7.0pt'> [İng. <b style='mso-bidi-font-weight:normal'>PA 
interval</b>]. (<i style='mso-bidi-font-style:normal'>Kardiyoloji</i>). 
Atriyum’un P dalgasının başlangıcını ayıran mesafe. İntraatriyal ya da 
sino-nodal iletim süresinin (35-45 milisaniye) ölçümünü verir. Uzaması ileti 
bozukluğunun göstergesidir. <o:p></o:p></span></p> 

<p class=MsoNormal><b style='mso-bidi-font-weight:normal'><span 
style='font-size:7.0pt'>PA<span style='mso-spacerun:yes'> </span>ARALIĞI</span></b>  <span 
style='font-size:7.0pt'> [İng. <b style='mso-bidi-font-weight:normal'>PA 
interval</b>]. (<i style='mso-bidi-font-style:normal'>Kardiyoloji</i>). 
Atriyum’un P dalgasının başlangıcını ayıran mesafe. İntraatriyal ya da 
sino-nodal iletim süresinin (35-45 milisaniye) ölçümünü verir. Uzaması ileti 
bozukluğunun göstergesidir. <o:p></o:p></span></p> 

我怎樣才能得到他們在列表中作爲不同的索引。我需要將每個p作爲列表中的成員。我的代碼是:

Regex Rx = new Regex(@"<p(.*)>(.*)<\/p>",RegexOptions.Multiline); 
    MatchCollection mc = Rx.Matches(yazi); 

感謝

回答

2

是一個非常糟糕的主意用正則表達式解析HTML。 HTML的語法太複雜。

改爲使用HTML解析器:Looking for C# HTML parser