我輸入的是:
<span question_number="18"> blah blah blah 1</span><span question_number="19"> blah blah blah 2</span>
尋找更好的正則表達式的解決方案
,我想我的正則表達式來此 <span question_number="somenumber">xxxx</span>
模式
匹配和所需的輸出1.somenumber 2.xxxx
我寫的一個天真的解決方案,可以覆蓋
<span question_number="18"> blah blah blah 1</span>
<span question_number="19"> blah blah blah 2</span>
通知:他們在不同的林ES
輸出爲:18
,blah blah blah 1
和19
,blah blah blah 2
但是當輸入爲<span question_number="18"> blah blah blah 1</span><span question_number="19"> blah blah blah 2</span>
這是在同一行
我的輸出是18
,blah blah blah 1</span><span question_number="19"> blah blah blah 2
我怎麼會繞過這個問題?
更新: 正則表達式:/\<span question_number=(?:\")*(\d*)(?:\")*>(.*)<\/span>/ig
testinput:
情形1 - >的兩行代碼
<span question_number="54">often graces doorways tied into ropes called</span>
<span question_number="54">often graces doorways tied into ropes called <i>ristras</i>.</span>
情形2 - 的代碼>一行
<span question_number="54">often graces doorways tied into ropes called</span><span question_number="54">often graces doorways tied into ropes called <i>ristras</i>.</span>
UPDATE2:
這不是一個dom,它是隻是我想要處理的純文本。
Update3: 所以我關於正則表達式的問題解決了,現在我有一個關於比較正則表達式或dom操作之間的速度問題?怎麼可能實施這樣的測試?
爲什麼你用正則表達式匹配HTML? http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not – epascarello
我催促你閱讀http://stackoverflow.com/questions/1732348/regex-match-open -tags-except-xhtml-self-contained-tags/1732454#1732454之前爲時已晚 –
請問有人可以編輯這個嗎? – evolutionxbox