2012-08-06 139 views
0

我想捕捉一些HTML標籤的價值。 可能是這樣的:結合正則表達式解析

value='3242312-3245-3245,234:3245:324,asdf asdf,asdf asd'> 

或像這樣:

value=358 > 

,也許這樣的:

value=83 selected='selected'> 

我想:

Pattern.compile("value=[[\'(.+)\'][(0-9)\\s]]") 

,但沒有成功...

任何想法應該使用什麼樣的模式?

+3

爲什麼不您使用HTML解析器來解析HTML?這就是他們的目標。 – Blender 2012-08-06 23:26:26

+0

value屬性的possbbile值是什麼? – Razvan 2012-08-06 23:26:35

+3

定義「不成功」。你在做其他解析嗎?如果是這樣,http://stackoverflow.com/a/1732454/438992。 – 2012-08-06 23:31:23

回答

0

這種表達應該工作:

(?<field>\w+)=(('(?<value>[^']*)')|(?<value>\S+)) 

您可以使用相同的表達W/O組的名稱(因爲該工具不支持)測試here

(\w+)=(('([^']*)')|(\S+))