2012-02-10 67 views
2

找到一個(我不得不面對的IE6做這種可怕的供應商網站)亂七八糟

我試圖找到一種方法,挖掘出一個鏈接。

ex:<a href="/part/id.aspx?v=449530">,無論它出現在何處。

基本上,第一個<a>開始/part/id.aspx?v=

並提取'449530'。沒有可用的ID,類或任何東西,整個事物不是有效的HTML,XHTML或XML。

一直跟着http://simplehtmldom.sourceforge.net沒多大用處。

任何幫助都非常有幫助。

+0

這個線程可能會有所幫助:http://stackoverflow.com/questions/303956/jquery-select-a-which-href-contains-一些字符串 – 2012-02-10 22:14:48

回答

1
preg_match("(/part/id\.aspx\?v=([0-9]+))",$data,$m); 
$id = $m[1]; 

這應該做到這一點。

0

嘗試使用正則表達式來查找元素:

href=\"\/part-id\.aspx\?v=(?<id>\d+)\"