2013-05-05 59 views
0

我有這個link我需要在該表上使用xPath和domDocument進行一些抓取。我需要得到chemmical,鏈接和部分的名稱。我已經嘗試在chrome中使用xPath helper,但沒有運氣,它沒有做出正確的查詢。任何想法我做錯了什麼?我使用以下查詢:// table/tbody/tr/td/axPath,DomDocument,Scraping表

回答

1

我可以通過以下方式在Chrome中使用xPath助手來獲取您要查找的數據(這些行是鍵入到瀏覽器控制檯):

所有化學品/第一種化學:

> allChemicals = $x("descendant::tr/td[(position() =1)]") 
> firstChemical = allChemicals[0].innerText 

所有鏈接/第一環節:

> allLinks = $x("descendant::tr/td[(position() =1)]/a") 
> firstLink = allLinks[0].href 

所有部件/第一部分:

> allParts = $x("descendant::tr/td[(position() =2)]") 
> firstPart = allParts[0].innerText 

希望有所幫助。

+0

yes你的xPath工程很棒,發現有一個xPath的控制檯,你可以在這裏建立查詢..有趣的是:-d但即使它們工作似乎當我在php中使用相同的東西不會選擇相同的方式奇怪。 – Bogdan 2013-05-06 10:39:19