我正在製作網絡刮板,這讓我瘋狂!段落文本的Dom元素
我需要得到一段文字。簡單吧?!這是代碼。
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//div");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('class');
echo "<br />Found it: $url";
}
它完美地工作,抓住頁面上每個div的類並回應出來。但我真正需要做的是找到所有<p>
標籤 - 頁面上的每一個標籤 - 並回顯<p>
之間的文本!我有一種感覺很簡單,但我無法弄清楚。
編輯
時採取了以下內容:
$doc = new DOMDocument();
@$doc->loadHTML($html);
$node = $doc->getElementsByTagName('p')->item(3);
echo $node->textContent."\n";
你真正想要的是getElementsByName,然後一旦你有節點,你的textContent爲勝。謝謝你們!不知道它是否會適用於其他人的情況,但它確實是我的。 = o
那麼你肯定我指出了正確的方向!非常感謝!我已經更新了示例。 – 2010-12-19 16:34:08